Когда я недавно исследовал оптимизацию производительности, я увидел документ в пакете времени выполнения golang.HACKING.mdМне он показался довольно интересным, после прочтения я почувствовал, что стал лучше понимать рантайм, поэтому задумался о его переводе.

Содержание этой главы будет иметь определенную глубину и потребует от читателей определенной подготовки, поскольку из-за ограничений по объему здесь невозможно полностью раскрыть каждую деталь.

Это документ, предназначенный для целевой аудитории разработчиков, поэтому у нас есть много контента для общего использования.

Этот документ будет часто редактироваться, и со временем текущее содержание может устареть. Этот документ предназначен для иллюстрации кода среды выполнения и написания кода, который обычно работает по-разному, поэтому вместо того, чтобы сосредоточиться на некоторых деталях реализации некоторых общих концепций.

структура планировщика

Планировщик управляет тремя типами, важными во время выполнения:G,MиP. Даже если вы не пишете код, связанный с планировщиком, вы должны понимать эти концепции.

Г, М и П

ОдинGПросто горутин, через тип во время выполненияgПредставлять. Когда горутина завершает работу,gОбъект будет размещен в свободномgПул объектов для последующего использования goroutine (Примечание переводчика: уменьшите накладные расходы на выделение памяти).

ОдинMЭто системный поток, который может выполнять пользовательский код запуска, код времени выполнения, системный вызов или ожидание бездействия. типы проходов во время выполненияmПредставлять. В то же время может быть любое количествоM, так как любое количествоMМожет заблокировать системный вызов. (Примечание переводчика: когдаMПри выполнении блокирующего системного вызоваMиPотвязать и создать новыйMвыполнитьPдругой наG. )

последнийPПредставляет ресурсы, необходимые для выполнения пользовательского кода перехода, такие как состояние планировщика, состояние распределителя памяти и т. д. типы проходов во время выполненияpПредставлять.PКоличество в точности (в точности) равноGOMAXPROCS. ОдинPЕго можно понимать как ЦП в планировщике операционной системы,pТип можно понять как состояние каждого ЦП. Здесь вы можете поставить некоторых, которые необходимо эффективно поделиться, но не для каждогоP(заP) или каждыйM(заM) состояние (Примечание переводчика: это означает, что вы можете поставить некоторыеPобщие данные уровня).

Задача планировщика состоит в том, чтобы поставитьG(код для выполнения), aM(где выполняется код) иP(разрешения и ресурсы, необходимые для выполнения кода) объединены. когдаMПри прекращении выполнения пользовательского кода (например, при вводе блокирующего системного вызова) необходимо поместить егоPвернуться на свободуPВ пуле; чтобы продолжить выполнение пользовательского кода перехода (например, при выходе из блокирующего системного вызова), ему необходимо начать с незанятогоPполучить один из бассейнаP.

всеg,mиpОбъекты размещаются в куче и никогда не освобождаются, поэтому их использование памяти стабильно. Благодаря этому среда выполнения может избежать барьеров записи в реализации планировщика.

Пользовательский стек и системный стек

каждый не мертвыйGТам будет связанный пользовательский стек, и код пользователя выполняется в этом стеке пользователя. Стеки пользователя начинаются маленькие (скажем, 2К) и растут или усаживаются динамически.

КаждыйMиметь связанный системный стек (также известный какg0стек, потому что этот стек также проходит черезgреализован); если на платформе Unix, есть такжеsignalстек (также известный какgsignalкуча). системный стек иsignalСтек не может расти, но он достаточно велик для запуска любой среды выполнения и кода cgo (8 КБ в чистом двоичном коде go, выделенных системой в случае cgo).

код времени выполнения часто вызываетсяsystemstack,mcallилиasmcgocallВременно переключитесь на системный стек для выполнения некоторых специальных задач, таких как те, которые не могут быть вытеснены, те, которые не должны расширять пользовательский стек, и те, которые переключают пользовательские горутины. Код, работающий в системном стеке, неявно не может быть вытеснен, и сборщик мусора не сканирует системный стек. когдаMПри работе в системном стеке текущий пользовательский стек не выполняется.

`getg()`и`getg().m.curg`

Если вы хотите получить текущий пользовательg, Необходимо использоватьgetg().m.curg.

getg()Хотя он вернет текущийg, но когда системный стек илиsignalПри выполнении в стеке он вернет текущийMизg0илиgsignal, скорее всего, не то, что вы хотите.

Если вы хотите определить, выполняется ли он в данный момент в системном стеке или в пользовательском стеке, вы можете использоватьgetg() == getg().m.curg.

Обработка ошибок и отчетность

В пользовательском коде есть несколько разумно исправимых ошибок, которые можно использовать как обычно.panic, но в некоторых случаяхpanicЭто может привести к немедленным фатальным ошибкам, таким как вызов или выполнение в системном стеке.mallocgcВремя.

Большинство ошибок времени выполнения неисправимы, и для этих неисправимых ошибок вы должны использоватьthrow,throwраспечатаетtracebackи немедленно завершить процесс.throwДолжна быть передана строковая константа, чтобы в этом случае также не нужно было выделять память для строки. По договоренности дополнительная информация должна бытьthrowиспользовался раньшеprintилиprintlnраспечатаны и должны начинаться сruntime.начало.

Чтобы выполнить отладку ошибок во время выполнения, очень практичным методом является установкаGOTRACEBACK=systemилиGOTRACEBACK=crash.

Синхронизировать

В среде выполнения существуют различные механизмы синхронизации, которые отличаются не только семантически, но и взаимодействием между планировщиком go и планировщиком операционной системы.

Самый простойmutex,можно использоватьlockиunlockработать. Этот метод в основном используется для защиты некоторых общих данных в краткосрочной перспективе (и низкой производительности в долгосрочной перспективе). существуетmutexБлокировка вверх будет напрямую блокировать весьM, без взаимодействия с планировщиком go. Поэтому на самом низком уровне во время выполнения используйтеmutexбезопасен, потому что он также блокирует связанныеGиPперенесено(Mзаблокированы и не могут выполнять планирование).rwmutexТоже похоже.

Если вы хотите сделать однократное уведомление, вы можете использоватьnote.noteпри условииnotesleepиnotewakeup. в отличие от традиционного UNIXsleep/wakeup,noteне зависит от расы, поэтому, еслиnotewakeupслучилось, тоnotesleepвернется немедленно.noteможно использовать послеnoteclearдля сброса, но будьте осторожныnoteclearиnotesleep,notewakeupСоревнование не может состояться. похожийmutex, заблокирован вnoteзаблокирует весьM. Тем не мение,noteобеспечивает разные способы позвонитьsleep:notesleepпредотвратит связанныеGиPбыть перенесенным;notetsleepgведет себя как блокирующий системный вызов, позволяяPповторно используется для запуска другогоG. Тем не менее, это все еще больше, чем прямая обструкцияGбыть неэффективным, потому что это потребляетM.

Если вам нужно напрямую взаимодействовать с планировщиком go, вы можете использоватьgoparkиgoready.goparkПриостановить текущую горутину - превратить ее вwaitingсостояние и удаляется из очереди выполнения планировщика, а затем назначает другую горутину на текущуюMилиP.goreadyВозобновить приостановленную горутину, чтобыrunnableсостояние и поставить его в очередь выполнения.

Он сведен в следующую таблицу:

	Blocks
Interface	G	M	P
(rw)mutex	Y	Y	Y
note	Y	Y	Y/N
park	Y	N	N

атомарность

использование во время выполненияruntime/internal/atomicНекоторые атомарные операции в себе есть. Это иsync/atomicсоответствуют, за исключением того, что имена методов несколько отличаются по историческим причинам, и есть некоторые дополнительные методы, требуемые средой выполнения.

В общем, мы очень осторожно относимся к использованию atomic во время выполнения и максимально избегаем ненужных атомарных операций. Если доступ к переменной уже защищен другим механизмом синхронизации, защищенный доступ обычно не обязательно должен быть атомарным. Делается это в основном по следующим причинам:

Разумное использование неатомарных и атомарных операций делает код более удобочитаемым и удобочитаемым.Атомарная операция над одной переменной означает, что могут быть параллельные операции над этой переменной в другом месте.
Неатомарные операции позволяют автоматически определять гонки. Сама среда выполнения в настоящее время не имеет детектора гонок, но может появиться в будущем. Атомарные операции заставят детектор гонки игнорировать проверку, но неатомарные операции могут пройти детектор гонки, чтобы проверить вашу гипотезу (не произойдет ли гонка).
Неатомарные операции могут повысить производительность.

Конечно, все неатомарные операции над общей переменной должны документировать, как операция защищена.

Некоторые из наиболее распространенных сценариев смешивания атомарных и неатомарных операций:

Большинство операций — это чтение, а запись — это переменные, защищенные блокировкой. В рамках защиты от блокировок операции чтения не обязательно являются атомарными, но операции записи должны быть атомарными. Операции чтения должны быть атомарными за пределами области, защищенной блокировкой.
Операции чтения выполняются только во время STW, записи во время STW не производятся. Тогда в это время операция чтения не обязательно должна быть атомарной.

Было сказано, что,Go Memory ModelСовет, данный по-прежнему в силеDon't be [too] clever. Производительность среды выполнения важна, но надежность еще важнее.

Неуправляемая память

При нормальных обстоятельствах времени выполнение пытается использовать общий подход к памяти приложения (память кучи, управление GC), но должен применить некоторую иностранную память кучи (неуправляемая память) не управляется GC в некоторых случаях выполнения выполнения. Это необходимо, потому что можно снять память, - это сам менеджер памяти, или вызывающий абонент не имеетP(Примечание переводчика: например, до инициализации планировщика он не существуетPиз).

Есть три способа запросить память вне кучи:

sysAllocЧтобы получить память непосредственно из операционной системы, запрашиваемая память должна быть целым числом, кратным длине системной таблицы страниц. в состоянии пройтиsysFreeосвободить.
persistentallocОбъединение нескольких небольших запросов памяти в один большойsysAllocЧтобы избежать фрагментации памяти (фрагментации). Однако, как следует из названия, кpersistentallocПриложение памяти не может быть освобождено.
fixallocЯвляетсяSLABРаспределитель памяти стиля, который выделяет память фиксированного размера. пройти черезfixallocВыделенные объекты могут быть освобождены, но память может использоваться только тем же самымfixallocБассейн используется повторно. такfixallocПодходит для объектов одного типа.

Обычно он используется для выделения типа памяти с использованием трех вышеуказанных методов и должен быть помечен как//go:notinheap(увидеть ниже).

Объекты, выделенные в памяти вне кучине следуетСодержит объекты-указатели в куче, если не соблюдаются следующие правила:

Все указатели на кучу из памяти вне кучи должны быть корнями сборки мусора. То есть все указатели должны быть доступны через глобальную переменную или явно с помощьюruntime.markrootпомечать.
Если память используется повторно, указатели в куче должны быть инициализированы нулями (см. ниже), прежде чем они будут помечены как корни GC и станут видимыми для GC. В противном случае сборщик мусора может обнаружить устаревшие указатели кучи. увидеть нижеZero-initialization versus zeroing.

Zero-initialization versus zeroing

Существует два типа нулевых инициализированных при выполнении во время выполнения, в зависимости от того, была ли память инициализирована на безопасное состояние типа.

Если память не находится в типобезопасном состоянии, это означает, что она может содержать некоторые мусорные значения, потому что она только что была выделена и инициализирована в первый раз (Изучающие язык C должны быть в состоянии понять, что это значит), тогда этот кусок памяти должен быть использованmemclrNoHeapPointersпровестиzero-initializedИли пишите без указателей. Это не вызывает барьер записи (Примечание переводчика: барьер записи — это концепция в GC).

память может бытьtypedmemclrилиmemclrHasPointersдля записи нулевого значения, установленного в безопасное для типов состояние. Это вызывает барьер записи.

Директивы компилятора только во время выполнения (директивы компилятора)

Кромеgo doc compileОтметил внутри//go:В дополнение к директивам компиляции компилятор поддерживает некоторые дополнительные директивы в пакете среды выполнения.

go:systemstack

go:systemstackУказывает, что функция должна выполняться в системном стеке, что динамически проверяется с помощью специального пролога функции.

go:nowritebarrier

go:nowritebarrierСкажите компилятору вызвать ошибку, если следующая функция содержит барьер записи (это не предотвращает создание барьера записи, это просто гипотеза).

В общем, вы должны использоватьgo:nowritebarrierrec.go:nowritebarrierИспользуйте тогда и только тогда, когда "лучше не" писать барьеры, но это не обязательно для корректности.

Перейти: NOWRITEBARRIERREC и Перейти: YESWRITEBARRIERREC

go:nowritebarrierrecсообщает компилятору, если следующая функция и функции, которые она вызывает (рекурсивно), пока неgo:yeswritebarrierrecДо сих пор, если включен барьер записи, срабатывает ошибка.

Логически компилятор будет генерировать граф вызовов из каждогоgo:nowritebarrierrecфункция запускается до тех пор, пока не встретитgo:yeswritebarrierrecфункция (или конец). Если одна из обнаруженных функций содержит барьер записи, генерируется ошибка.

go:nowritebarrierrecВ основном используется для реализации самого барьера записи, чтобы избежать бесконечного цикла.

Обе эти прагмы используются в планировщике. Барьеры записи требуют активногоP(getg().m.p != nil), однако код, связанный с планировщиком, может не иметь активногоPв случае операции. при этих обстоятельствах,go:nowritebarrierrecбудет использоваться в некоторых выпускахPили нетPзапустить функцию,go:yeswritebarrierrecБудет повторно приобретенPна коде. Поскольку это комментарии функционального уровня, отпуститеPи получитьPКод должен быть разделен на две функции.

go:notinheap

go:notinheapПрименяется к объявлениям типов, указывая, что тип не должен выделяться в куче сборщика мусора. В частности, указатели на этот тип всегда должны бытьruntime.inheapПотерпел неудачу в суде. Этот тип может использоваться для глобальных переменных, переменных в стеке или объектов в памяти вне кучи (например, черезsysAlloc,persistentalloc,fixallocили другие управляемые вручнуюspan进行分配）。 специальный:

new(T),make([]T),append([]T, ...)и неявное дляTВыделения в куче не разрешены (хотя неявные выделения никогда не разрешены во время выполнения).
указатель на обычный тип (кромеunsafe.Pointer) Не может быть преобразован в указывающийgo:notinheapуказатели типов, даже если они имеют один и тот же базовый тип.
любой содержитgo:notinheapТип самого типа такжеgo:notinheapиз. Если структуры и массивы содержатgo:notinheapэлементы, то они самиgo:notinheapтип. карта и канал не разрешеныgo:notinheapтип. Сделать вещи более понятными, любой неявнымgo:notinheapтипы должны быть явно отмеченыgo:notinheap.
направлениеgo:notinheapБарьеры записи для указателей типа можно игнорировать.

Последняя точкаgo:notinheapТипа реальная выгода. Среда выполнения использует это в базовой структуре, чтобы избежать барьеров памяти для планировщика и распределителя памяти, чтобы избежать незаконных проверок или просто повысить производительность. Этот подход достаточно безопасен и не снижает удобочитаемости во время выполнения.

Автор: Чистый белый
Ссылка на эту статью:Woohoo.чистый белый.IO/2020/10/14/…
Уведомление об авторских правах. Все статьи в этом блоге распространяются по лицензии BY-NC-SA, если не указано иное. Пожалуйста, укажите источник!