Какие? Интервьюер спросил меня о сборщике мусора G1?

Java задняя часть JVM
Какие? Интервьюер спросил меня о сборщике мусора G1?

интервьюер:Почему бы в этот раз не поговорить о сборщике мусора G1?

Кандидат: Мммм, хорошо

Кандидат: В прошлый раз, когда я вспомнил, недостатки сборщика мусора CMS: он будет генерировать фрагментацию памяти && нужно резервировать место

Кандидат: При решении этих двух проблем очень вероятно, что время паузы будет слишком длинным, говоря прямо, время паузы CMS "непредсказуемо".

Кандидат: а G1 можно понимать как "апгрейд" на сборщике мусора CMS

Кандидат: Сборщик мусора G1 может установить время, на которое вы хотите, чтобы Stop The Word приостановился, и сборщик мусора G1 попытается удовлетворить вас в соответствии с этим временем.

Кандидат: Когда я ранее представил кучу JVM, я нарисовал картинку. Распределение памяти в куче изолировано «физическим» пространством.

Кандидат: В мире сборщика мусора G1 разделение кучи уже не в "физической" форме, а в "логической" форме

Кандидат: Тем не менее, концепция «поколений», как упоминалось ранее, все еще работает в мире сборщиков мусора G1.

Кандидат: Например, новые объекты вообще будут выделены в зону Эдема, а если объекты нового поколения Minor GC прошли по умолчанию 15 раз, если они еще выживут, то будут переданы старому поколению и т.д. ..

Кандидат: Позвольте мне нарисовать "кучное" пространственное распределение мира сборщика мусора G1.

Кандидат: Из рисунка видно, что куча разделена на несколько равных областей, и каждая область в G1 называется регионом.

Кандидат: Мне не нужно больше говорить о старости, новом поколении и Выжившем, верно? Правила такие же, как у CMS

Кандидат: В G1 также есть область Humongous (большие объекты), которая фактически используется для хранения очень больших объектов (более половины памяти региона).

Кандидат: Как только обнаруживается, что нет ссылки на большой объект, его можно переработать прямо в Minor GC молодого поколения.

интервьюер:В порядке…

Кандидат: На самом деле, если немного подумать, то можно понять, почему «пространство кучи» должно быть «подразделено» на множество небольших областей.

Кандидат: Как и предыдущие сборщики мусора, куча "физически" разделена

Кандидат: Если объем кучи (памяти) велик, каждый раз при выполнении «сборки мусора» необходимо очищать большую область, а время сбора нелегко контролировать.

Кандидат: После разделения на несколько небольших участков легко контролировать «время сбора» этих «небольших участков» для переработки.

интервьюер:В порядке…

интервьюер:Тогда я, наверное, понимаю. Тогда почему бы вам не рассказать о процессе GC?

Кандидат: Ну, в сборщике G1 его в основном можно разделить на Minor GC (Young GC) и Mixed GC, а в некоторых особых случаях может встречаться Full GC

Кандидат: Тогда я просто скажу сначала Minor GC?

интервьюер: Ну что, начнем

Кандидат: Minor GC G1 фактически запускает то же время, что и сборщик мусора, упомянутый ранее.

Кандидат: Minor GC будет запущен, когда область Эдема будет заполнена. Minor GC также бывает Stop The World

Кандидат: Следует добавить, что: в мире G1 пространство кучи, занимаемое новым поколением и старым поколением, не так фиксировано (будет динамически корректироваться в соответствии с "максимальным временем паузы")

Кандидат: Приятно знать, что эта штука предоставит нам параметры для настройки.

Кандидат: Таким образом, динамическое изменение количества молодых регионов может «контролировать» накладные расходы Minor GC.

интервьюер:А как насчет Minor GC и процесса его переработки? Можете ли вы добавить немного больше деталей?

Кандидат: Minor GC, я думаю, можно просто разделить на три шага: корневое сканирование, обновление && процесс RSet, копирование объекта

Кандидат: Первый шаг должен быть хорошо понят, потому что он похож на предыдущую CMS и может быть понят как процесс начальной разметки

Кандидат: Второй шаг включает понятие «Rset».

интервьюер:В порядке…

Кандидат: Из прошлого раза, когда мы говорили о процессе рециркуляции CMS, мы также говорили о Minor GC, который использует «таблицу тележки», чтобы избежать полного сканирования таблицы объектов в старости.

Кандидат: Поскольку Minor GC повторно использует объекты в молодом поколении, но если в старом поколении есть объекты, которые ссылаются на молодое поколение, эти объекты, на которые ссылается старое поколение, не могут быть повторно использованы.

Кандидат: Та же проблема существует и в G1 (все-таки минорный GC). CMS - это карточная таблица, а хранилище G1 для решения проблемы "ссылки между поколениями" вообще называется RSet

Кандидат: просто помните, что RSet хранится в каждом регионе, и в нем записано, что «другие регионы относятся к объектным отношениям текущего региона».

Кандидат: Для региона молодого поколения его RSet сохраняет только референсы из старого поколения (т.к. нет необходимости хранить молодое поколение, нужно самому делать Minor GC)

Кандидат: Для Региона старого поколения его RSet сохранит только ссылку на него в старом поколении (в сборщике мусора G1, перед тем, как будет переработано старое поколение, сначала будет переработано молодое поколение, поэтому нет необходимости спасите молодое поколение.цитата)

интервьюер:В порядке…

Кандидат: После прочтения концепции RSet во втором шаге должно быть легко понять, верно?

Кандидат: Это не что иное, как обработка информации RSet и сканирование, а также добавление соответствующих ссылок объектов старого поколения на объекты молодого поколения в корни GC, чтобы избежать повторного использования.

Кандидат: Третий шаг вполне понятен: храните уцелевшие объекты после сканирования в "пустой области Выжившего" или "Старости", а остальные области Эдема зачищайте.

Кандидат: Здесь следует упомянуть, что в G1 есть еще один термин, называемый CSet.

Кандидат: его полное имя — набор сбора, который сохраняет регион, который «будет выполнять сборку мусора» в сборщике мусора. Все выжившие объекты в CSet будут перенесены в другие доступные регионы.

Кандидат: В конце Minor GC будут обработаны мягкие ссылки, слабые ссылки, JNI Weak и другие ссылки, и коллекция завершится.

интервьюер: ну я понял, это не сложно

интервьюер:Я помню, вы упоминали смешанный GC ранее, почему бы вам не поговорить об этом процессе?

Кандидат: Без проблем.

Кандидат: смешанный сборщик мусора будет запущен, когда уровень занятости пространства кучи достигнет определенного порога (по умолчанию 45%, определяется параметрами).

Кандидат: смешанный GC опирается на данные региона после статистики «Global Concurrent Mark».

Кандидат: «Глобальная параллельная маркировка» — ее процесс очень похож на CMS, этапы, вероятно, следующие: начальная маркировка (STW), параллельная маркировка, окончательная маркировка (STW) и очистка (STW).

интервьюер: Это действительно похоже.Можете ли вы продолжить разговор о конкретном процессе?

Кандидат: Ну, еще хочу пояснить: Смешанный GC точно будет перерабатывать молодое поколение, а некоторые регионы старого поколения будет собирать на переработку, так что это "смешанное" GC.

Кандидат: Первый - "Начальная маркировка". Этот процесс "разделяет" Остановить Мир Minor GC (Minor GC должен происходить в Mixed GC) и повторно использует операцию "Scan GC Roots".

Кандидат: В ходе этого процесса и старое поколение, и новое поколение будут сметать

Кандидат: В целом процесс "начальной разметки" относительно быстрый, ведь ретроспективного обхода нет

интервьюер:…

Кандидат: Далее идет "маркировка параллелизма", этот этап не будет Stop The World

Кандидат: Поток GC выполняется вместе с потоком пользователя, и поток GC отвечает за сбор информации об уцелевших объектах каждого региона.

Кандидат: Проследите путь от GC Roots, чтобы найти объекты, которые сохранились во всей куче, что требует много времени.

интервьюер:В порядке…

Кандидат: Следующим шагом является этап «перемаркировки», который аналогичен CMS, помечая те объекты, которые изменились на этапе «одновременной маркировки».

Кандидат: Это не просто?

интервьюер: подождите минуту

интервьюер:CMS должна повторно сканировать все стеки потоков и все молодое поколение от имени пользователя root на этапе «замечания».

интервьюер:Насколько я знаю, G1 вроде бы не такой, понимаете?

Кандидат: Ну, G1 действительно не такой.Для решения проблемы референсных изменений, вызванных фазой "конкурентной маркировки" в G1, используется алгоритм SATB.

Кандидат: Можно просто понять так: при запуске GC он делает "снимок" для уцелевших объектов

Кандидат: На «этапе параллелизма» записывайте старое опорное значение каждый раз, когда изменяется эталонное отношение.

Кандидат: Затем на этапе «перемаркировки» сканируются только «измененные» ссылки блока, чтобы увидеть, есть ли еще какие-либо объекты и добавлены в «GC Roots».

Кандидат: Однако есть небольшая проблема с алгоритмом SATB, а именно: если G1 считает, что он жив в начале, он не будет переработан в этом GC, даже если объект мог стать в "конкурентной фазе". .

Кандидат: Поэтому у G1 тоже может быть проблема "плавающего мусора"

Кандидат: Но в целом для G1 это не большая проблема (ведь речь не о том, чтобы избавиться от всего хлама сразу, а о времени Stop The World)

интервьюер:В порядке…

Кандидат: Последний этап — «очистка», этот этап также остановит мир, в основном для подсчета и сброса статуса метки.

Кандидат: В соответствии с «моделью прогнозирования паузы» (фактически установленное время паузы) она будет определять, сколько Регионов перерабатывает этот сборщик мусора.

Кандидат: Вообще говоря, Mixed GC выберет все регионы молодого поколения и некоторые регионы старого поколения с «высокой ценностью переработки» (высокая ценность переработки на самом деле является большим количеством мусора) для сбора.

Кандидат: В конце концов, очистка Mixed GC выполняется путем «копирования».

Кандидат: Следовательно, коллекция может не обязательно собирать весь мусор, G1 выберет количество Регионов по времени паузы (:

интервьюер: Ну я примерно понимаю процесс

интервьюер:Когда произойдет полная сборка мусора в G1?

Кандидат: если смешанный сборщик мусора не может идти в ногу со скоростью пользовательских потоков, выделяющих память, что приводит к заполнению старого возраста и неспособности продолжать смешанный сборщик мусора, он будет понижен до последовательного старого сборщика мусора для сбора всей кучи сборщика мусора.

Кандидат: Однако эта сцена очень редкая по сравнению с CMS.Ведь у G1 нет проблемы фрагментации памяти CMS(:

Резюме этой статьи (Особенности сборщика мусора G1):

  • От исходного «физического» поколения до текущего «логического» поколения «логическая» куча памяти делится на несколько регионов.
  • Используйте CSet для хранения коллекций перерабатываемых регионов.
  • Используйте RSet для работы со ссылками между поколениями (Примечание: RSet не сохраняет эталонные отношения, относящиеся к молодому поколению)
  • G1 можно просто разделить на: Minor GC, Mixed GC и Full GC.
  • [Срабатывает, когда область Eden заполнена] Незначительный процесс восстановления GC можно просто разделить на: (STW) сканирование корней GC, обновление && процесс Rset, копирование и очистка
  • [Инициируется, когда все пространство кучи составляет определенную долю] Смешанная сборка мусора полагается на «глобальную одновременную метку» для получения CSet (перерабатываемой области), а затем выполняет «очистку копии».
  • Когда R велико, чтобы описать принцип G1, с точки зрения макроэкономики G1 на самом деле "глобальный флаг параллелизма"и"скопировать живой объект"
  • Используйте алгоритм SATB для решения проблемы, связанной с тем, что ссылки на объекты могут быть изменены на этапе «одновременной маркировки».
  • Укажите параметры времени паузы для установки пользователями (G1 попытается уложиться во время паузы, чтобы скорректировать количество областей, восстановленных во время GC.)

Добро пожаловать в мой публичный аккаунт WeChat【Java3y] Давайте поговорим о Java-интервью, серия онлайн-интервьюеров постоянно обновляется!

Серия [Онлайн-интервьюер-Мобильный терминал]Продолжаем обновлять два раза в неделю!

【Онлайн-интервьюер-компьютер】СерияПродолжаем обновлять два раза в неделю!

Оригинал это не просто! ! Проси три! !

Категории