Новый прорыв в технологии кодирования: ByteDance AVG уменьшает видео на 13%

Разработка аудио и видео

Зарубежная техническая команда ByteDance добилась последнего прорыва в области глобального кодирования видео.

Согласно официальному веб-сайту Объединенной группы экспертов по видео JVET, ByteDance AVG (Advanced Video Team) в феврале этого года выпустила техническое предложение по сжатию видео, которое может сэкономить не менее 13% дискового пространства и полосы пропускания при оптимизации качества сжатия. Например, для 180-минутного видео высокой четкости стандарта H.266/VVC (разрешение 1080P) требуется около 3 ГБ объема данных, а после применения новой технологии требуется всего 2,6 ГБ. Это лучший прирост производительности для одного инструмента интеллектуального кодирования, раскрытый в отрасли.

ByteDance AVG создала команду по исследованиям и разработкам в Калифорнии, США, в состав которой входят старшие исследователи из Qualcomm, Microsoft, Intel и других гигантов, а также представители нового поколения из ведущих университетов страны и за рубежом. В процессе разработки JVET нового поколения международного стандарта видеокодеков H.266/VVC компания ByteDance AVG представила в общей сложности более 260 технических предложений, из которых более 130 были приняты, а число принятых предложений и уровень внедрения оцениваются в Компания Frontline является одним из основных разработчиков базового алгоритма H.266/VVC.

Видео — это последовательность динамических изображений, соединенных картинками, а видеокодек — это базовая технология, лежащая в основе видеоприложений.Его функция заключается в сжатии и цифровом кодировании изображений для передачи высококачественных видеоданных с минимально возможной полосой пропускания. H.266/VVC может снизить битрейт видео до половины по сравнению со стандартом предыдущего поколения H.265/HEVC без ущерба для качества изображения. Первоначально скорости сети было достаточно только для воспроизведения видео стандартной четкости, но она также может плавно воспроизводить видео высокой четкости.

Новый алгоритм, предложенный ByteDance AVG, направлен на создание фильтра (DAM), который уменьшает искажения при сжатии видео с помощью технологии глубокого обучения.Основой является глубокая сверточная сеть, основанная на наложении остаточных единиц, дополненная адаптивным выбором модели для максимизации производительности. адаптация к сложным природным видео. Так называемая остаточная единица относится к введению соединений с пропуском уровня, что позволяет сети сосредоточиться на изменяющихся остатках, которые аналогичны остаткам между кадрами видеоизображения. Большая часть содержимого каждого кадра изображения одинакова, и мигающий свет меча образует остаток, который также находится в центре внимания кодирования и сжатия видео.

Экспериментальные результаты показывают, что по сравнению с последним стандартом H.266/VVC решение DAM с опережением байтов может значительно повысить производительность кодирования видео.Сигнал яркости Y может обеспечить прирост производительности на 10,28%, а два сигнала цветности U и V прирост производительности достиг 28,22% и 27,97% соответственно, при этом качество видео было оптимизировано, объем данных можно уменьшить как минимум на 13%.

Рисунок: Тестовый пример из тестового видео Международной организации по стандартизации

Сообщается, что ByteDance AVG самостоятельно разработала кодировщик BVC2.0 и впервые приняла участие в международном авторитетном конкурсе видеокодеров MSU 2020, заняв первое место по четырем оценочным показателям. Различные результаты исследований AVG также будут внедрены посредством обновления кодировщика BVC, включая обработку видеоконтента таких приложений, как Douyin, Xigua Video и Toutiao, а также области инфраструктуры, такие как облачные вычисления и облачные игры, чтобы предоставить пользователям более четкое и плавное видео.

Помимо активного участия в разработке международных видеостандартов, компания AVG также внесла важный вклад в отечественный стандарт сжатия видео нового поколения AVS3, включая разделение на блоки, кодирование и предсказание вектора движения, внутрикадровое предсказание цвета и яркости и многие другие оригинальные технологии. был принят видеостандартом AVS3. Таким образом, ByteDance выиграла награду AVS Industrial Technology Innovation Proposal Award 2019 и является единственной интернет-компанией, получившей эту награду.

Доктор Чжан Ли из ByteDance AVG сказал, что стандарты сжатия видео как спецификация, которой должны следовать поставщики услуг, не только имеют неисчислимую коммерческую ценность, но и приносят реальное удобство пользователям. Благодаря стандартной формулировке и разработке продуктов ByteDance продолжит внедрять инновации и предоставлять технические возможности, а также работать с отраслью, чтобы предоставлять пользователям более качественные видеоуслуги.


Добро пожаловать в "Техническую команду Byte Beat"

Контактный адрес электронной почты для доставки резюме "tech@bytedance.com"