Rgb ycbcr422 ycbcr444 что

Сообщество любителей webOS-телевизоров LG

В каких режимах лучше подключать технику к телевизорам LG

В каких режимах лучше подключать технику к телевизорам LG

Пользователь Tl. с форума ixbt.com накидал небольшое пояснение по вопросам в каких режимах лучше подключать технику к телевизорам OLED и LG в частности. Далее с его слов:

Список режимов подключения к OLED телевизорам
— для подключения видео-плеера рекомендуется выбрать режим YCbCr, 12 бит, 422, автофреймрейт
— для подключения игровых приставок следует выбрать режим Авто.
— для подключения ПК для просмотра видео рекомендуется выбрать в настройках видео-карты режим RGB, 12бит, 24Гц (23.976)

Теперь длинное нудное пояснение почему именно так.

1. Подключение видео-плеера

1.1 YCbCr или RGB?
Видео-плеер занимается преимущественно воспроизведением видео. Видео закодировано в цвето-разностном формате (YUV или YCbCr).
YCbCr данные, полученные из видео после раскодирования, желательно донести до HDMI выхода как есть без лишних и ненужных преобразований во избежание потенциальных ошибок. Поэтому в самом общем случае для видео-плеера следует выбрать YCbCr.

1.2 Битность.
В общем случае следует выбирать 12 бит.

Почему нужно выбирать 12 бит когда видео закодировано в 10 битах (SDR в 8) и матрица телевизора способна отобразить только 10 бит?
Дело в том, что при кодировании из видео выкидывается часть цветовой информации для экономии размера (цветовая субдискретизация). Видео плеер при воспроизведении должен восстанавливать отсутствующую информацию. Для этого используются различные математически алгоритмы и для внутренних расчётов используется б’ольшая битность (16, 32). Для передачи полученных данных по HDMI их нужно округлить и запас разрядности не помешает.

1.3 4:4:4 или 4:2:2?
Универсальный вариант, скорее, 422.
ТВ в не-ПК режиме (об этом ниже) примет только 422. Т.е. даже если отправить ему 444, лишнее будет проигнорировано (сам формат данных YCbCr позволяет это сделать предельно безболезненно)

1.4 Диапазон: полный или ограниченный?
Также может называться «уровень чёрного»: низкий, высокий; RGB Полный или ограниченный; режим ПК или видео. И т.п.

Эти настройки должны быть выставлены в правильное положение по-умолчанию, т.е. можно их просто не трогать.
Но если выбирать вручную, то следует выбрать ограниченный или ТВ диапазон (уровни 16-235). Если настройка называется «уровень чёрного», то следует выбрать низкий.
Со стороны ТВ должен быть выбран «уровень чёрного»: Низко.

1.5 Какую частоту выбрать: 24, 30, 50, 60?
В самом общем и универсальном случае следует включить авто-переключение частот со стороны видео-плеера, т.н. автофреймрейт.

2. Подключение игровой приставки

Чего делать точно не следует, так это вручную выбирать вариант YUV420. Это режим совместимости для старых телевизоров с HDMI 1.4.

3. Подключение ПК для просмотра видео

3.1 RGB или YCbCr?
В мире ПК практически всё в RGB: рабочий стол Windows, игры, плееры и т.д. и т.п.
При воспроизведении видео оно также будет преобразовано в RGB.
madVR в конечном итоге отдаёт драйверу RGB.
Поэтому для ПК рекомендуется выставлять в настройках видео-драйвера режим RGB.

Если в настройках видео-выхода выставлен YCbCr, видео-драйвер начнёт заниматься самостоятельными преобразованиями RGB->YCbCr и этого лучше избежать поскольку они могу содержать ошибки. Откуда ошибки? Неизвестно с какими коэффициентами будут выполняться преобразования. Для HDR необходимо, чтобы использовались матрицы коэффициентов для BT2020, однако выяснить действительно ли это так затруднительно и никаких гарантий нет, поэтому запросто может оказаться, что драйвер использует коэффициенты для BT709, что породит ошибки и неточности.

В качестве подтверждения этих аргументов привожу авторитетное мнение разработчика madVR и краткий вывод:

Summed up: In order to get the best possible image quality, I strongly recommend to set your GPU control panel to RGB Full (0-255).

3.2. Битность: 8, 10 или 12?
Битность, в самом общем универсальном случае и для просмотра видео, следует выбирать 12 бит.
Однако 10/12 бит не получится выбрать в режиме 60Гц из-за ограничений пропускной способности интерфейса HDMI: таблица с поддерживаемыми форматами HDMI 2.0

Насколько страшно, что для 60Гц вместо 12/10 бит будет 8?
Вопрос спорный.
С одной стороны, количество видео-контента в 50-60Гц ограничено.
С другой стороны, для понижения битности с 12/10 до 8 видео-карта или плеер/рендер(madVR) могут самостоятельно выполнить дизеринг который визуально будет затруднительно отличить от 10 бит. Однако следует учитывать, что различные видео-карты могут выполнять дизеринг на своё усмотрение и по разному, в т.ч. и не выполнять его вовсе, что приведёт к видимому бандингу на 10 битном контенте.

3.4 Как получить полноценный RGB или YCbCr 4:4:4.
Телевизор в режиме по умолчанию, передаваемый ему RGB или YCbCR 4:4:4, автоматически преобразует и обрезает до YCbCr 4:2:2.
Единственный вариант получить и отобразить полноценный RGB, включить в настройках ТВ т.н. «ПК режим».
Для телевизоров LG это выполняется с помощью выбора в меню «Все входы» значка ПК для соответствующего HDMI порта.

Однако при этом отключается часть дополнительных алгоритмов обработки изображения, включая и интерполяцию кадров и подавление смаза для повышения динамического разрешения. Для LG это TruMotion.
Кроме этого, на некоторых моделях встречаются и другие неприятные побочные эффекты с ПК-режимом, включая некорректное отображение HDR.
Другими словами, ПК-режим ТВ скорее подойдёт для тех, кто использует ТВ в качестве монитора, чем для тех кто собирается использовать компьютер для просмотра видео.

3.5 Кратко по ПК и просмотру видео.
Общая универсальная рекомендация: для просмотра видео на ПК выбирать в настройках видео-карты режим RGB, полный диапазон, 24Гц (23.976), 12бит.
Для просмотра HDR контента можно использовать плеер с поддержкой вывода через madVR, он умеет переключать режимы SDR/HDR автоматически для видео-карт NVidia и AMD.

Источник

Как работает видеокодек. Часть 1. Основы

Вторая часть: Принципы работы видеокодека

Любое растровое изображение можно представить в виде двумерной матрицы. Когда речь заходит о цветах, идею можно развить, рассматривая изображение в виде трехмерной матрицы, в которой дополнительные измерения используются для хранения данных по каждому из цветов.

Если рассматривать итоговый цвет как комбинацию т.н. основных цветов (красного, зеленого и синего), в нашей трёхмерной матрице определяем три плоскости: первая для красного цвета, вторая для зеленого и последняя для синего.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader
Статья опубликована при поддержке компании EDISON.

Альтернативные способы кодирования цветного изображения

Для представления цветов, из которых состоит изображение, есть немало и других моделей. Например, можно использовать индексированную палитру, в которой потребуется только один байт для представления каждого пикселя, вместо трёх, необходимых при использовании модели RGB. В такой модели можно использовать 2D-матрицу вместо 3D-матрицы для представления каждого цвета. Это экономит память, но даёт меньшую цветовую гамму.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Например, взгляните на эту картинку ниже. Первое лицо полностью окрашено. Другие — это красная, зеленая и синяя плоскости (интенсивность соответствующих цветов показана в градации серого).

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Видим, что оттенки красного в оригинале будут в тех же местах, в которых наблюдаются самые яркие части второго лица. В то время как вклад синего цвета в основном можно увидеть только в глазах Марио (последнее лицо) и элементах его одежды. Обратите внимание, куда все три цветовые плоскости вносят наименьший вклад (самые темные части изображений) — это в усы Марио.

Для хранения интенсивности каждого цвета требуется определенного количества битов — эта величина называется битовой глубиной. Допустим, тратится 8 бит (исходя из значения от 0 до 255) на одну цветовую плоскость. Тогда имеем глубину цвета в 24 бита (8 бит * 3 плоскости R/G/B).

Другое свойство изображения — это разрешение, представляющее из себя количество пикселей в одном измерении. Частенько обозначается как как ниже на изображение-примере 4 на 4.
Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Ещё одно свойство, с которым имеем дело при работе с изображениями/видео — это соотношение сторон, описывающее обычную пропорциональную взаимосвязь между шириной и высотой изображения или пикселя.

Когда говорят, что некий фильм или картинка имеют размер 16 на 9, обычно имеется в виду соотношение сторон дисплея (DAR — от Display Aspect Ratio). Однако иногда могут быть различные формы отдельных пикселей — в этом случае речь идёт о соотношении пикселей (PAR — от Pixel Aspect Ratio).

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Хозяюшке на заметку: DVD соответствует DAR 4 на 3

Хотя реальное разрешение DVD составляет 704×480, тем не менее оно сохраняет соотношение сторон 4:3, поскольку PAR имеет значение 10:11 (704×10 / 480×11).

Ну и, наконец, можем определить видео как последовательность из n кадров за период времени, которое можно считать дополнительным измерением. А n тогда — это частота кадров или количество кадров в секунду (FPS — от Frames per Second).

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Количество бит в секунду, необходимое для показа видео, является его скоростью передачибитрейтом.

битрейт = ширина * высота * бит глубина * кадров в секунду

Например, для видео с 30 кадрами в секунду, 24 битами на пиксель, разрешением 480×240 потребуется 82,944,000 бит в секунду или 82,944 Мбит/с (30x480x240x24) — но это если не используется какой-либо из методов сжатия.

Если скорость передачи почти постоянна, то она называется постоянной скоростью передачи (CBR — от constant bit rate). Но она также может и варьироваться, в этом случае называется переменной скоростью передачи (VBR — от variable bit rate).

Этот график демонстрирует ограниченный VBR, когда тратится не слишком много битов в случае полностью тёмного кадра.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Изначально инженеры разработали метод удвоения воспринимаемой частоты кадров видеодисплея без использования дополнительной полосы пропускания. Этот способ известен как чересстрочное видео; в основном, он отправляет половину экрана в первом «кадре», а другую половину — в следующем «кадре».

В настоящее время визуализация сцен, в основном, происходит с использованием технологии прогрессивного сканирования. Это способ отображения, хранения или передачи движущихся изображений, в котором все линии каждого кадра прорисовываются последовательно.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Ну что ж! Теперь мы в курсе, как изображение представляется в цифровом виде, как устроены его цвета, сколько бит в секунду мы тратим, чтобы показать видео, если скорость передачи постоянная (CBR) или переменная (VBR). Знаем про заданное разрешение с использованием заданной частоты кадров, ознакомились со многими другими терминами, такие как чересстрочное видео, PAR и некоторыми другими.

Удаление избыточности

Известно, что видео без сжатия нормально использовать невозможно. Часовое видео с разрешением 720p и частотой 30 кадров в секунду занимало бы 278 Гб. К такому значению приходим, перемножив 1280 x 720 x 24 x 30 x 3600 (ширина, высота, биты на пиксель, FPS и время в секундах).

Использование алгоритмов сжатия без потерь, вроде DEFLATE (используется в PKZIP, Gzip и PNG), не даст достаточного уменьшению необходимой полосы пропускания. Приходится искать другие способы сжатия видео.

Для этого можно использовать особенности нашего зрения. Мы лучше различаем яркость, чем цвета. Видео это набор последовательных изображений, повторяющихся со временем. Между соседними кадрами одной сцены различия небольшие. Кроме того, каждый кадр содержит много областей, использующих один и тот же (или похожий) цвет.

Цвет, яркость и наши глаза

Наши глаза более чувствительны к яркости, чем к цвету. Вы можете убедиться в этом сами, посмотрев на эту картинку.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Если вы не видите, что в левой половине изображения цвета квадратов A и B на самом деле одинаковы, то это нормально. Наш мозг заставляет нас уделять больше внимания светотени, а не цвету. С правой стороны между означенными квадратами есть перемычка того же цвета — поэтому мы (т.е. наш мозг) легко определяем, что, на самом деле, там один и тот же цвет.

Давайте разберём (упрощенно) как работают наши глаза. Глаз — сложный орган, состоящий из многих частей. Однако нас больше всего интересуют колбочки и палочки. Глаз содержит около 120 миллионов палочек и 6 миллионов колбочек.

Рассмотрим восприятие цвета и яркости как отдельные функции определённых частей глаза (на самом деле, всё обстоит несколько сложнее, но мы упростим). Палочковые клетки, в основном, отвечают за яркость, в то время как колбочковые клетки отвечают за цвет. Колбочки подразделяются на три типа, в зависимости от содержащегося пигмента: S-колбочки (синий цвет), M-колбочки (зеленый цвет) и L-колбочки (красный цвет).

Поскольку у нас гораздо больше палочек (яркость), чем колбочек (цвет), можно сделать вывод, что мы более способны различать переходы между темнотой и светом, чем цвета.

Rgb ycbcr422 ycbcr444 что. 8zulylhy pkitzl5mubbzdcbswm. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-8zulylhy pkitzl5mubbzdcbswm. картинка Rgb ycbcr422 ycbcr444 что. картинка 8zulylhy pkitzl5mubbzdcbswm

Функции контрастной чувствительности

Исследователи экспериментальной психологии и многих других областей разработали множество теорий человеческого зрения. И одна из них называется функциями контрастной чувствительности. Они связаны с пространственным и временны́м освещением. Если кратко, то речь о том, сколько требуется изменений, прежде чем наблюдатель их заметит. Обратите внимание на множественное число слова «функция». Это связано с тем, что мы можем измерять функции чувствительности к контрасту не только к черно-белому изображению, но и цветному. Результаты этих экспериментов показывают, что в большинстве случаев наши глаза более чувствительны к яркости, чем к цвету.

Раз известно, что мы более чувствительны к яркости изображения, можно попытаться использовать этот факт.

Цветовая модель

Мы немножко разобрались, как работать с цветными изображениями, используя RGB-схему. Есть и другие модели. Существует модель, которая отделяет яркость от цветности и она известна как YCbCr. Кстати, есть и другие модели, которые делают аналогичное разделение, но мы рассмотрим только эту.

В этой цветовой модели Y — это представление яркости, а также используются два цветовых канала: Cb (насыщенный синий) и Cr (насыщенный красный). YCbCr может быть получен из RGB, равно как возможно и обратное преобразование. Используя эту модель, мы можем создавать полноцветные изображения, как видим ниже:

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Преобразование между YCbCr и RGB

Кто-то возразит: как возможно получить все цвета, если не используется зеленый?

Чтобы ответить на этот вопрос, преобразуем RGB в YCbCr. Воспользуемся коэффициентами, принятыми в стандарте BT.601, который был рекомендован подразделением МСЭ-Р. Это подразделение определяет стандарты цифровом видео. Например: что такое 4K? Каковы должны быть частота кадров, разрешающая способность, цветовая модель?

Сначала вычислим яркость. Воспользуемся константами, предложенные МСЭ, и заменим значения RGB.

После того, как мы получили яркость, отделим синий и красный цвет:

И мы также можем преобразовать обратно и даже получить зеленый с помощью YCbCr:

Как правило, дисплеи (мониторы, телевизоры, экраны и т. д.) используют только модель RGB. Но эта модель может быть организована по-разному:

Rgb ycbcr422 ycbcr444 что. rqisbywjfks tvcpk7liyvyaiqw. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-rqisbywjfks tvcpk7liyvyaiqw. картинка Rgb ycbcr422 ycbcr444 что. картинка rqisbywjfks tvcpk7liyvyaiqw

Цветовая субдискретизация

С изображением, представленным в виде комбинации яркости и цветности, мы можем использовать более высокую чувствительность человеческой зрительной системы к яркости, чем к цветности, если будем выборочно удалять информацию. Цветовая субдискретизация — это метод кодирования изображений, с использованием меньшего разрешения для цветности, чем для яркости.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Насколько допустимо уменьшать разрешение цветности?! Оказывается, уже есть некоторые схемы, которые описывают, как обрабатывать разрешение и слияние

a — эталон горизонтальной выборки (как правило, равен 4)
x — количество выборок цветности в первой строке пикселей (горизонтальное разрешение по отношению к a)
y — количество изменений выборок цветности между первой и второй строками пикселей.

Исключение составляет 4:1:0, обеспечивающее одну выборку цветности в каждом блоке разрешения яркости 4 на 4.

Общие схемы, используемые в современных кодеках:

YCbCr 4: 2: 0 — пример слияния

Вот объединенный фрагмент изображения с использованием YCbCr 4:2:0. Обратите внимание, что мы тратим только 12 бит на пиксель.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Вот так выглядит одно и то же изображение, закодированное основными типами цветовой субдискретизации. Первый ряд — это окончательный YCbCr, нижний ряд показывает разрешение цветности. Весьма достойные результаты, учитывая небольшие потери в качестве.

Rgb ycbcr422 ycbcr444 что. q5g f0w41riagjrnt3msc0a us. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-q5g f0w41riagjrnt3msc0a us. картинка Rgb ycbcr422 ycbcr444 что. картинка q5g f0w41riagjrnt3msc0a us

Помните, мы насчитали 278 Гб дискового пространства для хранения часового видеофайла с разрешением 720p и 30 кадрами в секунду? Если воспользуемся YCbCr 4:2:0, то этот размер сократится наполовину — 139 Гб. Пока что всё равно далеко до приемлемого результата.

Вы можете сами получить гистограмму YCbCr с помощью FFmpeg. В этом изображении синее превалирует над красным, что хорошо видно на самой гистограмме.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Цветность, яркость, цветовая гамма — видеообзор

Рекомендуется к просмотру вот это обалденное видео. Тут объясняется, что такое яркость, да и вообще расставлены все точки над ё о яркости и цвете.

Типы кадров

Двигаемся дальше. Попробуем устранить избыточность по времени. Но сначала давайте определим некоторую базовую терминологию. Предположим, у нас есть фильм с 30 кадрами в секунду, вот его первые 4 кадра:

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loaderRgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Мы можем видеть много повторений в кадрах: например, синий фон, не изменяющийся от кадра к кадру. Чтобы решить эту проблему, мы можем абстрактно классифицировать их как три типа кадров.

I-кадр (Intro Frame)

I-кадр (кадр-ссылка, ключевой кадр, внутренний кадр) является автономным. Вне зависимости от того, что нужно визуализировать, I-кадр является, по сути, статичной фотографией. Первый кадр обычно является I-кадром, однако будем регулярно наблюдать I-кадры и среди далеко не первых кадров.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

P-кадр (Predicted Frame)

P-кадр (прогнозируемый кадр) использует преимущество того факта, что почти всегда текущее изображение может быть воспроизведено с использованием предыдущего кадра. Например, во втором кадре единственным изменением является движущийся вперёд мяч. Мы можем получить кадр 2 просто немного видоизменив кадр 1, только используя разницу между этими кадрами. Для построения кадра 2 ссылаемся на предшествующий ему кадр 1.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loaderRgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

B-кадр (Bi-predictive Frame)

А как насчет ссылок не только на прошлые, а заодно и на будущие кадры, чтобы обеспечить еще лучшее сжатие?! Это, в основном и есть B-кадр (двунаправленный кадр).

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loaderRgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loaderRgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Промежуточный вывод

Эти типы кадров используются для обеспечения наилучшего сжатия. Мы разберём, как это происходит, в следующем разделе. А пока отметим, что наиболее «дорогим» по затраченной памяти является I-кадр, P-кадр обходится заметно дешевле, а вот самым выгодным вариантом для видео является B-кадр.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Временна́я избыточность (межкадровое прогнозирование)

Давайте рассмотрим какие у нас есть возможности для минимизации повторений по времени. Этот тип избыточности решим с помощью методов взаимного прогнозирования.

Постараемся потратить как можно меньше битов для кодирования последовательности кадров 0 и 1.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Мы можем произвести вычитание, просто вычитаем кадр 1 из кадра 0. Получаем кадр 1, только используем разницу между ним и предыдущим кадром, фактически кодируем только получающийся остаток.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Но что, если я вам скажу, что есть ещё более лучший метод, который использует еще меньше битов?! Сначала давайте разобьём frame 0 на чёткую сетку, состоящую из блоков. А затем попробуем сопоставить блоки из кадра 0 с кадром 1. Иными словами, оценим движение между кадрами.

Из Википедии — блочная компенсации движения

Блочная компенсация движения делит текущий кадр на непересекающиеся блоки и вектор компенсации движения сообщает, происхождение блоков (распространенное заблуждение состоит в том, что предыдущий кадр делится на непересекающиеся блоки, а векторы компенсации движения сообщают, куда переходят эти блоки. А фактически наоборот — анализируется не предыдущий кадр, а последующий, выясняется не куда перемещаются блоки, а откуда они появились). Обычно исходные блоки перекрываются в исходном кадре. Некоторые алгоритмы сжатия видео собирают текущий кадр из частей даже не одного, а сразу нескольких ранее переданных кадров.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

В реальной ситуации этот шарик был бы разделен на n блоков, но сути дела это не меняет.

Объекты в кадре перемещаются в трёх измерениях, поэтому при движении шарика он может стать визуально меньше (или больше, если движется в сторону зрителя). Это нормально, что не будет идеального соответствия между блоками. Вот совмещенный вид нашей оценки и реальной картины.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Но видим, что когда применяем оценку движения, данных для кодирования заметно меньше, чем при использовании более простого метода высчитывания дельты между кадрами.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Как будет выглядеть реальная компенсация движения

Эта методика применяется сразу ко всем блокам. Зачастую наш условный движущийся мячик будет разбит сразу на несколько блоков.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Вы можете сами пощупать эти концепции, используя Jupyter.

Чтобы увидеть векторы движения можно создать видео с внешним предсказанием с помощью ffmpeg.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Ещё можно воспользоваться Intel Video Pro Analyzer (он платный, но есть бесплатная пробная версия, которая ограничена только первыми десятью кадрами).

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Пространственная избыточность (внутренний прогноз)

Если проанализировать каждый кадр в видео, то обнаружим множество взаимосвязанных областей.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Пройдемся по этому примеру. Эта сцена в основном состоит из синего и белого цветов.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Это I-кадр. Предыдущие кадры для прогнозирования взять не можем, но получится его сжать. Закодируем выделение красного блока. Если мы посмотрим на его соседей, то замечаем, что вокруг него есть кое-какие цветовые тенденции.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Предполагаем, что в кадре цвета распространяются по вертикали. Что означает, что цвет неизвестных пикселей будут содержать значения его соседей.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Такой прогноз может оказаться и неверным. Именно по этой причине нужно применить этот метод ( внутренний прогноз), а затем ещё вычесть реальные значения. Это даст нам остаточный блок, что приведёт к гораздо более сжатой матрице по сравнению с оригиналом.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Если хотите попрактиковаться с внутренними предсказаниями, то можете создать видео с макроблоками и их предсказаниями с помощью ffmpeg. Чтобы понять значение каждого цвета блока придётся ознакомиться с документацией ffmpeg.

Rgb ycbcr422 ycbcr444 что. image loader. Rgb ycbcr422 ycbcr444 что фото. Rgb ycbcr422 ycbcr444 что-image loader. картинка Rgb ycbcr422 ycbcr444 что. картинка image loader

Или же можно использовать Intel Video Pro Analyzer (как я уже упоминал выше, в пробной бесплатной версии ограничение на первые 10 кадров, но вам этого на первых порах хватит).

Источник

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *