0 просмотров
Рейтинг статьи
1 звезда2 звезды3 звезды4 звезды5 звезд
Загрузка...

Семейство форматов MPEG. Часть первая — MPEG-1.

Основы электроакустики

Видеопоследовательности, сжатые в соответствии с форматами MPEG-1 и MPEG-2 , различаются объемом информации и, как следствие, качеством. Хотя алгоритм MPEG-1 может работать с разрешением вплоть до стандарта CCIR-601(720х480),обычно видео кодируется при значительно более низкой интенсивности потока данных, что приводит к худшему качеству воспроизводимого видео. Качество MPEG-1 обычно ассоциируется с качеством VHS только в формате (352х240).При воспроизведении такое изображение “растягивается” аппаратными или программными средствами до полного экрана, и хотя при этом теряется качество, зато остается возможность проигрывать полноэкранное видео даже с двухскоростным CD-ROM.

MPEG-2 поддерживает более высокие разрешения (в том числе и CCIR-601). При этом объем файлов MPEG-2 примерно в четыре раза больше относительно файлов MPEG-1, что позволяет записывать полноэкранные фильмы “вещательного” (Betacam) качества. Этот формат избран для использования в новом поколении видеодисков на основе технологии DVD, а в скором времени станет доминировать и на PC.В отличие от MPEG-1 для MPEG-2 необязательно наличие GOP-групп, и даже при отсутствии GOP-заголовка можно получить прямой доступ к видеофрагменту. Другой ключевой особенностью MPEG-2 является присутствие в нем расширений, которые позволяют при записи разделить видеосигнал на два (ли более) независимо кодируемых потока данных, представляющих видео в различных разрешениях, т.е. с лучшим или худшим качеством изображения. Это делается с целью создания независимых потоков данных определенной интенсивности в рамках одного видеосигнала. Такая функция важна, если необходимо одновременно транслировать ТВЧ и стандартный телевизионный сигнал.

Стандарт MPEG-2 состоит из трех основных частей: системной, видео и звуковой.

Системная часть описывает форматы кодирования для мультиплексирования звуковой, видео и другой информации, рассматривает вопросы комбинирования одного или более потоков данных в один или множество потоков, пригодных для хранения или передачи.

Системное кодирование в соответствии с синтаксическими и семантическими правилами, налагаемыми данным стандартом, обеспечивает необходимую и достаточную информацию, чтобы синхронизировать декодирование без переполнения или «недополнения» буферов декодера при различных условиях приема или восстановления потоков.

Таким образом, системный уровень выполняет пять основных функций:

Синхронизация нескольких сжатых потоков при воспроизведении

Объединение нескольких сжатых потоков в единый поток

Инициализация для начала воспроизведения

Определение временной шкалы

Видеочасть стандарта описывает кодированный битовый поток для высококачественного цифрового видео.MPEG-2 является совместимым расширением MPEG-1, он поддерживает чересстрочный видеоформат и содержит средства для поддержки ТВЧ.

Стандарт MPEG-2 определяется в терминах расширяемых профилей, каждый из которых, являясь частным случаем стандарта, имеет черты, необходимые всем классам приложений. Иерархические масштабируемые профили могут поддерживать такие приложения, как совместимое наземное многопрограммное ТВ (ТВЧ), пакетные сетевые видеосистемы, обратную совместимость с другими стандартами (MPEG-1 и Н.261) и приложениями, использующими многоуровневое кодирование. Такая система позволит потребителю использовать приемник для декодирования как стандартного телевизионного сигнала, так и сигнала ТВЧ из того же вещательного канала.

Звуковая часть стандарта MPEG-2 определяет кодирование многоканального звука. MPEG-2 поддерживает до пяти полных широкополосных каналов плюс дополнительный низкочастотный канал и (или) до семи многоязычных комментаторских каналов. Он также расширяет возможности кодирования моно и стереозвуковых сигналов в MPEG-1 за счет использования половинных частот дискретизации (16; 22,05 и 24 кГц) для улучшения качества при скоростях передачи 64 Кбит/с и ниже.

Применение стандарта MPEG-2 в вещательном телевидении позволяет значительно снизить скорость передачи видео- и звуковых данных и за счет этого передавать несколько цифровых программ в стандартной полосе частот радиоканалов эфирного, кабельного и спутникового телевизионного вещания. Например, большие преимуществаMPEG-2 дает в системах спутникового телевизионного вещания. Сжатие позволяет передать по одному стандартному каналу от одного до пяти цифровых каналов при профессиональном уровне качества видеосигнала. Важно и то, что цифровые каналы по сравнению с аналоговыми предоставляют более широкие возможности для передачи дополнительной информации.

Пропускная способность стандартного спутникового канала при полосе 32 МГц составляет 55 Мбит/с. Для вещания с профессиональным качеством необходима скорость цифрового потока 5 — 8 Мбит/с. Таким образом, один стандартный спутниковый канал позволяет транслировать 4 — 5 телевизионных программ. Возможно использование цифровых каналов с более высокими коэффициентами сжатия. При этом в одном стандартном канале передается до десяти видеопрограмм. Однако в этих случаях заметна потеря качества изображения.

В общем случае переход к цифровому многопрограммному ТВ вещанию предполагает постепенный вывод из эксплуатации аналоговых систем вещания: SECAM, PAL, NTSC, освобождение за счет этого существующих радиоканалов и линий связи, а также их перепрофилирование для цифрового ТВ вещания. При этом система многопрограммного ТВ вещания должны быть встроена в существующий частотный план распределения ТВ каналов, который предусматривает полосу пропускания 8 МГц для эфирного и кабельного ТВ вещания, 27 МГц — для спутниковых систем непосредственного ТВ вещания и 30, 33, 36, 40, 46, 54, 72 МГц — для фиксированных служб спутниковой связи. Необходимо также учитывать сложившуюся взаимосвязь между спутниковыми и наземными системами телевещания, предполагающую использование ТВ каналов кабельных и эфирных сетей вещания также для доведения спутниковых программ до телезрителей.

При цифровом вещании взаимный обмен телепрограммами между наземными и спутниковыми вещательными службами существенно упрощается, если число цифровых ТВ программ в каждом стандартном по полосе пропускания спутниковом, кабельном и эфирном радиоканале будет одинаковым. Это требование было учтено при разработке международных стандартов на методы модуляции и канального кодирования в цифровых спутниковых и наземных каналах связи — DVB-S, DVB-C и DVB-T (Digital Video Broadcasting — Satellite, Cable, Terrestrial) — путем применения для более узкополосных радиоканалов более сложных и эффективных по плотности передачи информации методов модуляции.

При организации многопрограммного цифрового ТВ вещания весьма важно правильно выбрать скорость передачи, поскольку от этого непосредственно зависит качество изображения и звукового сопровождения. Согласно экспертным оценкам, для получения изображения студийного качества, соответствующего Рекомендации 601 МККР, необходимо передавать видеоданные со скоростью около 9 Мбит/с. При этом декодированный видеосигнал будет пригоден для последующей цифровой обработки. Для получения изображения с качеством, соответствующим качеству изображения на экране бытового телевизора, будет достаточна скорость передачи около 6 Мбит/с. В этом случае декодированный видеосигнал будет малопригоден для последующей обработки и повторного кодирования с информационным сжатием.

Необходимо отметить, что качество ТВ изображения при одинаковой скорости передачи видеоданных в
системах телевидения с частотой развертки полей 50 Гц будет выше, чем в системах телевидения с частотой развертки полей 60 Гц.

Несколько слов о скорости передачи звуковых данных. В настоящее время общепринятым эталоном высшего качества звука является качество, получаемое при воспроизведении компакт-дисков. Поэтому в стандарте MPEG-2 предполагается, что в системах цифрового ТВ вещания качество звукового стереосопровождения субъективно не должно отличаться от звука с компакт-диска. Это условие выполняется для принятой в стандарте MPEG-2 системы информационного сжатия звуковых данных MUSICAM при скорости передачи по 128 Кбит/с на каждый моноканал звукового сопровождения. Таким образом, для самого низкого уровня — двухканального стереофонического звукового сопровождения — потребуется скорость передачи цифровых данных, равная 128 Кбит/с х 2 = 256 Кбит/с.

Цифровой поток для передачи дополнительной информации (ДИ) выбирается в зависимости от ее предполагаемого объема. Скорость передачи обычно выбирается кратной скорости цифрового потока телефонного канала — 64 Кбит/с. Для унификации каналов цифровой передачи данных звукового сопровождения и дополнительной информации обычно скорость передачи ДИ выбирается равной 128 Кбит/с. В связи с большой сложностью построения стандарта MPEG-2 стоимость цифрового приемного оборудования выше аналогового. Именно по этой причине аналоговое вещание пока будет существовать наряду с цифровым.

MPEG для чайников.

Стандарт сжатия MPEG разработан Экспертной группой кинематографии (Moving Picture Experts Group — MPEG). MPEG это стандарт на сжатие звуковых и видео файлов в более удобный для загрузки или пересылки, например через интернет, формат.

Существуют разные стандарты MPEG (как их еще иногда называют фазы — phase): MPEG-1, MPEG-2, MPEG-3, MPEG-4, MPEG-7.

MPEG состоит из трех частей: Audio, Video, System (объединение и синхронизация двух других).

MPEG-1

По стандарту MPEG-1 потоки видео и звуковых данных передаются со коростью 150 килобайт в секунду — с такой же скоростью, как и односкоростной CD-ROM проигрыватель — и управляются путем выборки ключевых видео кадров и заполнением только областей, изменяющихся между кадрами. К несчастью, MPEG-1 обеспечивает качество видеоизображения более низкое, чем видео, передаваемое по телевизионному стандарту.

MPEG-1 был разработан и оптимизирован для работы с разрешением 352 ppl (point per line — точек на линии) * 240 (line per frame — линий в кадре) * 30 fps (frame per second — кадров в секунду), что соответствует скорости передачи CD звука высокого качества. Используется цветовая схема — YCbCr (где Y — яркостная плоскость, Cb и Cr — цветовые плоскости).

Как MPEG работает:

В зависимости от некоторых причин каждый frame (кадр) в MPEG может быть следующего вида:

  • I (Intra) frame — кодируется как обыкновенная картинка.
  • P (Predicted) frame — при кодировании используется информация от предыдущих I или P кадров.
  • B (Bidirectional) frame — при кодировании используется информация от одного или двух I или P кадров

Последовательность кадров может быть например такая: IBBPBBPBBPBBIBBPBBPB.

Последовательность декодирования: 0312645.

Нужно заметить, что прежде чем декодировать B кадр требуется декодировать два I или P кадра. Существуют разные стандарты на частоту, с которой должны следовать I кадры, приблизительно 1-2 в секунду, соответствуюшие стандарты есть и для P кадров (каждый 3 кадр должен быть P кадром). Существуют разные относительные разрешения Y, Cb, Cr плоскостей (Таблица 1), обычно Cb и Cr кодируются с меньшим разрешением чем Y.

Таблица 1

Для применения алгоритмов кодировки происходит разбивка кадров на макроблоки каждый из которых состоит из определенного количества блоков (размер блока — 8*8 пикселей). Количество блоков в макроблоке в разных плоскостях разное и зависит от используемого формата

Техника кодирования:

Для большего сжатия в B и P кадрах используется алгоритм предсказания движения (что позволяет сильно уменьшить размер P и B кадров — Таблица 2) на выходе которого получается:

  • Вектор смещения (вектор движения) блока который нужно предсказать относительно базового блока.
  • Разница между блоками (которая затем и кодируется).
Читать еще:  Рынок SACD. Мифы развеиваются.

Так как не любой блок можно предсказать на основании информации о предыдущих, то в P и B кадрах могут находиться I блоки (блоки без предсказания движения).

Таблица 2

Метод кодировки блоков (либо разницы, получаемой при методе предсказание движения) содержит в себе:

  • Discrete Cosine Transforms (DCT — дискретное преобразование косинусов).
  • Quantization (преобразование данных из непрерывной формы в дискретную).
  • Кодировка полученного блока в последовательность.

DCT использует тот факт, что пиксели в блоке и сами блоки связаны между собой (т.е. коррелированны), поэтому происходит разбивка на частотные фурье компоненты (в итоге получается quantization matrix — матрица преобразований данных из непрерывной в дискретную форму, числа в которой являются величиной амплитуды соответствующей частоты), затем алгоритм Quantization разбивает частотные коэффициенты на определенное количество значений. Encoder (кодировщик) выбирает quantization matrix которая определяет то, как каждый частотный коэффициент в блоке будет разбит (человек более чувствителен к дискретности разбивки для малых частот чем для больших). Так как в процессе quantization многие коэффициенты получаются нулевыми то применяется алгоритм зигзага для получения длинных последовательностей нулей

Звук в MPEG:

Форматы кодирования звука деляться на три части: Layer I, Layer II, Layer III (прообразом для Layer I и Layer II стал стандарт MUSICAM, этим именем сейчас иногда называют Layer II). Layer III достигает самого большого сжатия, но, соответственно, требует больше ресурсов на кодирование. Принципы кодирования основаны на том факте, что человеческое ухо не совершенно и на самом деле в несжатом звуке (CD-audio) передается много избыточной информации. Принцип сжатия работает на эффектах маскировки некоторых звуков для человека (например, если идет сильный звук на частоте 1000 Гц, то более слабый звук на частоте 1100 Гц уже не будет слышен человеку, также будет ослаблена чувствительность человеческого уха на период в 100 мс после и 5 мс до возникновения сильного звука). Psycoacustic (психоакустическая) модель используемая в MPEG разбивает весь частотный спектр на части, в которых уровень звука считается одинаковым, а затем удаляет звуки не воспринимаемые человеком, благодаря описанным выше эффектам.

В Layer III части разбитого спектра самые маленькие, что обеспечивает самое хорошее сжатие. MPEG Audio поддерживает совместимость Layer’ов снизу вверх, т.е. decoder (декодировщик) для Layer II будет также распознавать Layer I.

Синхронизация и объединение звука и видео, осуществляется с помощью System Stream , который включает в себя:

  • Системный слой, содержащий временную и другую информацию чтобы разделить и синхронизовать видео и аудио.
  • Компрессионный слой, содержащий видео и аудио потоки.

Видео поток содержит заголовок, затем несколько групп картинок (заголовок и несколько картинок необходимы для того, что бы обеспечить произвольный доступ к картинкам в группе в независимости от их порядка).

Звуковой поток состоит из пакетов каждый из которых состоит из заголовка и нескольких звуковых кадров (audio-frame).

Для синхронизации аудио и видео потоков в системный поток встраивается таймер, работающий с частотой 90 КГц (System Clock Reference — SCR, метка по которой происходит увеличения временного счетчика в декодере) и Presentation Data Stamp (PDS, метка насала воспроизведения, вставляются в картинку или в звуковой кадр, чтобы объяснить декодеру, когда их воспроизводить. Размер PDS сотавляет 33 бита, что обеспечивает возможность представления любого временного цикла длинной до 24 часов).

Параметры MPEG-1 (Утверждены в 1992)

Параметры Аудио: 48, 44.1, 32 КГц, mono, dual (два моно канала), стерео, интенсивное стерео (объединяются сигналы с частотой выше 2000 Гц.), m/s stereo (один канал переносит сумму — другой разницу). Сжатие и скорость передачи звука для одного канала, для частоты 32 КГц представлены в Таблице 3.

MPEG-1

.mpg, .mpeg, .mp1, .mp2, .mp3, .m1v, .m1a, .m2a, .mpa, .mpv

audio, video, container

MPEG-1 — группа стандартов цифрового сжатия аудио и видео, принятых MPEG (Moving Picture Experts Group — Группой Экспертов в области Видео).

MPEG-1 видео используется в формате Video CD.

MPEG-1 audio layer 3 — это полное имя весьма популярного формата сжатия аудио MP3.

MPEG-1 состоит из нескольких частей:

  1. Синхронизация и мультиплексирование аудио и видео (MPEG-1 Program Stream).
  2. кодек для видео с прогрессивной разверткой.
  3. кодек для звука. Стандарт MPEG-1 определяет три уровня сжатия звука.
    1. MP1 или MPEG-1 часть 3 уровень 1 (MPEG-1 Audio Layer 1)
    2. MP2 или MPEG-1 часть 3 уровень 2 (MPEG-1 Audio Layer 2)
    3. MP3 или MPEG-1 часть 3 уровень 3 (MPEG-1 Audio Layer 3)
  4. Процедуры тестирования производительности.
  5. Эталонное ПО (Reference software).

Ссылка на стандарт: ISO/IEC JTC1/SC29/WG11 (June 1996)

MPEG-1 видео

MPEG-1 видео был исходно разработан с целью достичь приемлемого качества для видео на потоках 1,5 Мегабита/c и разрешении 352×240. Несмотря на то, что MPEG-1 применяется для кодирования с низким разрешением и низким битрейтом, стандарт позволяет использовать любое разрешение вплоть до 4095×4095. Большинство реализаций разработаны с учётом спецификации Constrained Parameter Bitstream.

В настоящее время MPEG-1 — наиболее совместимый формат в семействе MPEG — он проигрывается практически на всех компьютерах с VCD/DVD проигрывателями.

Самым крупным недостатком MPEG-1 видео является поддержка только прогрессивной развертки. Этот недостаток в свое время помог более быстрому признанию более универсального стандарта MPEG-2.

См. также

MJPEG • Motion JPEG 2000 • MPEG-1 • MPEG-2 • MPEG-4 (Part 2/H.263 • Part 10/H.264/AVC) • MPEG-H Part 2/H.265/HEVC

Bink • Cinepak • Indeo • Pixlet • RealVideo • RTVideo • SIF1 • Smacker • Snow • Sorenson • Tarkin • VP3 (Theora) • VP6 • VP7 • VP8 • WMV

Wikimedia Foundation . 2010 .

Смотреть что такое «MPEG-1» в других словарях:

MPEG-4 — is a method of defining compression of audio and visual (AV) digital data. It was introduced in late 1998 and designated a standard for a group of audio and video coding formats and related technology agreed upon by the ISO/IEC Moving Picture… … Wikipedia

MPEG-7 — is a multimedia content description standard. It was standardized in ISO/IEC 15938 (Multimedia content description interface).[1][2][3][4] This description will be associated with the content itself, to allow fast and efficient searching for… … Wikipedia

MPEG-4 — MPEG 4 это международный стандарт, используемый преимущественно для сжатия цифрового аудио и видео. Он появился в 1998 году и включает в себя группу стандартов сжатия аудио и видео и смежные технологии, одобренные ISO Международной… … Википедия

MPEG-2 — ist ein generischer MPEG Standard zur Videokodierung mit Videokompression und Audiokodierung mit Audiokompression. In beiden Fällen ist es eine verlustbehaftete Kompression/Datenreduktion. Inhaltsverzeichnis 1 Einführung 2 Übersicht 3 MPEG 2… … Deutsch Wikipedia

MPEG — 〈EDV; Abk. für engl.〉 Moving Pictures Experts Group (Expertengruppe für bewegte Bilder), eine Bildkomprimierung für Bewegtbilder * * * MPEG [Abk. für Moving Pictures Experts Group, dt. »Expertengruppe für bewegte Bilder«], eine Arbeitsgruppe… … Universal-Lexikon

MPEG 4 — ist ein MPEG Standard (ISO/IEC 14496), der unter anderem Verfahren zur Video und Audiodatenkompression beschreibt. Ursprünglich war das Ziel von MPEG 4, Systeme mit geringen Ressourcen oder schmalen Bandbreiten (Mobiltelefon, Video Telefon, . )… … Deutsch Wikipedia

MPEG — (англ. Moving Picture Experts Group; произносится «эмпег» рус. Экспертная группа по движущемуся изображению) группа специалистов, сформированная международной организацией ISO для выработки стандартов сжатия и передачи цифровой… … Википедия

MPEG-7 — ist ein im Jahr 2002 verabschiedeter ISO Standard (ISO/IEC 15938), der von der Moving Picture Experts Group, kurz MPEG, definiert wurde. MPEG 7 ist eine Kurzform, die eigentliche Bezeichnung lautet Multimedia Content Description Interface.… … Deutsch Wikipedia

MPEG-4 — ist ein MPEG Standard (ISO/IEC 14496), der unter anderem Verfahren zur Video und Audiodatenkompression beschreibt. Ursprünglich war das Ziel von MPEG 4, Systeme mit geringen Ressourcen oder schmalen Bandbreiten (Mobiltelefon, Video Telefon, . )… … Deutsch Wikipedia

MPEG-7 — consiste en una representación estándar de la información audiovisual que permite la descripción de contenidos (metadatos) para: Palabras clave Significado semántico (quién, qué, cuándo, dónde) Significado estructural (formas, colores, texturas,… … Wikipedia Español

.mpeg — 1 Le MPEG 1 est une norme de compression vidéo et audio définie par le standard ISO/IEC 11172, élaborée par le groupe MPEG en 1988. Ce groupe a pour but de développer des standards internationaux de compression, décompression, traitement et… … Wikipédia en Français

Семейство форматов MPEG. Часть первая — MPEG-1.

История семейства форматов MPEG, к которому собственно и принадлежит стремительно набирающий в последнее время популярность формат MPEG-4, началась в далеком 1988 году. Именно в этом году был основан комитет Moving Pictures Expert Group, что на русский переводится примерно как экспертная группы кинематографии (движущихся изображений), аббревиатура которого — MPEG известна теперь любому, кто имел дело с мультимедиа — компьютерами или с цифровым телевидением. В этом же году была начата разработка формата MPEG-1, который в окончательном виде был выпущен в 1993 году. Несмотря на все очевидные недостатки этого формата, MPEG-1 по-прежнему является одним из наиболее массовых форматов видеосжатия, лишь в последнее время, начиная постепенно сдавать позиции под натиском более новых и совершенных форматов видеокомпрессии, по большей части из этого же семейства.

Надо сказать, что практически все новаторские по тем временам разработки легшие в основу формата MPEG-1, в том или ином виде встречаются и более совершенных форматах данного ряда, поэтому, рассмотрев в подробностях первого представителя этого семейства форматов видеосжатия можно получить общее представление о том, как же работают алгоритмы MPEG.

Формат MPEG-1. Старый, но еще не побежденный.

Формат MPEG-1 начал разрабатываться в те трудно вообразимые времена, когда не было широкодоступных носителей большого объема, в то время, как видеоданные, даже и сжатые, занимали совершенно колоссальные для конца 80-х объемы — средней продолжительности фильм имел размер больше гигабайта. Если кто не помнит, то это была эпоха 286 и 386 процессоров, 4 Мб оперативной памяти и 250 Мб винчестер считались роскошью, а не убогостью, как сейчас, Windows была примочкой для DOS, а не наоборот, а в качестве легко переносимых носителей информации доминировали 5 дюймовые дискеты и только-только появившиеся 3,5″ дискеты от фирмы SONY. В таких условиях необходимо было найти носитель, на который можно было бы записать гигабайт информации, при этом этот носитель должен был быть недорогим, иначе ни о какой массовости не могло быть и речи.

Читать еще:  Беспроводные TWS-наушники Sony WF-XB700 оценены в $130

И такой носитель был найден. Как раз в эти годы впервые на платформе PC появился такой новый тип носителей информации как CD-ROM диски, которые смогли обеспечить необходимый объем информации. Правда, на один диск фильм в формате MPEG-1 все-таки не вмещался, но что мешало записать его на 2 CD, тем более, что новинка стоила очень недорого? Разумеется, первые CD-ROM проигрыватели были односкоростными, поэтому не стоит удивляться, что максимальная скорость пересылки потока данных (bitstream) в формате MPEG-1 ограничена 150 Кб/сек., что соответствует одной скорости CD-ROM.

Надо сказать, что возможности MPEG-1 не ограничены тем низким разрешением, которое вы все видели при просмотре VIDEO-CD. В самом формате была заложена возможность сжатия и воспроизведения видеоинформации с разрешением вплоть до 4095х4095 и частотой смены кадров до 60 Гц. Но из-за того, что поток передачи данных был ограничен 150 Кб/сек., то есть так называемый Constrained Parameters Bitstream (CPB) — зафиксированная ширина потока передачи данных, разработчики формата, а в дальнейшем и создатели кодеков на его основе, были вынуждены использовать разрешения кадра, оптимизированные под данный CPB. Наиболее широко распространенными являются два таких оптимизированных формата — это формат SIF 352х240, 30 кадров в секунду и урезанный формат PAL/SECAM 352х288, 25 кадров в секунду.

Ну вот, с разрешением определились, теперь можно и посмотреть, как это все сжимается.

Принципы Сжатия информации в MPEG-1.

В качестве примера рассмотрим урезанный формат PAL/SECAM, который более распространен, чем SIF, хотя оба эти формата за исключением разрешения и частоты смены кадров ничем друг от друга не отличаются.

Урезанная версия формата PAL/SECAM содержит 352 ppl (point per line — точек на линию), 288 lpf (line per frame — линий на кадр) и 25 fps (frame per second — кадров в секунду). Надо сказать, что полноценный стандарт PAL/SECAM имеет параметры в 4 раза большие, чем аналогичные у MPEG-1 (кроме fps). Поэтому принято говорить, что VIDEO-CD имеет четкость в четыре раза хуже, по сравнению с обычным видео.

Что касается глубины цвета, то тут не все так просто, как в компьютерной графике, где на каждый пиксел отводится определенное фиксированное число бит. MPEG-1 использует цветовую схему YСbCr, где Y — это яркостная плоскость, Сb и Cr — плоскости цветовые. Эти плоскости кодируются с разным разрешением. Существуют несколько вариантов кодирования, которые можно представить с следующем виде:

Как видно из таблицы Сb и Cr практически всегда кодируются с меньшим разрешением, чем Y. Чем меньше разрешение цветовых плоскостей, тем грубее и неестественнее цветопередача в видеоролике. Разумеется, самым некачественным, но и самым компактным будет последний вариант.

Перед началом кодирования происходит анализ видеоинформации, выбираются ключевые кадры, которые не будут изменяться при сжатии, а так же кадры, при кодировании которых часть информации будет удаляться. Всего выделяется три типа кадров:

  1. Кадры типа I — Intra frame. Ключевые кадры, которые сжимаются без изменений.
  2. Кадры типа P — Predirected frame. При кодировании этих кадров часть информации удаляется. При воспроизведении P кадра используется информация от предыдущих I или P кадров.
  3. Кадры типа В — Bidirectional frame. При кодировании этих кадров потери информации еще более значительны. При воспроизведении В кадра используется информация уже от двух предыдущих I или P кадров. Наличие В кадров в видеоролике — тот самый фактор, благодаря которому MPEG-1 имеет высокий коэффициент сжатия (но и не очень высокое качество).

При кодировании формируется цепочка кадров разных типов. Наиболее типичная последовательность может выглядеть следующим образом: IBBPBBPBBIBBPBBPBB. Соответственно очередь воспроизведения по номерам кадров будет выглядеть так: 1423765.

По окончании разбивки кадров на разные типы начинается процесс подготовки к кодированию.

С I кадрами процесс подготовки к кодированию происходит достаточно просто — кадр разбивается на блоки. В MPEG-1 блоки имеют размер 8х8 пикселов.

А вот для кадров типа P и B подготовка происходит гораздо сложнее. Для того, чтобы сильнее сжать кадры указанных типов используется алгоритм предсказания движения.

В качестве входной информации алгоритм предсказания движения получает блок 8х8 пикселов текущего кадра и аналогичные блоки от предыдущих кадров (I или P типа). На выходе данного алгоритма имеем следующую информацию о вышеуказанном блоке:

  1. Вектор движения текущего блока относительно предыдущих
  2. Разницу между текущим и предыдущими блоками, которая собственно и будет подвергаться дальнейшему кодированию.

Вся избыточная информация подлежит удалению, благодаря чему и достигается столь высокий коэффициент сжатия, невозможный при сжатии без потерь.

Но у алгоритма предсказания движения есть ограничения. Зачастую в фильмах бывают статические сцены, в которых движения нет или оно незначительно и возникают блоки или целые кадры, в которых невозможно использовать алгоритм предсказания движения. Думаю, вы замечали, что у видеороликов сжатых MPEG-1 качество сцен с небольшим количеством двигающихся объектов заметно выше, чем в сценах с интенсивным движением. Это объясняется тем, что в статических сценах P и B кадры, по сути, представляют собой копии I кадров, потерь практически нет, но и сжатие информации незначительно.

В случае же корректного срабатывания алгоритма предсказания движения, объемы кадров разного типа в байтах соотносятся друг с другом примерно следующим образом — I:P:B как 15:5:2. Как вы видите из данного соотношения, уменьшение объема видеоинформации налицо уже на стадии подготовки к кодированию.

По окончании этой стадии начинается собственно само кодирование. Процесс кодирования содержит в себе 3 стадии:

  1. Discrete Cosine Transformation — DTC, дискретное преобразование косинусов, преобразование Фурье.
  2. Quantization — квантование. Перевод данных из непрерывной формы в прерывистую, дискретную.
  3. Преобразование полученных блоков данных в последовательность, то есть преобразование из матричной формы в линейную.

При кодировании блоки пикселов или вычисленная разница между блоками обрабатывается первым из преобразующим алгоритмов — DTC (дискретное преобразование косинусов). Обычно пиксела в блоке и сами блоки изображения каким-то образом связаны между собой — например однотонный фон, равномерный градиент освещения, повторяющийся узор и т.д. Такая связь называется корреляцией. Алгоритм DTC, используя коррелирующие эффекты, производит преобразование блоков в частотные фурье-компоненты. При этом часть информации теряется за счет выравнивания сильно выделяющихся участков, которые не подчиняются корреляции. После этой процедуры в действие вступает алгоритм Quantization — квантование, который формирует Quantization matrix. Quantization matrix — это матрица квантования, элементами которой являются преобразованные из непрерывной в дискретную форму данные, то есть числа, которые представляют собой значения амплитуды частотных фурье-компонентов. После формирования quantization matrix происходит разбивка частотных коэффициентов на конкретное число значений. Точность частотных коэффициентов фиксирована и составляет 8 бит. После квантования многие коэффициенты в матрице обнуляются. И в качестве завершающей стадии происходит преобразование матрицы в линейную форму.

Все эти преобразования касаются только изображения. Но кроме изображения в практически любом видеофрагменте присутствует так же и звук. Кодирование звука осуществляется отдельным звуковым кодером. По мере развития формата MPEG, звуковые кодеры неоднократно переделывались, становясь все эффективнее. К моменту окончательной стандартизации формата MPEG-1 было создано три звуковых кодера этого семейства — MPEG-1 Layer I, Layer II и Layer 3 (тот самый знаменитый MP3). Принципы кодирования всех этих кодеков основаны на психоакустической модели, которая становилась все более и более совершенной и достигла своего апофеоза для семейства MPEG-1 в алгоритмах Layer-3.

Про психоакустическую модель и принципы сжатия аудиоданных с потерями написано множество статей, в частности статья «Описание формата аудиосжатия MP3», которую вы можете прочитать на этом сайте, поэтому описание аудиокодеров можно опустить, упомянув, единственно о синхронизации аудио- и видеоданных и форматов аудиотреков.

Синхронизация аудио- и видеоданных осуществляется с помощью специально выделенного потока данных под названием System stream. Этот поток содержит встроенный таймер, который работает со скоростью 90 КГц и содержит 2 слоя — системный слой с таймером и служебной информацией для синхронизации кадров с аудиотреком и компрессионный слой с видео- и аудиопотоками.

Под служебной информацией понимаются несколько видов меток, наиболее важными из которых являются метки SCR (System Clock Reference) — инкремент увеличения временного счетчика кодека и PDS (Presentation Data Stamp) — метка начала воспроизведения видеокадра или аудиофрейма.

Ну вот рассказ о MPEG-1 практически подошел к концу, осталось лишь назвать некоторые параметры аудиотреков, которые используются в этом формате.

Качество аудиотреков в MPEG-1 может варьироваться в очень больших пределах — от высококачественных до безобразных. Окончательно все форматы сжатия аудиоданных были стандартизированы в 1992 году европейской комиссией по стандартам ISO.

В зависимости от используемого кодера и степени сжатия аудиоинформация видеоролика может быть представлена в следующем виде: моно, dual mono, стерео, интенсивное стерео (стереосигналы, чьи частоты превышают 2 КГц объединяются в моно), m/s стерео (один канал — сумма сигналов, другой — разница) и по частоте дискретизации могут быть: 48, 44.1и 32 КГц.

На этом хватит о MPEG-1, а в следующих главах речь пойдет о его более чем достойных и перспективных наследниках.

Форматы AVI, MPEG–4, MPEG–2, MOV и др.

AVI

Audio Video Interleave (сокращённо AVI; букв. Чередование Аудио и Видео) — RIFF-медиа-контейнер, впервые использованный Microsoft в 1992 году.

Формат файлов с расширением .avi известен как медиа-контейнер, это формат файлов, так же как MP3 или JPG. Но, в отличие от этих форматов, AVI — это формат-контейнер. Это означает, что он может содержать видео/аудио данные, сжатые с использованием разных комбинаций кодеков, что позволяет синхронно воспроизводить видео со звуком. Так, если MP3 и JPG файлы построены на использовании только основного вида компрессии данных (MPEG Audio Layer 3 и JPEG), AVI файл может содержать различные виды компрессированных данных (например, DivX — видео + WMA — аудио или Indeo — видео + PCM — аудио), в зависимости от того, какой кодек используется для кодирования/декодирования. Как и DVD, AVI файлы поддерживают многопотоковое аудио-видео. AVI-файлы могут содержать различные виды сжатых данных, к примеру DivX для видео-информации и MP3 для аудио. Все AVI файлы выглядят одинаково «снаружи» (имеют расширение .AVI), но «внутри» они могут отличаться очень сильно.

AVI файлы могут быть проиграны различными плеерами, но плеер должен поддерживать кодек, используемый для кодирования данного видео. Слово кодек – происходит от слов КОдировать и ДЕКодировать.
Для воспроизведения рекомендуем установить K-Lite Codec Pack Full, лучший набор кодеков и инструментов для проигрывания аудио и видео любых форматов. И, что важно, содержит Media Player Classic, мощнейший проигрыватель, имеющий поддержку всех существующих форматов, воспроизведение видео DVD без каких-либо дополнительных программ, возможность воспроизведения видео с какого-либо видеовхода: будь то ТВ–приёмник, карта видеозахвата или цифровая видеокамера, подключенная по цифровому интерфейсу.

MOV

QuickTime — технология Apple Computer, разработанная в 1989 году, для воспроизведения цифрового видео, звука, текста, анимации, музыки и панорамных изображений в различных форматах.

Читать еще:  Суфлеры-полиглоты или кое-что о контекстных переводчиках

QuickTime также является мультимедийным фреймворком, который могут использовать другие программы. Некоторые программы используют QuickTime для выполнения своих мультимедийных задач — например iTunes, iMovie и Final Cut Pro производства самой Apple, а также различное программное обеспечение сторонних производителей, например компания Adobe в новой версии Photoshop CS4.

Для просмотра видео в форматах RealVideo (*.rm, *.rv, *.ram) и QuickTime (*.mov, *.qt) можно установить «родную» программу: RealPlayer или QuickTime Player. При этом в систему будут установлены необходимые кодеки.

MPEG-1

MPEG-1 видео был исходно разработан с целью достичь приемлемого качества для видео на потоках 1.5 Мегабита/c и разрешении 352×240. Несмотря на то, что MPEG-1 применяется для кодирования с низким разрешением и низким bitrate’ом, стандарт позволяет использовать любое разрешение до 4095×4095. Большинство реализаций разработаны с учетом спецификации Constrained Parameter Bitstream.

MPEG–2

Группа стандартов цифрового кодирования видео и аудио сигналов, одобренных ISO — Международной Организацией по стандартизации/IEC Moving Picture Experts Group (MPEG). Стандарт MPEG-2 в основном используется для кодирования видео и аудио при вещании, включая спутниковое вещание и кабельное телевидение. MPEG-2 с некоторыми модификациями также активно используется как стандарт для сжатия DVD. Использование MPEG-2 требует уплаты лицензионных отчислений держателям патентов через MPEG Licensing Association.

Сегодня существует множество программ для воспроизведения видео в формате MPEG–2, например с видео DVD. Многие такие программы также поддерживают воспроизведение видео в формате цифрового спутникового и кабельного телевидения: MPEG–2 Transport Stream.

MPEG-4

Международный стандарт, используемый преимущественно для сжатия цифрового аудио и видео. Он появился в 1998 году, и включает в себя группу стандартов сжатия аудио и видео и смежные технологии, одобренные ISO — Международной Организацией по стандартизации/IEC Moving Picture Experts Group (MPEG). Стандарт MPEG-4 в основном используется для вещания (потокоое видео), записи фильмов на компакт-диски, видеотелефонии (видеотелефон) и широковещания, в которых активно используется сжатие цифровых видео и звука.

Стандарт MPEG-4 задумывался как способ передачи потоковых медиаданных, в первую очередь видео, по каналам с низкой пропускной способностью. Неожиданно он завоевал популярность у пользователей, благодаря тому, что позволил размещать полнометражные фильмы длительностью полтора-два часа в хорошем качестве всего на одном компакт-диске и осуществлять обмен видео-файлами в Интернет.

WMV

Windows Media Video — название системы видео кодирования, разработанной компанией Microsoft для хранения и трансляции видео-информации.

Дальнейшее развитие формата AVI. Разработан фирмой Microsoft в самом конце 90-х годов как часть инициативы Windows Media (создание набора аппаратных и программных средств, направленных на улучшение мультимедийных возможностей современных Windows-совместимых компьютеров).

Видеофайлы, сохраненные в этом формате, имеют расширение wmv или asf. (Существует особая разновидность формата — WMA (Windows Media Audio), предназначенная для хранения звука, такие файлы имеют расширение wma.) По сравнению с AVI формат WMV имеет различные дополнительные возможности, в частности, средства защиты от несанкционированного копирования.


3GP

3gp (сокращение от англ. 3rd generation (mobile) phone — (мобильные) телефоны третьего поколения); видеофайлы для мобильных телефонов 3-го поколения. Некоторые современные мобильные телефоны (не обязательно 3G) имеют функции записи и просмотра аудио и видео в формате 3GP.

Этот формат — упрощённая версия ISO 14496-1 Media Format, который похож на MOV, используемый QuickTime.

3gp сохраняет видео как MPEG-4 или H.263. Аудио сохраняется в форматах AMR-NB или AAC-LC.

Готовые видео ролики в формате 3gp имеют малый размер по сравнению с другими форматами видео, но к сожалению это сильно отражается на качестве (оно очень низкое). Читается многими плеерами, в том числе QuickTime Player

Плееры

Очень мощный мультимедиа плеер. Включает в себя большое количество функций, обеспечивающих высокий уровень воспроизведения. С GOM Player Вы сможете воспроизводить даже поврежденные или не до конца загруженные / переписанные AVI файлы.

Мощнейший проигрыватель, имеющий поддержку всех существующих форматов, входит в пакет K-Lite Codec Pack . Рекомендуем.

Универсальный проигрыватель мультимедиа для воссоздания большого количества форматов аудио и видео (MPEG-1, MPEG-2, MPEG-4, DIVX, DVD, VCD), совмещающий высокое качество и простоту в управлении.

Компонент для браузеров Internet Explorer, Firefox, Safari, Opera, позволяющий проигрывать Flash-ролики (swf файлы), маленькие по размерам, но довольно качественные и поражающие своими эффектами заставки, игры, сайты и т.д., основанные на Flash-технологии.

Проигрывает как файлы собственного формата (mov), широко представленного в интернете (QT), так и наиболее распространенные медиаформаты, включая 3gp. Во многих случаях незаменим для просмотра потокового видео из Интернет.

Конвертеры

Конвертирует почти все файлы мультимедиа (аудио, видео, графика, фото, флэш и т.д.), а также телефонные файлы, включая фалы iPhone и iPod от Apple. Причем делает это быстро и качественно.

Программа, которая конвертирует видео файлы любого формата в DVD формат и тут же записывает на DVD диск с автоматическим созданием функционального DVD меню.

MPEG2 VS. MPEG4: все, что вы хотите знать, здесь

MPEG — это группа экспертов Moving Pictures, рабочая группа органов власти, которая была сформирована ISO и IEC для установления стандартов сжатия и передачи звука и видео. Он был создан в 1988 по инициативе Хироши Ясуды (Nippon Telegraph and Telephone) и Леонардо Чиарильоне, председателя группы с момента ее создания. Первая встреча MPEG состоялась в мае 1988 в Оттаве, Канада. По состоянию на конец 2005, MPEG вырос, чтобы включать приблизительно членов 350 на встречу из разных отраслей, университетов и научно-исследовательских институтов.

Формат MPEG используется на нескольких носителях. На этом снимке представлены некоторые из наиболее известных носителей для формата MPEG и формата контейнера (TS и PS).

Стандарты MPEG состоят из разных частей: MPEG-1, MPEG-2, MPEG-3, MPEG-4, MPEG-7, MPEG-21. Каждая часть охватывает определенный аспект всей спецификации. Среди них две самые популярные технологии сжатия и декомпрессии называются MPEG2 и MPEG4.

Что такое MPEG2?

MPEG2 был выпущен в 1995, стандарте для «общего кодирования движущихся изображений и связанной аудиоинформации». Стандарты для транспорта, видео и аудио для телевидения с широковещательным качеством. Стандарт MPEG2 был значительно шире по охвату и более широкому кругу призывов — поддержка чересстрочной развертки и высокой четкости. MPEG-2 считается важным, поскольку он был выбран в качестве схемы сжатия для эфирного цифрового телевидения ATSC, DVB и ISDB, услуг цифрового спутникового телевидения, таких как Dish Network, цифровых сигналов кабельного телевидения, SVCD и DVD Video. Он также используется на дисках Blu-ray, но обычно они используют MPEG-4 Part 10 или SMPTE VC-1 для контента высокой четкости.

Часть 2. Что такое MPEG4?

MPEG4 был выпущен в 1999, и это метод определения сжатия аудио и визуальных (AV) цифровых данных. MPEG4 использует дополнительные средства кодирования с дополнительной сложностью для достижения более высоких коэффициентов сжатия, чем MPEG2. В дополнение к более эффективному кодированию видео MPEG4 приближается к приложениям компьютерной графики. В более сложных профилях декодер MPEG4 фактически становится процессором рендеринга, а сжатый поток бит описывает трехмерные формы и текстуру поверхности. MPEG4 поддерживает технологию управления и защиты интеллектуальной собственности (IPMP), которая предоставляет возможность использовать проприетарные технологии для управления и защиты контента, например, управления цифровыми правами.

Различия между MPEG2 и MPEG4

Теперь мы объясним, как кодировщики MPEG2 и MPEG4 обрабатывают сжатие, размер файла, качество, скорость передачи данных, пропускную способность, расширения имен файлов и приложения.

MPEG2 против MPEG4 — Сжатие

И MPEG2, и MPEG4 могут поддерживать одинаковое качество звука или видео в кодировке. MPEG2 использует кодировку H.262, в то время как MPEG4 использует H.264. Хотя сжатие MPEG2 намного проще MPEG4, сжатие MPEG4 является улучшением по сравнению с форматом MPEG2. Это связано с тем, что используемый алгоритм MPEG4 гарантирует высококачественный видеоэффект с относительно меньшим размером файла, в то же время сохраняя поток видео в битах. По сравнению с MPEG2, MPEG4 является гораздо более универсальным форматом кодирования.

MPEG2 vs MPEG4 — Размер файла

MPEG2 кодированные видео файлы намного больше по сравнению с MPEG4. Поскольку алгоритм сжатия MPEG4 предназначен для создания файлов, которые могут использоваться в передачах через Интернет / сеть. Файлы MPEG2 всегда хранятся на DVD-дисках, что приводит к большей емкости.

MPEG2 vs MPEG4 — Качество

MPEG2 обеспечивает безупречное качество, превосходящее MPEG-4. MPEG2 является отраслевым стандартом и способен обрабатывать видеопотоки из местных источников, таких как DVD и широковещательные приложения. Однако, к сожалению, из-за большего размера файла он не подходит для интернет-или сетевых приложений. С другой стороны, MPEG4 использует высокую скорость сжатия и меньшие размеры файлов для обеспечения высококачественного видео и звука в мультимедийных потоковых приложениях в Интернете.

MPEG2 против MPEG4 — скорость передачи и пропускная способность

Файлы с кодировкой в ​​формате MPEG2 имеют битрейт от 5 до 80 Mbits / sec, в то время как файлы MPEG4 существенно ниже относительно MPEG-2 (некоторые килобайты в секунду). Поэтому формат MPEG4 предназначен для сетевых приложений.

Если вы сравните пропускную способность MPEG2 и MPEG4, вы найдете огромную разницу, поскольку они предназначены для разных платформ. Для MPEG2 требуется гораздо больше полосы пропускания для потоковой передачи по сравнению с MPEG4. MPEG2 имеет пропускную способность до 40 МБ в секунду, но MPEG4 имеет пропускную способность около 64 kbps.

MPEG2 vs MPEG4 — Расширения файлов

MPEG2: .mpg, .mpeg, .m2v, .mp2, mp3 — это некоторые из расширений имен файлов, используемых для форматов аудио и видео форматов MPEG-1 или MPEG-2.

MPEG4: .mp4, .m4a, .m4b, .m4r, .m4v — это некоторые расширения файлов видео / аудио MPEG4.

MPEG2 vs MPEG4 — приложение

Оба формата используются сегодня для разных приложений. MPEG-2 по-прежнему используется для DVD и телевизионного вещания, в то время как MPEG4 — это способ кодирования для портативных устройств и потоковой передачи в Интернете.

Одно несомненно, по сравнению с MPEG2, MPEG4 — это более эффективный и универсальный видеоформат для технологии кодирования видео с символами высокой степени сжатия, малыми размерами, низкими требованиями к ширине полосы пропускания и широкими приложениями. Поскольку MPEG2 — это метод кодирования для DVD-дисков, поэтому, если у вас есть некоторые DVD-диски и вы хотите воспроизвести их на портативных устройствах или для использования в Интернете, как это сделать? Копирование DVD в MPEG4 было бы хорошим выбором. В любом случае, MPEG2 и MPEG4 являются популярными форматами, которые применяются к различным полям. Разница заключается в ваших конкретных требованиях.

Карен Нельсон является редакционным директором VideoSolo, который регулярно пишет высококачественные обучающие материалы, обзоры, советы и рекомендации.

Ссылка на основную публикацию
Статьи c упоминанием слов:
Adblock
detector