авторефераты диссертаций БЕСПЛАТНАЯ БИБЛИОТЕКА РОССИИ

КОНФЕРЕНЦИИ, КНИГИ, ПОСОБИЯ, НАУЧНЫЕ ИЗДАНИЯ

<< ГЛАВНАЯ
АГРОИНЖЕНЕРИЯ
АСТРОНОМИЯ
БЕЗОПАСНОСТЬ
БИОЛОГИЯ
ЗЕМЛЯ
ИНФОРМАТИКА
ИСКУССТВОВЕДЕНИЕ
ИСТОРИЯ
КУЛЬТУРОЛОГИЯ
МАШИНОСТРОЕНИЕ
МЕДИЦИНА
МЕТАЛЛУРГИЯ
МЕХАНИКА
ПЕДАГОГИКА
ПОЛИТИКА
ПРИБОРОСТРОЕНИЕ
ПРОДОВОЛЬСТВИЕ
ПСИХОЛОГИЯ
РАДИОТЕХНИКА
СЕЛЬСКОЕ ХОЗЯЙСТВО
СОЦИОЛОГИЯ
СТРОИТЕЛЬСТВО
ТЕХНИЧЕСКИЕ НАУКИ
ТРАНСПОРТ
ФАРМАЦЕВТИКА
ФИЗИКА
ФИЗИОЛОГИЯ
ФИЛОЛОГИЯ
ФИЛОСОФИЯ
ХИМИЯ
ЭКОНОМИКА
ЭЛЕКТРОТЕХНИКА
ЭНЕРГЕТИКА
ЮРИСПРУДЕНЦИЯ
ЯЗЫКОЗНАНИЕ
РАЗНОЕ
КОНТАКТЫ


Pages:     | 1 || 3 | 4 |   ...   | 6 |

«МИНОБРНАУКИ РОССИИ УДК 621.3(075.8) ФЕДЕРАЛЬНОЕ ГОСУДАРСТВЕННОЕ БЮДЖЕТНОЕ ОБРАЗОВАТЕЛЬНОЕ ББК 32.94я73 ...»

-- [ Страница 2 ] --

Технико-экономические показатели включают в себя низкое энергопотребление, относительно небольшие размеры и массу видеокамер, видеомагнитофонов и видеокассет. Технологические особенности заключаются в наличии многих вспомогательных функций, возможности совместной работы с оборудованием других форматов видеозаписи, высокой степени автоматизации, что облегчает работу по обслуживанию регулированию оборудования. В видеосистеме Betacam применен формат записи сигнала, при котором запись сигналов яркости (У) и цветности (CR, CB) производится на отдельные видеодорожки разными видеоголовками.

Ширина видеоленты равна 12,65 мм, ширина наклонных видеодорожек - 80 мкм.

В верхней части видеоленты расположены две продольные дорожки, каждая шириной 0,6 мм, для записи звуковых сигналов (канал звука I и канал звука II). В нижней части ленты размещаются дорожка синхросигнала (сигнала управления) шириной 0,4 мм и дорожка адресно-временного кода шириной 0,5 мм.

Универсальные видеоголовки сигналов яркости и сигналов цветности разнесены на угол 6,767° и смещены по высоте относительно друг друга на 0,07-0,08 мм, а вдоль видеоленты - на 4,4 мм. Каждой паре видеоголовок предшествует вращающаяся головка стирания, которая обеспечивает дополнительные возможности при видеозаписи.

Наличие этой головки позволяет осуществлять «чистое» (без срыва изображения и помех) продолжение видеозаписи в месте, где уже имеется сигналограмма.

Имеется также общая головка стирания с длиной зазора во всю ширину ленты, головка записи/воспроизведения управляющего синхросигнала, универсальная звуковая двухканальная головка и в этом же корпусе расположенная головка записи/воспроизведения адресно-временного кода. Воспроизводящая звуковая головка служит для контроля сигнала во время записи (сквозной канал) и считывает одновременно сигна-лограмму I и II звуковых каналов. Если сигнал яркости Y занимает всю строку развертки, то сигналы цветности CR, CB записываются методом временного уплотнения, причем каждый занимает поочередно половину видеодорожки.

При записи цветоразностные сигналы задерживаются на время, равное длительности одной строки телевизионной развертки (Н), и при воспроизведении еще раз на то же время. Оба промежутка времени задержки цветоразностных сигналов относительно сигнала яркости составляют 2Н. Эта задержка компенсируется действием линий задержки при воспроизведении сигналограммы. Всего на одной видеодорожке располагается 312,5 телевизионной строки для стандарта видеосигнала 625 строк/ полей. Раздельная запись сигналов яркости и цветности и временное уплотнение цветоразностных сигналов полностью устраняют перекрестные искажения между этими сигналами и позволяют обеспечить полосу частот каждого из цветоразностных сигналов 1,5 МГц - значительно шире, чем при обычной частотной модуляции.

На рис.2.1 приведена структурная схема видеоканала записи видеомагнитофона Betacam.

Рис. 2. На вход должны поступать компонентные видеосигналы. Как видно из схемы, сигнал яркости с введенными в смесителе 1 синхроимпульсами проходит фиксирующую цепь 2 и поступает на ЧМ-модулятор 3. Затем частотно-модулированный сигнал яркости через усилители записи и вращающийся трансформатор 5 подается на две записывающие видеоголовки сигнала яркости 6. Цветоразностные сигналы R - Y и В - Y поступают после ограничивающих фильтров 7 на схемы временного уплотнения сигналов цветности 8, где осуществляется временное уплотнение в два раза. Мульти плексор 9 осуществляет выборку сигналов цветности в зависимости от воздействия сигналов управления генератора тактовых импульсов 12 и формирователя 13. После ввода синхроимпульсов комбинированный сигнал цветности проходит фиксирующую цепь 10 и поступает на частотный модулятор II. Затем через усилители записи 4 и вращающийся трансформатор этот сигнал подается на две записывающие головки сигналов цветности.

Генератор 12, а также формирователь 15, блокирующий усилители записи 4, синхронизируются от электронного блока управления приводом видеомагнитофона.

Усилитель воспроизведения ВЧ-сигнала 14 обеспечивает для схемы привода выделение сигнала расположения сточек записи.

Основные характеристики ВМ формата Betacam приведены в таблице 2.1.

Таблица 2. Betacam SP, SP 2000Pro, SP Дальнейшим развитием формата Betacam явилось создание линейки оборудования, получившего название Betacam SP. Аббревиатуру SP (superior performance) дословно можно перевести как «превосходная харак теристика».

Полученное в устройствах Betacam SP высокое качество передачи видео- и звукового сигнала, а также широкое применение формата Betacam в видеожурналистике и во внестудийном производстве в мире заставило даже такие ведущие фирмы производители, как Атрех (США) и BTS (ФРГ), начать лицензионный выпуск оборудования формата Betacam SP по разработке фирмы Sony.

В таблице 2.2 представлены основные показатели видеомагнитофонов форматов Betacam и Betacam SP. Существенное расширение полосы записываемых видеосигналов в формате Betacam SP достигнуто изменением параметров обработки видеосигнала, применением металлопорошковой магнитной ленты использованием новых схемотехнических решений и высококачественной элементной базы. В частности, выбраны новые граничные частоты с сохранением диапазона девиации частоты ЧМ сигнала.

Таблица 2. В видеомагнитофонах Betacam SP к двум стандартным продольным дорожкам записи звукового сигнала добавлены два канала с более высоким качеством звукопередачи. Запись осуществляется методом частотной модуляции с несущей 1, МГц (рис. 4.8) двумя отдельными вращающимися головками в той же зоне на ленте, где записывается видеосигнал. При таком техническом решении обеспечивается частотный диапазон звукового сигнала от 20 до 20000 Гц и динамический диапазон свыше 70 дБ.

Оборудование форматов Betacam и Betacam SP полностью совместимы по видеосигналу между собой. В них могут быть использованы одинаковые типы магнитных лент. Однако улучшенные характеристики, достигнутые в Betacam SP, не реализуются в Betacam, и, наоборот, записи, выполненные на Betacam, не приобретают улучшения при воспроизведении на видеомагнитофонах Betacam SP.

Формат Betacam SP оказался для большинства потенциальных пользователей избыточным, как по функциям и качеству, так и по цене. Поэтому была разработана более дешевая серия оборудования Betacam SP- 2000Pro. Уровень этого оборудования очень высок, несмотря на то, что его удешевление произошло в ущерб качеству воспроизводимого изображения и надежности механизмов. Характеристики формата следующие: качество изображения ниже, чем в SP;

отношение сигнал/шум 48 дБ, полоса 5,5 МГц, метод записи компонентный, как и у SP;

удовлетворительная компенсация выпадений. Возможности практически те же, что и в Betacam SP, но имеются только два звуковых канала.

Поскольку в середине 90-х годов стало появляться довольно много малобюджетных региональных и кабельных телевизионных центров, производственных и тиражных компаний, возник большой спрос на недорогое видеооборудование с пониженными требованиями к качеству и возможностями. Для удовлетворения растущего спроса была создана новая дешевая серия Betacam SP UVW, или серия 1000.

Удешевление оборудования произошло в ущерб качеству воспроизводимого изображения функциональным возможностям. Характеристики формата следующие:

качество изображения ниже, чем в SP 2000Рго;

отношение сигнал/шум 46 дБ;

полоса МГц;

метод записи компонентный, как и в SP;

неглубокая компенсация выпадений.

Видеомагнитофоны формата VHS Запись сигнала изображения в видеомагнитофонах формата VHS производится с помощью двух вращающихся видеоголовок, расположенных под углом 180° на барабане диаметром 62 мм. Частота вращения барабана - 25 Гц, скорость движения ленты - 23, мм/с. Скорость движения видеоголовки относительно ленты - 4,84 м/с. Значения параметров приведены в таблице 2.3.

Таблица 2. В формате VHS запись сигнала производится с предварительным пре образованием спектра. В канале записи из полного цветового сигнала выделяются сигналы яркости и цветности, а наиболее яркие участки изображения (номинальный уровень белого) — частотой 4,4 МГц. Для сигналов PAL и SECAM девиация частоты находится в пределах 1 МГц со значениями 3,8 и 4,8 МГц соответственно. Спектр сигнала цветности путем гетеродинирования переносится в область нижних частот от до 1 МГц. При сложении его с ЧМ-сигналом яркости получается записываемый сигнал.

Для ослабления взаимных помех, возникающих при воспроизведении сигналов цветности с соседних видеодорожек, во время записи ТВ-сигнала изменяют на 90° фазу сигнала цветности так, чтобы в сигналах цветности, соответствующих соседним видеодорожкам, фазы были взаимно противоположны. Соответственно, при воспроизведении производится обработка сигналов с целью восстановления сигнала цветности, в результате чего практически полностью подавляются составляющие перекрестных помех.

Построчная коммутация фазы сигнала поднесущей цветности при записи применяется только для ТВ-сигнала по стандартам PAL и NTSC. Запись сигналов звукового сопровождения в формате VHS производится двумя способами: прямой записью на продольные дорожки стационарными магнитными головками и записью вращающимися магнитными головками, дополнительно установленными на БВГ. Во втором случае звуковой сигнал подвергается преобразованию для получения ЧМ сигнала.

На базе формата VHS был разработан формат VHS-C. В нем применена кассета, имеющая объем в четыре раза меньше объема кассеты VHS и более чем в четыре раза легче. Кассеты формата VHS-C получили название компакт- видеокассет или видеокассет С. Применение таких кассет позволило значительно уменьшить размеры и массу видеомагнитофонов. Ширина магнитной ленты в кассете С - 12,65 мм.

Расположение строчек видеозаписи и дорожек записи такое же, как в формате VHS, только формируются они в ЛПМ, отличном от базового формата. Количество записывающих видеоголовок увеличено до четырех, увеличен также угол охвата БВГ (до 270°), а диаметр барабана с вращающимися видеоголовками уменьшен.

Дальнейшим развитием формата VHS явился формат Super VHS, который характеризуется более высокой разрешающей способностью по горизонтали (400 твл), меньшими перекрестными помехами и более высоким значением отношения сигнал/шум. Это достигается в основном за счет существенного расширения полосы частот сигнала яркости. На рис. 2.2 приведены частотные характеристики видеосигналов в форматах VHS и S-VHS.

Рис. 2.2. Частотные характеристики видеосигналов в форматах VHS (а) и S-VHS (б) В ВМ формата S-VHS при изменении яркости передаваемого изображения от уровня вершин синхроимпульсов до номинального уровня белого принято изменение частоты ЧМ-сигнала от 5,4 до 7МГц (поднесущая сигнала яркости 6,2 МГц). Это позволило повысить отношение сигнал/шум и улучшить контраст изображения (девиация частоты повышена до 1,6 МГц по сравнению с 1 МГц в формате VHS).

В формате S-VHS ширина нижней боковой полосы ЧМ-сигнала яркости достигает 5 МГц. Сигнал цветности в обоих форматах выделяется полосовыми фильтром с центральной частотой 4,43 и полосой пропускания 1 МГц и преобразуется в сигнал с низкочастотной поднесущей 626,95 кГц (для видеосигнала PAL). При этом сигнал цветности в формате S-VHS имеет несколько более широкую полосу.

Скорость движения ленты в ВМ формата S-VHS такая же, как в ВМ формата VHS. Запись сигналов звукового сопровождения аналогична записи в формате VHS. ВМ формата S-VHS, как и аппараты формата VHS, могут работать в стандартных режимах записи/воспроизведения (SP), в режимах со сниженной в два раза (LP) или в три раза (ЕР) скоростью движения ленты.

Форматы Video-8 и Hi- В 1983 г. фирма Sony предложила новый формат видеозаписи Video-8 на ленте шириной 8 мм, а на его основе портативные видеомагнитофоны и автономные моноблочные камеры - Handycam. Благодаря малым размерам, массе аппаратуры при достаточно хорошем качестве изображения и звука и удобству ее эксплуатации, этот формат получил широкое распространение и дальнейшую заинтересованность фирм в его развитии. Этот формат ориентирован только на бытовую технику, т.к. его разрешающая способность по горизонтали составляет 250 твл. Формат был одобрен фирмами, заинтересованными в разработке и производстве соответствующего оборудования.

Тогда же фирма Sony начала работы по его усовершенствованию, и в итоге при содействии ряда заинтересованных сторон был создан широкополосный формат Hi8. По разрешающей способности и другим параметрам он вполне отвечает требованиям полупрофессионального применения, а по ряду оценок с позиций аппаратуры бытового назначения Hi8 — наилучший формат.

К достоинствам данного формата относятся: небольшая и очень легкая кассета;

металлопорошковая или металлизированная лента, а значит, более высокая плотность и увеличенная длительность записи;

конструктивная простота прецизионной лентопротяжной системы из-за отсутствия неподвижных головок;

высокочастотная несущая и широкая полоса девиации обеспечивают вполне приемлемую разрешающую способность при хорошем отношении сигнал/шум, эти данные сопоставимы и даже превосходят аналогичные характеристики формата S-VHS;

звуковой канал отвечает тре бованиям Hi-Fi.

Формат МП В конце 1990 года фирма Panasonic выпустила на рынок семейство новых моделей профессиональных видеомагнитофонов, объединенных названием МП Pro. Это событие открыло новую страницу в развитии и широком распространении аналоговой компонентной видеозаписи во всех сферах человеческой деятельности. Разработанный еще в 1986 году формат МП предназначен для профессиональной видеожурналистики и студийного производства. Для записи компонентного сигнала используется S-VHS кассета с высококачественной полудюймовой металлопорошковой лентой.

В формате МП сигнал яркости поочередно записывается на одной дорожке, а на другой - два скомпрессированных по времени цветоразностных сигнала. Скорость лента головка составляет 5.9 м/с.

Контрольные вопросы 1.Перечислите основные аналоговые форматы видеозаписи?

2.Классификация видеоформатов аналоговой видеозаписи?

3.Сравнительные характеристики форматов VHS, S-VHS, MII, Betacam SP?

4.Принцип магнитной записи формата Betacam SP?

5. Принцип магнитной записи формата VHS?

6. Принцип магнитной записи формата MII?

7. Каковы отличия форматов VHS и S-VHS?

8. Особенности форматов форматов Video-8 и Hi-8?

Лекция №3. Форматы цифровой видеозаписи. Композитные форматы: D-2, D-3.

Компонентные форматы: D-1, D-5, D-9, Digital Betacam, Betacam SX, DV, DVCPRO, Цифровой формат D В 1987 г. фирма Аmрех совместно с Sony разработали кодированный цифровой композитный формат (обрабатывается полный цветной телевизионный сигнал ПЦТС), предназначенный для использования в смешанной аналого-цифровой среде. Этот формат имеет более слабую пропускную способность и большую плотность записи, чем D1, и полностью несовместим с ним.

Скорость 19,01 мм (3/4') ленты 13,17 см/с обеспечивает до 3,5 ч видеозапись, частота вращения БВГ 90 Гц, скорость записи 27 м/с, выборка ПЦТС по 8 бит, аудиоканала (48кГц, 20 бит), частота дискретизации изображения - четвертая гармоника цветовой поднесущей (для NTSC: 14,31782 МГц), полоса частот канала яркости 5,5-6, МГц, отношение сигнал/шум 53 Дб.

Кодирование представляет собой линейно импульсно-кодовую модуляцию при битах на отчет. Для защиты от ошибок используется каскадный код Рида-Соломона с внутренним и внешним кодом видеоданных. За один оборот БВГ записываются две пары наклонных дорожек. Для уменьшения взаимного влияния строчек записи, располагающихся без защитных промежутков, использован угловой разворот рабочих зазоров видеоголовок на ±15° и применен канальный код М2 (Миллера квадрат). Свойства кода М2 (отсутвие постоянной составляющей и малый уровень низкочастотных ком понентов) дали возможность производить запись без предварительного стирания и исключить вращающиеся стирающие головки.

Внутреннее кодирование является общим для данных видео и звука.

Звукоданные объединяются в синхроблоки в соответствии с теми же правилами, что и видеоданные, но внешнее кодирование осуществляется отдельно. Преимущества формата D2: более низкая стоимость и массо-габаритные параметры по сравнению с форматом D1, возможность многократной перезаписи с минимальными потерями качества;

возможность замедленного воспроизведения. Недостатки: меньшая, чем у формата D1 разрешающая способность;

узкая полоса сигналов цветности. В настоящее время этот формат является устаревшим.

Цифровой формат D В 1989 г. фирма Panasonic разработала цифровой композитный (обрабатывается ПЦТС) формат D3, совместимый с форматом D2. Скорость 12,65 мм (1/2') ленты 8, см/с обеспечивает до 185 мин видеозапись, частота вращения БВГ 100 Гц, выборка ПЦТС по 8 бит, 4 аудиоканала (48кГц, 20 бит), частота дискретизации изображения четвертая гармоника цветовой поднесущей (для PAL: 17,73 МГц), полоса частот канала яркости 6,0 Мгц, отношение сигнал/шум 54 Дб.

За один оборот БВГ записываются две пары наклонных дорожек двумя видеоголовками с азимутальным разворотом около 20 градусов.

Ширина наклонных дорожек и шаг строчек записи значительно меньше, чем в предшествующих цифровых форматах D1 и D2. Поверхностная плотность записи данных намного больше, а расход ленты - намного меньше. Увеличение поверхностной плотности записи данных было достигнуто за счет применения усовершенствованных носителей, головок и, что очень важно, более мощной и совершенной системы обработки и кодирования.

Кодирование представляет собой линейно импульсно-кодовую модуляцию при битах на отчет. Для защиты от ошибок, возникающих в канале записи-воспроизведения, используется двумерное кодирование, т.е. кодовое слово формируется как произведение двух кодов - внешнего и внутреннего кода Рида-Соломона. В качестве канального кода используется модуляция 8-14 (EFM- eight-to-fourteen modulation).

Формат записи звуковых сигналов в D3 имеет существенные отличия от D2.

Звукоданные, приходящиеся на интервал поля телевизионного изображения, объединяются в секторы и записываются на дорожках с промежутками для монтажа. На интервал одного поля в каждом канале приходится по 4 сектора. Каждый сектор состоит из двух половин, записываемых двумя головками с противоположным азимутом.

Принципиальное отличие заключается в том, что в формате D3 отсутствует дублирование звукосекторов в разных областях сигналограммы. В формате D предлагается использование всей отведенной для звука площади ленты в системе исправления ошибок. В канале звука также используется двумерное кодирование Рида Соломона. Внешнее кодирование звукоданных осуществляется путем добавления восьми проверочных символов (байтов) к каждым восьми информационным.

В настоящее время этот формат является устаревшим, но принципиальные технические решения этого формата послужили в определенном смысле стартовой площадкой при создании современных компонентных систем цифровой видеозаписи.

Цифровой формат D В 1986 г. Sony совместно с BTS разработали компонентный (обрабатываются отдельно яркостная и цветоразностные составляющие) формат D1, предназначенный для высокого уровня обработки сигнала по стандарту 4:2:2 при записи одного цифрового компонентного сигнала изображения (оцифровка трех основных сигналов) и четырех цифровых сигналов звука (48кГц, 20 бит).

Запись сегментная, четырехканальная: поле делится на пары сегментов (каждый сегмент состоит из 50 телевизионных строк), а каждая пара делится на 4 канала, а затем осуществляется запись каждой пары сегментов четырьмя головками четырех секторов, расположенных на разных строчках. В состав каждой строчки записи включены четыре разделенные промежутками пакеты звукоданных. Длина всех пакетов звука составляет примерно 8% от общей длины строчки записи.

Длительность записи до 94 минут, скорость ленты 28, 69 см/с,;

частота вращения БВГ 150 Гц, скорость записи 36 м/с, поток информации 216 Мб/с, выборка составляющих изображения по 8 бит, частоты дискретизации: яркостного сигнала FY=13,5 МГц, цветоразностных составляющих FR-Y= FB-Y=6,25 МГц, полоса частот канала яркости 5,75 МГц, отношение сигнал/шум 56 Дб. Кассеты содержат магнитную ленту шириной 19,01 мм (3/4') и могут быть трех размеров (малыми, средними, большими).

Видеофонограмма формата D1 имеет следующие дорожки: временного кода, управления, программные (каждая из которых включает нижний видеосектор, четыре звукосектора и верхний видеосектор) и монтажную звуковую (предназначенную для слухового поиска фрагментов программы).

При кодировании видео- и звуковых данных осуществляется их перемешивание для защиты от ошибок при выпадении большой продолжительности. В качестве корректирующего кода используется высокоэффективный код с внешними и внутренними кодами Рида-Соломона, позволяющие исправить пакетные ошибки даже из-за пятимиллиметровой царапины шириной 0,5 мм вдоль ленты [10, 11]. Внутреннее кодирование позволяет обнаруживать и исправлять ошибки случайного характера, имеющие сравнительно небольшую глубину (для устранения пакетных ошибок, вызванных выпадениями). Внешнее кодирование позволяет исправлять одну ошибку в каждом слове внешнего кода из 32 символов/ Преимущество формата: запись компонентных сигналов удобна для профессионального ТВ и видеопроизводства;

сохраняется полная полоса видеочастот сигналов, так как исключаются процессы промежуточного преобразования и композитные сигналы;

обеспечивается высокое качество при копировании и монтаже;

совместимость с различной аппаратурой достигается без помощи транскодирования;

устранена асинхронность сигналов, включая опознавание цвета и эффект оконтуривания цветных изображений.

Принципиальные технические решения, найденные при разработке формата D1, используются во всех выпускаемых сейчас видеомагнитофонах. Видеомагнитофоны D не потеряли своего значения, они выпускаются до сих пор. Качественные показатели воспроизводимого ими изображения все еще – эталон.

Цифровой формат D В начале 1989-1990 гг. Panasonic разрабатывает компонентный формат DX10, впоследствии получивший наименование стандарта D5, который использует общую техническую платформу формата D3. Формат D5 предлагает более высокое качество, которое достигается благодаря увеличению числа разрядов цифрового представления видеосигнала с 8 до 10, но он также совместим с форматом D3, благодаря чему обеспечивает высококачественную взаимосвязь между автономными композитными и компонентными системами.

Этот формат основан на норме 601 МККР (CCIR 601) [13]. Скорость 12,65 мм (1/2') ленты 16,228 см/с обеспечивает до 123 мин видеозапись, частота вращения БВГ 100 Гц, выборка составляющих изображения по 10 бит, 4 аудио-канала (48кГц, 20 бит), частоты дискретизации: яркостной составляющей FY=13,5 МГц, цветоразностных сигналов FR-Y= FB-Y= 6,75 МГц.

Многие параметры формата D5 имеют большую степень общности с параметрами D3. Видеофонограммы форматов D3 и D5 во многом одинаковы: шаг строчек записи, минимальная длина волны записи, канальный код, спаривание звуковых секторов. Одинаковы также диаметр и частота вращения барабана, имеют много общего конструкция и компоновка барабанов видеоголовок. Оба формата предполагают одинаковую поверхностную плотность записи (13 Мбит/см2).

Увеличение скорости потока записываемых данных, связанное с компонентной формой представления видеосигнала, достигается в аппаратах формата D5 за счет перехода к четырехканальному принципу построения видеоканала. Запись осуществляется сразу четырьмя вращающимися видеоголовками при удвоенной скорости транспортирования магнитной ленты.

Естественно, это приводит к двукратному уменьшению длительности записи на одну кассету. Если в аппаратах формата D3 за один оборот барабана записывается четыре строчки, то формат D5 предполагает запись восьми строчек за оборот. В этом принципиальное отличие форматов. Однако общее подобие параметров форматов делает сравнительно простым обеспечение совместимости D5 с D3 в рамках единой технологии 1/2" цифровой видеозаписи.

Рассмотренный формат отличен для обработки сигнала и архивирования, но к настоящему времени не получил коммерческого успеха Цифровой формат Digital Betacam В 1993 г. фирма Sony руководствуясь тем, что в настоящее время в мире используется очень большое количество аппаратов Betacam и Betacam SP и существует огромное количество архивов телевизионных программ этих форматов, разработала совместимый с этими форматами формат компонентной цифровой видеозаписи Digital Betacam.

Каждое телевизионное поле записывается на шести наклонных дорожках. Со седние дорожки записываются с азимутальным разворотом рабочих зазоров видеоголовок приблизительно на ±15°. Структура дорожек формата Betacam SP во многом сходна с Digital Betacam. Продольные дорожки сигналов временного кода и управления идентичны в двух форматах, монтажная звуковая дорожка в формате Digital Betacam совпадает с дорожкой второго звукового канала в Betacam SP. В формате Digital Betacam записывается четыре цифровых канала звука, причем звуковые секторы расположены в середине наклонных дорожек, что обеспечивает лучшую защиту звуковых данных от возможных дефектов, связанных с краевыми повреждениями ленты и неполным совмещением траектории головок воспроизведения со строчками записи из-за растяжения ленты. Дорожки содержат также блоки пилот сигналов: низкочастотный пилот-сигнал F1 =400 кГц и высокочастотный Fh=4 МГц, которые используются для обеспечения точного совмещения траектории головок со строчками записи при воспроизведении и монтаже в режиме вставки.

Формат основан на рекомендации 601 МККР (CCIR 601). Скорость 12,65 мм (1/2') ленты 9,67 см/с обеспечивает до 124 мин видеозапись, частота вращения БВГ Гц, выборка составляющих изображения по 10 бит, 4 аудиоканала (48кГц, 20 бит), частоты дискретизации: яркостной составляющей FY=13,5 МГц, цветоразностных сигналов FR-Y= FB-Y= 6,75 МГц. Блок вращающихся головок состоит из четырнадцати головок: четырех головок записи, четырех головок опережающего воспроизведения с динамическим трекингом, четырех головок сквозного воспроизведения и двух головок стирания [13].

Кодирование с целью сокращения избыточности телевизионного сигнала и уменьшения скорости цифрового потока построено по схеме с дискретным косинусным преобразованием (DCT - Discrete Cosine Transform). В системе кодирования, обнаруживающего и исправляющего ошибки в канале записи-воспроизведения, используется код Рида-Соломона, и для внешнего и для внутреннего кодов. В качестве канального кода используется скремблированный код без возвращения к нулю (БВНМ) в сочетании с парциальным кодированием класса IV. При воспроизведении используется процедура декодирования Витерби. При обработке звуковых данных также используется общее внутреннее кодирование и более мощное внешнее кодирование.

Цифровой формат D9 (Digital S) В середине 90-х г. фирмой JVC предложен видеоформат, обеспечивающий запись 8-битных компонентных (раздельно оцифрованы яркостная и две цветоразностные компоненты) сигналов с соотношением частот дискретизации 4:2: для сигналов яркости и цветности: для яркостной составляющей FY=13,5 МГц, для цветоразностных сигналов FR-Y= FB-Y= 6,75 МГц. Скорость передачи данных - Мбит/с. Формат основан на рекомендации 601 МККР (CCIR 601). Скорость 12,65 мм (1/2') ленты 5,78 см/с обеспечивает до 104 мин видеозапись, частота вращения БВГ Гц, скорость лента-головка - 14,5 м/с, выборка составляющих изображения по 8 бит, или 4 аудиоканала (48кГц, 20 бит).

Полудюймовая (12.65 мм) лента дала возможность использовать существующие проверенные высоконадежные лентопротяжные механизмы, обеспечивающие совместимость с форматом S-VHS, записывать широкие наклонные дорожки с данными (видео, аудио, субкод), записывать 2 линейные аудиодорожки (вспомогательные) и дорожку управления. Каждый видеокадр записывается на 12-ти наклонных дорожках шириной 20 мкм и углом наклона 5,96 градусов (рис. 2.3). Для более точного совмещения траектории движения головок воспроизведения с дорожками записи в формате используются также данные, записываемые вращающимися головками на наклонных дорожках в TI секторах (рис.2.3).

Рис. 2.3 Сигналограммы цифрового формата D Кодирование с целью сокращения избыточности телевизионного сигнала и уменьшения скорости цифрового потока построено по схеме с дискретным косинусным преобразованием (DCT - Discrete Cosine Transform). В системе кодирования, обнаруживающего и исправляющего ошибки в канале записи-воспроизведения, используется код Рида-Соломона для внешнего и внутреннего кодов. В качестве канального кода используется скремблированный код без возвращения к нулю (БВН).

При обработке звуковых данных используется общее внутреннее кодирование и более мощное внешнее кодирование с использованием кода Рида-Соломона.

Формат Digital S предусматривает обмен данными в компрессированном виде в форме DIF-последовательностей. Такой интерфейс может использоваться для обмена видеосигналами между видеомагнитофонами Digital S без выполнения операций декодирования и кодирования (декомпрессии и компрессии).

Данный формат предназначен в основном для художественного видеопроизводства.

Высокая устойчивость к выпадениям и высокая цветовая четкость - основные его достоинства.

Цифровой формат Betacam SX В середине 90-х г. фирмой Sony предложен видеоформат Betacam SX, обеспечивающий запись 8-битных компонентных (раздельно оцифрованы яркостная и две цветоразностные компоненты) сигналов с соотношением частот дискретизации 4:2: для сигналов яркости и цветности: для яркостной составляющей FY=13,5 МГц, для цветоразностных сигналов FR-Y= FB-Y= 6,75 МГц. Скорость передачи данных - Мбит/с. Формат основан на рекомендации 601 МККР (CCIR 601). Скорость 12,65 мм (1/2') ленты 5,9575 см/с обеспечивает до 194 мин видеозапись, частота вращения БВГ Гц, угол наклона строчки 4,62°, выборка составляющих изображения по 8 бит, аудиоканала (48кГц, 16 бит), компрессия 10:1, MPEG-2 422P@ML.

Betacam SX стал первым форматом цифровой видеозаписи, предусматривающим применение системы компрессии MPEG-2. До этого компрессия MPEG-2 уже применялась при выдаче цифровых телевизионных программ в эфир и при передаче программных материалов по сетям и линиям коммуникаций.

При записи телевизионного сигнала группа изображений, состоящая из 2 кадров, записывается на 12 наклонных строчках, ширина и шаг которых соответственно 32 и 64мкм. Пакеты звуковых данных располагаются в середине наклонных строчек, что обеспечивает их дополнительную защиту.

Альтернатива, предлагаемая в аппаратах Betacam SX для надежного воспроизведения записанного сигнала для полевых условий, заключается в увеличении числа головок воспроизведения. Головки объединяются в пары, траектории движения которых смещены друг относительно друга на половину шага наклонных дорожек. Если одна головка полностью сошла с дорожки, то другая следует точно по середине дорожки (рис. 2.4). Хотя головки А1 и А2 воспроизводят сигналограмму одной дорожки в разное время, цифровая техника позволяет объединять сигналы двух видеоголовок и воспроизводить все записанные на дорожке данные независимо от трекинга.

Рис. 2.4 Двухголовочный трекинг формата Betacam SX Такой способ работает эффективно и в том случае, когда дорожка искривлена, например, из-за растяжения ленты. Таким образом, исчезает необходимость применения сложной механики ЛПМ видеомагнитофонов. Упрощается и удешевляется обслуживание аппаратов. Смена барабана головок становится процедурой, которая может выполняться в полевых условиях и после которой не требуется никаких юстировок. Надежное считывание записанных данных может выполняться при скоростях, в 4 раза превышающих нормальную. Такой режим используется для перевода записанных материалов с ленты на жесткий магнитный диск встроенного в видеомагни тофон дисковода или диск внешнего сервера.

Значительный объем проверочных данных (общий усредненный их объем превышает 80%), обеспечивающих защиту как от флуктуационных шумов, так и от ошибок, обусловленных выпадениями, царапинами на ленте и загрязнением головок, является отличительной особенностью формата Betacam SX.

Кодирование с целью устранения пространственной избыточности основано на дискретном косинусном преобразовании (DCT - Discrete Cosine Transform). Кодирование, сокращающее временную избыточность, предполагает дифференциальную импульсно кодовую модуляцию. Таблицы квантования и энтропийного кодирования соответствуют спецификации MPEG-2.

Кодек компрессии Betacam SX (MPEG-2 422P@ML) строится на 3 больших интегральных схемах (рис. 2.5). В качестве буферной памяти вместе с каждой интегральной схемой обработки сигналов используются микросхемы быстрой оперативной памяти. В виде отдельной интегральной схемы выполнен измеритель вектора движения, выполняющий оценку сначала с точностью до 1 пиксела, а затем до 1/2 пиксела. В структурных схемах кодера и декодера можно найти все элементы общей системы видекомпрессии MPEG-2, приложением которой является код формата Betacam SX.

Рис. 6.8. Структурная схема кодека компрессии Betacam SX (MPEG@ML) Формат Betacam SX обеспечивает вещательное качество изображения от съемки до компоновки программ. Оборудование этого формата позволяет монтировать материал прямо на месте (в полевых условиях) и передавать его по каналам связи с высокой скоростью без потери качества. При переносе видеоматериалов между аппаратами формата Betacam SX используется последовательный цифровой интерфейс SDTI (последовательный цифровой интерфейс передачи данных), обеспечивающий четырехкратную скорость передачи, с аппаратурой цифровых форматов используется интерфейс SDI (последовательный цифровой интерфейс). Оборудование Betacam SX со вместимо с аналоговой аппаратурой форматов Betacam, Betacam SP. Сфера формата Betacam SX - производство программ новостей, а также спортивных передач, документальных фильмов и других подобных программ.

Следующие рассматриваемые форматы: DV, DVCAM и DVCPRO, судя по имеющимся многочисленным публикациям, дают абсолютно одинаковое качество изображения. Сравнительно недорогое оборудование этих форматов позволяет их использовать малобюджетными телевизионными компаниями как альтернативу сравнительно дорогому оборудованию Betacam SP.

Цифровой формат DV Это бытовой формат цифровой компонентной видеозаписи с обработкой по стандарту 4:2:0 (PAL) потоком 25 Мбит/с на 1/4-дюймовую (6,35 мм) ленту длительностью до 4,5 ч при качестве, близком к вещательному. Этот формат разработан консорциумом DV, объединившим в 1993 г. десять основных производителей бытовой аппаратуры: Panasonic, Philips, Sony, Thomson, Hitachi, JVC, Mitsubishi, Sanyo, Sharp, Toshiba. Каждый кадр располагается на 12-ти наклонных дорожках шириной 10 мкм. На наклонные дорожки с шагом и шириной 10 мкм записываются видео/аудиоданные, субкод, служебные данные (ITI - Insert and Track Information).

Часть области субкода используется для записи вспомогательных данных и сигналов временных кодов: линейного LTC и полевого VITC. Продольных дорожек нет.

Применяется алгоритм внутрикадрового сжатия, использующий метод DCT (дискретного косинусного преобразования -Discrete Cosine Transform), квантование коэффициентов DCT, энтропийное кодирование последовательности квантованных коэффициентов DCT, с коэффициентом компрессии 5:1.

В 1998 г. Международная электротехническая комиссия IEC (International Electrotechnical Commission) приняла формат DV в качестве международного стандарта IEC 61834, регламентирующего систему наклонно-стройчной цифровой видеозаписи бытового назначения с использованием магнитной ленты шириной 6,35 мм (Helical-scan digital video cassette recording system using 6,35 mm. nagnetic tape for consumer use).

Кассеты, записанные в формате DV, могут воспроизводиться на некоторых моделях аппаратов форматов DVCPRO и DVCAM.

Для передачи данных в оборудовании этого формата предусмотрен универсальный последовательный интерфейс IEEE-1394, позволяющий переносить цифровые файлы напрямую на жесткий диск компьютера. Так как цена оборудования невысокая, оно довольно надежное, ремонт и обслуживание дешевое, то в настоящее время десятки тысяч телецентров в самых разных странах мира, включая и нашу страну, используют формат DV в экспресс-новостях, съемках путешествий, подводных съемках и т.п.

С середины 1997 г. потребителю стали поставляться прямо от производителя процессоры не только со встроенными возможностями оцифровки видео и звука, но и с мощным программным обеспечением для монтажа того и другого. Возникла необходимость в видеокамере, которая могла бы подключаться непосредственно к компьютеру для передачи в него видео и звука. С разработкой и представлением различных цифровых видеоформатов DV {Digital Video) активность пользователей персональных DNLE-систем возросла.

Цифровая видеокамера (DV-камера) записывает информацию путем приема светового потока на объектив, связанный с тремя микросхемами: по одной микросхеме на красную, зеленую и синюю составляющие света. Эти сигналы затем преобразуются в электрические сигналы с помощью прибора с зарядовой связью (ПЗС).

Одной из характеристик DV-камеры является то, что ее сигналы сохраняются на цифровой видеокассете (DV-кассете - Digital Video cassette) с шириной ленты 6,35 мм.

DV-кассеты обеспечивают время записи не менее одного-двух часов. Для уменьшения потока данных цифровой видеосигнал кодируется, что уменьшает скорость примерно наполовину (до 15 Мбайт/с). Кроме того, используется аппаратная внутрикадровая компрессия. Степень компрессии 5:1 уменьшает поток данных примерно до 3 Мбайт/с.

Несмотря на малые размеры ленты, цифровая видеокамера обеспечивает высококачественный многоканальный звук. Можно чаписать два звуковых канала в оцифровке 44,1 или 48 кГц. Если пользователь хочет получить больше звуковых каналов, цифровой видеоформат позволяет снизить частоту дискретизации до 32 кГц и записать четыре канала.

Когда потоки DV -видео и DV -звука объединяются, полное значение скорости составляет примерно 5,1 Мбайт/с или 25 Мбит/с, что упрощает внедрение цифрового видеоформата в производство программ и в область персонального использования цифрового видео. При 5,1 Мбайт/с для сохранения 30 мин видео в формате DV требуется 9 Гбайт дискового пространства. Если же мы применяем настольную монтажную систему, в которой возможна дальнейшая компрессия сигнала, то на диск объемом 1 Гбайт можно записать примерно один час видео и звука.

Одна из характеристик монтажа исходного видео и звуковых файлов формата DV— отсутствие этапа оцифровки. Если мы записываем видео м звук с помощью DV камеры, материал уже по существу является оцифрованным. Если мы используем DV ориентированную систему цифрового нелинейного монтажа, то цифровые файлы, содержащиеся на цифровой видеокассете, могут быть сразу перенесены в персональную DNLE -систему, после чего можно начинать монтаж.

Важно, что перенос DV -файлов с кассеты на диски DNLE -системы не обязательно выполнять в реальном времени. При определенных условиях такой перенос можно осуществить со скоростью в 4 раза большей, чем в реальном времени, поскольку этот процесс аналогичен перезаписи компьютерных файлов, а не оцифровке в реальном времени изображения и звука.

Большинство персональных компьютеров в начале 1990-х гг. поставлялось уже со встроенными аналоговыми портами ввода/вывода видео для оцифровки видеосигналов и звука. Однако с появлением Fire Wire перенос видеосигналов и звука с видеокамеры в персональный компьютер в цифровом виде стал более простым.

Более того, в настоящее время производители компьютеров объединились с производителями систем видеомонтажа и поставляют компьютеры с уже установленными персональными DNLE -системами. В результате сотни тысяч потребителей могут легко подключать камеру к компьютеру, используя простое и понятное программное обеспечение для цифрового нелинейного монтажа.

На рынке профессиональных систем нелинейного монтажа появились персональные DMJJ-системы различных фирм-производителей, позволяющие осуществлять компьютерный монтаж видеоматериала в реальном времени. Такой монтаж включает классические склейки и вставки, а также микширование сцен с использованием как двумерных (2D), так и трехмерных (3D) переходов. Американская фирма Pinnacle Systems играет ведущую роль в различных сегментах рынка систем нелинейного монтажа.

В области профессиональных систем нелинейного монтажа реального времени Pinnacle занимает исключительно активную позицию. О серьезности намерений фирмы Pinnacle говорит не только выпуск собственной системы ReelTime NITRO, которая получила известность, как на западном, так и на отечественном рынке, но инедавнее приобретение фирмы Truevision, не нуждающейся в дополнительных рекомендациях в среде видео профессионалов.

Рассмотрим систему ReelTime NITRO более подробно. Она включает в себя две платы: ReelTime и Genie RT, внешний коммутационный блок и программное обеспечение, работающее в Windows NT 4.0. Плата ReelTime поставляется в качестве самостоятельного устройства и обеспечивает возможность монтажа без просчета с использованием около 400 двумерных переходов в программе Adobe Premiere 5.1 RT.

Входящее в комплект программное обеспечения SpiceRack фирмы Pixelan Software содержит такие впечатляющие типы эффектов, как туман, пузырьки, амебы, капли, пыль, пламя и т.д. В реальном времени выполняются также замещение по уровню яркости (luminance key), замещение по цвету (chroma key), альфа-канал, отвечающий за степень прозрачности, и две его разновидности: White Alpha Matte и Black Alpha Matte. Одновременно можно воспроизвести два слоя видео, двумерный переход, два звуковых стерео канала, один из эффектов замещения или прозрачности, а также статические титры или слой графики. Что касается микширования звука, то одновременно проигрываются шесть аудио дорожек, каждая со своим управлением по уровню громкости. Оцифровка звука происходит в стандарте РСМ 16 бит, 44 / 48 КГц без компрессии. Встроенная аппаратная синхронизация аудио и видео позволяет оцифровывать материал в течение многих часов с последующим монтажом без потери синхронизации. ReelTime имеет аппаратный видео оверлей для предварительного просмотра видео на дисплее компьютера одновременно с просмотром на телевизионном мониторе. Оверлейное окно поддерживается в режимах до 1280x1024, 16,7 млн цветов.

Среди плат нелинейного монтажа, фирмы Pinnacle отдельного рассмотрения заслуживает более доступная по цене, но удовлетворяющая жестким требованиям профессионалов видео производства, плата miroVideo DC50, которая стала успешным продолжением серии плат miroVideo. Она не позволяет осуществлять цифровой монтаж в реальном времени, однако существенно ускоряет просчет сцен за счет использования аппаратного кодека.

В последнее время благодаря высокому качеству и доступности по цене большую популярность среди широкого круга пользователей персональных DNLE систем получили платы видео монтажа фирмы Pinnacle Studio A V/DV.

Контрольные вопросы 1. Назовите преимущества цифровых форматов видеозаписи, перед цифровыми?

2. В чем отличия композитных и компонентных форматов видеозаписи?

3. Основные характеристики цифровых форматов видеозаписи D-2 и D-3?

4. Основные характеристики цифровых форматов видеозаписи D-1, D-5, D-9?

5. Основные характеристики цифровых форматов видеозаписи Digital Betacam, Betacam SX?

6. Основные характеристики цифровых форматов видеозаписи DV, DVCPRO, DVCAM?

7. В каком цифровом формате видеозаписи применен кодек по стандарту MPEG-2?

Литература 1. Быков Р.Е. Основы телевидения и видеотехники [Текст]:Учебник для вузов. – М.: Горячая линия – Телеком, 2010. – 399 с: ил.

2. Семенов В. В. Видеотехника [Электронный ресурс]: Пособие / В.В.

Семенов, И.В. Кокарев. – Шахты: Изд-во ЮРГУС, 2003. – 92 с.

Тема 3. Кодирование и сжатие видеосигналов.

Лекция №4. Кодирование видеосигналов.

Варианты энтропийного кодирования: кодирование Хаффмана, арифметическое кодирование.

Энтропийное кодирование — кодирование последовательности значений с возможностью однозначного восстановления с целью уменьшения объёма данных (длины последовательности) с помощью усреднения вероятностей появления элементов в закодированной последовательности.

Предполагается, что до кодирования отдельные элементы последовательности имеют различную вероятность появления. После кодирования в результирующей последовательности вероятности появления отдельных символов практически одинаковы (энтропия на символ максимальна).

В цифровой видеотехнике, при обработке изображений, чаще всего применяются кодирование Хаффмана(Huffman Code), арифметическое кодирование и LZW кодирование (Lempel-Ziv-Welch).

Кодирование методом Хаффмана (Huffman Code). Этот метод кодирования приводит к одному из способов сжатия без потерь. Он является префиксным кодом, в котором длина кодового слова обратно пропорциональна встречаемости кодируемого элемента, т.е. часто встречающимся элементам соответствуют короткие коды, редко встречающимся - длинные. Кодирование методом Хаффмана имеет множество вариантов реализации.

Воспользуемся примером, рассмотренным в работе [1]. В последовательности abbbcccddeeeeeeeeef величина а встречается всего один раз, b - 3 раза, с - 3, d - 2, е - 9, f 1 раз. Вероятность появления каждой из величин соответственно пропорциональна частоте ее повторения.

При формировании минимального кода для каждого элемента строится двоичное дерево (рис. 3.1). Оно строится по следующему правилу: сначала объединяются два элемента, вероятность появления которых минимальна, затем сформированная пара рассматривается как один элемент, вероятность которого равна сумме вероятностей каждой из составляющих. Операция повторяется до тех пор, пока все элементы не объединятся в пары.

Как видно, элементы с наименьшей вероятностью - это а и f. Они образуют первую пару. Символу а присваивается 0-я ветвь, а f - первая. Эти 0 и 1 будут младшими битами кодов для а и f, соответственно. Они образуют первую пару.

Символу а присваивается 0-я ветвь, а f -первая. Эти 0 и 1 будут младшими битами кодов для а и f, соответственно. Далее, вероятности (или частота повторения) этих двух символов суммируются, формируя совокупный элемент аf встречающийся уже 2 раза.

Наименьшая вероятность теперь встречается у элементов d и af, встречающихся по два раза. Они объединяются во вторую пару, причем элементу af присваивается 0, а элементу d - 1. В результате код для а будет 00, для f- 01, а для d он будет заканчиваться на 1 и будет на один бит короче. Далее формируем совокупный элемент afd с частотой повторения 4, затем объединяем элементы b и с, как обладающие минимальной частотой повторения и т.д., получим следующие кодовые комбинации для кодирования отдельных символов:

е: 1;

b: 010;

с: 011;

d: 001;

а: 0000;

f: 0001.

Видно, что наименее часто встречающиеся величины кодируются более длинными кодами, а более вероятные меньшим числом бит, за счет чего и достигается сжатие.

Вместе с тем, кодирование по Хаффману нуждается в знании точной статистики (что, впрочем, не является помехой при кодировании изображений определенного класса), иначе эффективность сжатия снижается и может даже привести к увеличению объема данных. Поэтому иногда сначала формируют кодовую таблицу для каждого конкретного Рис.3.1 Дерево кодируемого изображения.

Хаффмана Это, однако, требует дополнительных вычислительных затрат, а также многократной передачи самой кодовой таблицы декодеру, что занимает ресурсы канала связи. В тех случаях, когда в процессе передачи изменяется вероятность появления кодовых слов, используется адаптивная версия кода Хаффмана.

Необходимо отметить, что код Хаффмана достаточно чувствителен к ошибкам в канале связи, так как полученные битовые последовательности упаковываются в байты без учета границ байтов и при возникновении ошибок декодирование очередного символа может начаться с середины кода с выдачей ложных результатов до тех пор, пока не будет достигнут конец ветви (на редко встречающемся символе). Поэтому при использовании кодов Хаффмана в каналах с помехами необходимо дополнительно применять помехоустойчивое кодирование.

LZW-кодирование (Lempel-Ziv-Welch). В отличие от метода Хаффмана, в методе LZW не требуется перед кодированием создавать кодовую таблицу. Началом алгоритма является простая таблица кодов и, по мере продвижения, формируется более эффективная таблица, то есть алгоритм является адаптивным. В отличие от кода Хаффмана обычно не используют более короткие коды для чаще встречающихся элементов. Алгоритм основан на использовании корреляции между соседними эле ментами изображения и устранении на этой основе избыточности.

Коэффициент сжатия, достигаемый LZW, обычно не превышает трех, как и для любого метода без потерь, но некоторые изображения могут сжиматься до 10 раз.

Следует отметить, что плохо сжимаются зашумленные изображения, так как в них трудно ожидать наличия повторяющихся участков. Код LZW используют в компьютерной технике для архивации графических файлов (например, формат GIF).

Арифметическое кодирование. Арифметическое кодирование объединяет методы Хаффмана и LZW. Подобно кодированию по схеме Хаффмана, создаются более короткие коды для часто повторяющихся символов и более длинные - для редко повторяющихся. При этом подобно кодированию LZW, сжимаются последовательности величин (яркости), а не сами величины. При арифметическом сжатии удается приблизиться к теоретическому пределу сжатия - энтропии источника.

Для арифметического сжатия существует несколько алгоритмов реализации. В их основе лежит отображение каждой последовательности величин (яркости) некоторым числом, лежащим в диапазоне от 0 до 1 и требующее для своей записи различное число знаков, то есть представляющее собой двоичную дробь переменной точности.


Поясним алгоритм арифметического сжатия. Для простоты возьмем изображение, состоящее из 1900 элементов. Положим, что каждый из них может иметь одно из шести значений яркости (от а до f) причем, будем считать, что в изображении а встречается раз, b - 300, с - 300, d - 200, е - 900, f - 100 раз. То есть, вероятности появления каждого из этих значений яркости в изображении составляют: Р(a) = Р(f) = 0,0526;

Р(b) = Р(с) = 0,1579;

P(d) = 0,1052, Р(е) = 0,4737.

Для выбранной модели изображения с независимыми отсчетами совместная вероятность появления любой серии элементов с определенным распределением яркостей (ab;

dcf и т.д.) равна произведению вероятностей появления составляющих (a, b, d, с, f и т.д.). Значение ее для каждого элемента или последовательности может быть представлено их вероятностью появления. В рассматриваемом примере они оказываются одинаковыми, например, для элементов а и f и для некоторых последовательностей (eb и еc), а, кроме того, всегда будут равны для рефлексивных последовательностей, таких как eb и be.

Для наглядности построим модель: для этого будем интерпретировать вероятность появления каждой величины яркости или их сочетания в виде отрезка линии, длина которого соответствует этой вероятности. Эти отрезки можно отложить последовательно друг за другом (в общем случае, в произвольном порядке) вдоль координатной оси, занимая в совокупности участок от 0 до 1 (рис. 3.2. Например, величина b представлена отрезком от 0,0526 до 0,2105, его длина - вероятность появления b, т.е. Р(b). Любое число в этом диапазоне (на этом отрезке) соответствует величине b.

Рис. 3.2 Арифметическое кодирование Для представления последовательности из двух символов каждый из этих отрезков разделяется далее. Для последовательности, начинающейся с b, далее будет делиться область от 0,0526 до 0,2105. Последовательность bа займет первые 5,26% этой области, образуя отрезок от 0,0526 до 0,0609, последовательность bb - следующие 15,79% (от 0,0609 до 0,0858) и т.д. Подчеркнем, что в принятой модели изображения исходные величины считаются независимыми, так, что вероятность появления любой последовательности определяется перемножением вероятностей появления входящих в нее компонентов. На рис. 3.2 представлены данные для одиночных элементов и сочетаний двух и трех элементов изображения.

В общем случае может использоваться понятие условной вероятности появления величин яркостей, позволяющее еще больше повысить эффективность сжатия, но и требующее знания более точной статистики изображений. Таким образом, любая последовательность однозначно кодируется указанием определенного числа, лежащего в диапазоне от 0 до 1. Чем длиннее последовательность и чем меньше ее вероятность, тем с большей точностью должно быть указано это число (рис. 3.2). Коэффициент сжатия зависит от содержания исходного изображения и точности и полноты использования статистики, и в отдельных случаях для файлов компьютерной графики может достигать 100.

Главный недостаток кодирования с укрупнением состоит в быстром увеличении объема алфавита, а значит, длины кодовых символов и объема кодовой таблицы.

Например, если кодирование яркостей для отдельных элементов изображения имеет алфавит из 256 различных событий, то кодирование их пар даст уже 65 536, троек - 772 116 и т.д. Соответствующие размеры должна иметь и кодовая таблица. Техническая реализация ее становится затруднительной.

Кодирование, исправляющее ошибки. Исправление единичных и пакетных ошибок. Код БЧХ. Код Рида-Соломона.

Помехоустойчивое кодирование передаваемой информации позволяет в приемной части системы обнаруживать и исправлять ошибки. Коды, применяемые при помехоустойчивом кодировании, называются корректирующими кодами или кодами, исправляющими ошибки.

Если применяемый способ кодирования позволяет обнаружить ошибочные кодовые комбинации, то в случае приема изображения можно заменить принятый с ошибкой элемент изображения на предыдущий принятый элемент или на соответствующий элемент предыдущей строки или предыдущего кадра. При этом заметность искажений на экране телевизионного приемника существенно уменьшается.

Такой способ называется маскировкой ошибки.

Более совершенные корректирующие коды позволяют не только обнаруживать, но и исправлять ошибки. Как правило, корректирующий код может исправлять меньше ошибок, чем обнаруживать. Количество ошибок, которые корректирующий код может исправить в определенном интервале последовательности двоичных символов, например, в одной кодовой комбинации, называется исправляющей способностью кода.

Корректирующие коды — коды, служащие для обнаружения или исправления ошибок, возникающих при передаче информации под влиянием помех, а также при её хранении.

Для этого при записи (передаче) в полезные данные добавляют специальным образом структурированную избыточную информацию (контрольное число), а при чтении (приёме) её используют для того, чтобы обнаружить или исправить ошибки.

Естественно, что число ошибок, которое можно исправить, ограничено и зависит от конкретного применяемого кода.

С кодами, исправляющими ошибки, тесно связаны коды обнаружения ошибок. В отличие от первых, последние могут только установить факт наличия ошибки в переданных данных, но не исправить её.

В действительности, используемые коды обнаружения ошибок принадлежат к тем же классам кодов, что и коды, исправляющие ошибки. Фактически любой код, исправляющий ошибки, может быть также использован для обнаружения ошибок (при этом он будет способен обнаружить большее число ошибок, чем был способен исправить).

По способу работы с данными коды, исправляющие ошибки, делятся на блоковые, делящие информацию на фрагменты постоянной длины и обрабатывающие каждый из них в отдельности, и свёрточные, работающие с данными как с непрерывным потоком.

Коды, корректирующие ошибки передачи, применяются последовательно, с учетом их различных свойств и способности корректировать ошибки различного характера. При этом код, применяемый на передающей стороне первым, должен декодироваться на приемной стороне в последнюю очередь. Такой код называется внешним. Соответственно код, применяемый на передающей стороне последним и декодируемый в приемном устройстве в первую очередь, называется внутренним.

Помехоустойчивое кодирование предполагает введение в передаваемое сообщение, наряду с информационными, так называемые проверочные разряды, формируемые в устройствах защиты от ошибок (кодерах — на передающем конце, декодерах — на приемном). Избыточность позволяет отличить разрешенную и запрещенную (искаженную за счет ошибок) комбинации при приеме, иначе одна разрешенная комбинация переходила бы в другую.

Помехоустойчивый код характеризуется тройкой чисел (n, k, d0), где n — общее число разрядов в передаваемом сообщении, включая проверочные (г), k=n-r — число информационных разрядов, d0 — минимальное кодовое расстояние между разрешенными кодовыми комбинациями, определяемое как минимальное число различающихся бит в этих комбинациях. Число обнаруживаемых (t0) и (или) исправляемых (tи) ошибок (разрядов) связано с параметром d0 соотношениями:

d0 t0 +1, d0 2t0 +1, d0 to + tи+ 1.

Иногда используются дополнительные показатели избыточности, производные от приведенных выше характеристик n, k:R = r/n — относительная избыточность, v = k / n — относительная скорость передачи.

Существующие помехоустойчивые коды можно разделить на ряд групп, из которых лишь часть применяются для обнаружения ошибок в передаваемых по сети пакетах (на рис. 3.3 используемые для этой цели группы выделены утолщенными стрелками). В группе систематических (линейных) кодов общим свойством является то, что любая разрешенная комбинация может быть получена в результате линейных операций над линейно Рис. 3.3 Классификация помехоустойчивых кодов независимыми векторами. Это способствует упрощению аппаратной и программной реализации данных кодов, повышает скорость выполнения необходимых операций. Простейшими систематическими кодами являются биты четности/нечетности.

Они не позволяют обнаружить ошибки четной кратности (то есть ошибки одновременно в двух, четырех и т.д. битах) и поэтому используются при невысоких требованиях к верности принимаемых данных (или при малой вероятности ошибок в линии передачи).

Примером может служить бит Parity (соответствие) в установках режимов работы последовательного СОМ-порта. Несмотря на ограниченные возможности обнаружения ошибок, биты четности/нечетности имеют большое значение в теории помехоустойчивого кодирования. Одни из первых математически обоснованных и практически использованных ранее для защиты информации в запоминающих устрой ствах помехоустойчивых кодов — коды Хэмминга представляют собой простую совокупность перекрестных проверок на четность/нечетность. Циклические коды могут рассматриваться как обобщенные проверки на четность/нечетность.

Циклические коды (CRC) Циклические коды — это семейство помехоустойчивых кодов, включающее в себя в качестве одной из разновидностей коды Хэмминга. В целом оно обеспечивает большую гибкость с точки зрения возможности реализации кодов с необходимой способностью обнаружения и исправления ошибок, определяемой параметром d0, по сравнению с кодами Хэмминга (для которых do=3 или do=4). Широкое использование циклических кодов на практике обусловлено также простотой реализации соответству ющих кодеров и декодеров.

Основные свойства и само название циклических кодов связаны с тем, что все разрешенные комбинации бит в передаваемом сообщении (кодовые слова) могут быть получены путем операции циклического сдвига некоторого исходного кодового слова Циклические коды задаются с помощью так называемых порождающих полиномов (многочленов) или их корней. Порождающие полиномы, представляющие собой так называемые неприводимые многочлены (делятся лишь на единицу и на самих себя), табулированы для разных значений n, k и d0. Практически в компьютерных сетях используются циклические коды длиною в 2 или 4 байта (16 или 32 бита), а параметры n, k и d0 в явном виде не указываются. Это связано с возможностью выбора различной длины поля данных в пакете на этапе установления и выбора параметров соединения при неизменной длине поля циклического кода.


Кроме систем передачи информации, циклические коды используются в запоминающих устройствах (ЗУ) для обнаружения возможных ошибок в считываемой информации. При записи файлов на диск (в том числе при их архивировании) вместе с файлами формируются и записываются соответствующие циклические коды. При чтении файлов (в том числе при извлечении файлов из архива) вычисленные циклические коды сравниваются с записанными и таким образом обнаруживаются возможные ошибки. Свойства циклического кода лежат в основе сигнатурного анализа (эффективного способа поиска аппаратных неисправностей в цифровых устройствах различной сложности). Варианты практической реализации соответствующих кодеров и сигнатурных анализаторов имеют между собой много общего.

Следует сделать два замечания относительно сложившейся терминологии.

Понятие «циклические коды» достаточно широкое, тем не менее на практике его обычно используют для обозначения только одной разновидности, описанной выше и имеющей в англоязычной литературе название CRC (Cyclic Redundancy Check — циклическая избыточная проверка). Более того, поле пакета или кадра, фактически содержащее код CRC, часто называется «контрольной суммой» (FCS — контрольная сумма кадра), что в принципе не верно, так как контрольная сумма формируется иначе. Однако именно этот термин получил широкое распространение.

Перспективными с точки зрения аппаратурной реализации представляются коды БЧХ (коды Боуза - Чаудхури - Хоквингема), также, как и коды Хэмминга, входящие в семейство циклических кодов. Коды БЧХ не слишком большой длины (примерно до п=1023), оптимальны или близки к оптимальным кодам, то есть обеспечивают максимальное значение d0 при минимальной избыточности. Эти коды сначала нашли практическое применение в цифровых системах записи звука (речи, музыки), причем в варианте, предусматривающем исправление обнаруженных ошибок. Относительно невысокие частоты дискретизации звуковых сигналов (48 или 96 кГц) не препятствуют проведению дополнительных вычислений так жестко, как в случае высокоскоростных сетей. Но с развитием быстродействия компьютерной элементной базы такие коды уже широко используются и в цифровом телевидении и в цифровой видеотехнике.

Код БЧХ (Боуза - Чаудхури – Хоквингема).

В теории кодирования это широкий класс циклических кодов, применяемых для защиты информации от ошибок. Отличается возможностью построения кода с заранее определёнными корректирующими свойствами, а именно, минимальным кодовым расстоянием. Частным случаем БЧХ-кодов является код Рида — Соломона.

БЧХ-код является циклическим кодом, который можно задать порождающим полиномом. Для его нахождения в случае БЧХ-кода необходимо заранее определить длину кода (она не может быть произвольной) и требуемое минимальное расстояние.

Порождающие полиномы для таких кодов в зависимости от предъявляемых к ним требований, можно найти в таблице 3.1.

Таблица 3. Порождающий полином k n m s dmin Символическая запись Запись в виде полинома 3 7 4 1 3 13 4 15 11 1 3 23 8 15 7 1 3 721 10 15 5 3 7 2467 5 31 26 1 3 45 10 31 21 2 5 3551 15 31 16 3 7 107657 25 31 11 5 11 5423325 где n — общее число элементов, m — число информационных элементов, k — число избыточных элементов (n = m + k).

Процедура построения кода БЧХ по заданным M и dmin:

1. по dmin найти значение, при котором обеспечивается необходимое число информационных элементов m при минимальной избыточности kmin;

2. найти в таблице соответствующий порождающий полином;

3. если dmin четное, умножить найденный полином на (x + 1);

4. если mтабл mзадан, то можно перейти к укороченному циклическому коду, вычеркивая в порождающей матрице исходного кода с параметрами mтабл, kmin (mтабл mзадан) столбцов слева и столько же строк сверху.

Код Рида-Соломона.

Коды Рида-Соломона позволяют исправить ошибки в блоках данных и используются в широком ряде приложений связанных с цифровой коммуникацией и хранением информации. Коды Рида-Соломона используются для исправления ошибок во многих системах, включая:

Запоминающие устройства (включая ленточные накопители, компакт-диски, DVD, штрих коды, и т.д.) Беспроводная или мобильная связь (включая сотовые телефоны, микроволновая связь, и т.д.) Спутниковая связь Цифровое телевиденье / DVB Высокоскоростные модемы, такие как ADSL, xDSL, и т.д.

Типовая система показана здесь:

Кодер Рида-Соломона в цифровой блок данных добавляет добавочные "избыточные" биты. Ошибки происходят в течение передачи или хранении информации по ряду причин (например помехи или наложение, царапины на компакт-диске и т.д.) Декодер Рида-Соломона обрабатывает каждый блок данных и пытается исправить ошибки, чтоб вернуть данные в оригинальном виде. Количество и тип ошибок, которые могут быть исправлены, зависит от характеристик кода Рида-Соломона.

Коды Рида-Соломона являются подмножеством кодов БЧХ и являются линейными. Коды Рида-Соломона указываются как RS(n,k) с s-бит символами. Это означает, что кодер берёт k символов данных по s бит каждый и добавляет паритетные символы, чтобы сделать ключевое слово длиной n. Есть также символы с n-k паритетом по s-бит каждый. Декодер Рида-Соломона может исправить вплоть до t символов, которые содержат ошибки в кодовом слове, где 2t = n-k.

Далее показана диаграмма типичного кода Рида-Соломона ( известный как Систематический код, потому что данные слева в неизменном состоянии и паритетные символы присоединены):

Пример:Популярный код Рида-Соломона RS(255,223) с 8-разрядными символами.

Каждое ключевое слово содержит 255 байтов кодового слова, из которых 223 байта данные, и 32 паритетные байты. Для этого кода:

n = 255, k = 223, s = 2t = 32, t = Декодер может исправить любые 16 ошибок символа в кодовом слове: т.е.

ошибки вплоть до 16 байтов где-нибудь в ключевом слове могут быть автоматически исправлены.

Получим размер символа s, для длины (n) максимального ключевого слова кода Рида-Соломона n = 2s – Например, максимальная длина кода с 8-разрядными символами (s=8) составляет 255 байтов.

Коды Рида-Соломона могут сокращаться (концептуально) бросая ряд нулевых символов данных на кодер, не передавая их, а затем повторно вставляя их в декодер.

Пример: Код описанный выше может быть сокращен до (200,168). Кодер берет блок 168 байтов данных, (концептуально) добавляет 55 нулевых байтов, создает (255,223) ключевое слово и передает только 168 байтов данных и 32 паритетных байта.

Количество "мощность" обработки требует, чтобы кодировались и декодировались коды Рида-Соломона вместе с числом паритетных символов, образуя ключевое слово. Большое значение t означает, что большой ряд ошибок может быть исправлен, но требует большую вычислительную мощность, чем маленькое значение t.

Ошибки Символа Одна ошибка символа происходит, когда 1 бит в символе неправилен или когда все биты в символе неправильны.

Пример: RS(255,223) может исправить 16 ошибок символа. В наихудшем случае, когда 16 разрядные ошибки, находятся в каждом отдельном символе (байте). В лучшем случае, когда 16 полных байтовых ошибок тогда, декодер исправляет 16 x 8 разрядных ошибок.

Коды Рида-Соломона особенно хорошо исправляют ошибки разрыва (где серии битов в ключевом слове получены с ошибкой).

Декодирование Алгебраические процедуры декодирования могут исправить ошибки и стирающие сигналы. Стирающий сигнал происходит, когда позиция ошибки символа известна. Декодер может исправить вплоть до t ошибок или вплоть до 2t стирающих сигналов.Информация о стирающих сигналах может часто снабжаться демодулятором в цифровой системе коммуникации, т.е. "флаги" демодулятора получили символы, которые, вероятно, содержат ошибки.

Когда ключевое слово декодировано, есть три возможных результата:

1. Если 2s + r 2t (s ошибки, r стирающие сигналы) тогда оригинальное передаваемое кодовое слово будет всегда возвращаться, ИНАЧЕ 2. Декодер обнаружил, что не может вернуть оригинальное кодовое слово и указывает этот факт.

ИЛИ 3. Декодер не исправил возникшие ошибки, то возвращается некорректное кодовое слово без любого указания.

Вероятность каждой из трех возможностей зависит от специфики кода Рида Соломона, а также от количества и порядка расположения ошибок.

Преимущество кодирования Преимущество использования кодов Рида-Соломона в том, что вероятность ошибки, остающейся в декодированных данных (обычно), намного ниже, чем вероятность ошибки, если код Рида-Соломона не используется. Это часто рассматривается, как преимущество..

Пример: Проектируется цифровая система коммуникации с вероятностным соотношением ошибки в информации 10-9, то есть не более одной ошибки в109 битов информации. Этого можно достичь повышением мощности сигнала отправки информации или добавляя код Рида-Соломона (или другой тип кода исправляющего ошибки). Код Рида-Соломона позволяет системе достигать исправления ошибок в информации с низшей мощностью сигнала отправителя. Энергетическая "экономия", предоставленная кодом Рида-Соломона (в децибелах), - есть преимущество кодирования.

Кодирование и декодирование кодами Рида-Соломона может осуществляться в программном обеспечении или в специальной аппаратной реализации.

Коды Рида-Соломона основаны специальной области математики известной как поля Галуа или конечные поля. Конечное поле использует такие же операции, как и в арифметике (+,-,x,/ и т.д.), которые оказывают влияние на элементы поля и образуют результат. Для кодера и декодера Рида-Соломона необходимо выполнять эти же арифметические операции. Эти операции требуют специального оборудования или программного обеспечения для осуществления функций.

Аппаратная реализация Существует ряд коммерческих аппаратных реализаций. Многие существующие системы используют "готовые" встроенные интегральные схемы, кодирования и декодирования кодов Рида-Соломона. Эти микросхемы, склонны к поддержке определенного языка программирования (например, RS (255, k), где t = 1 до символов). Последние тенденция к VHDL или Verilog проектов (логика ядер или ядер интеллектуальной собственности). Они имеют ряд преимуществ по сравнению со стандартной микросхемой. Логика ядра может быть интегрирована с другими VHDL или Verilog компонентами и синтезирована на FPGA (Field Programmable Gate Array) или ASIC (Application Specific Integrated Circuit) - это дает возможность так называемых конструкций "систем на кристалле", в которых несколько модулей могут быть объединены в одной микросхеме. В зависимости от объемов производства, логика ядра часто по стоимости значительно ниже, чем стоимость системы интегральных схем типа "стандарт". С помощью логики ядра, проектировщик избегает потенциальную необходимости "тратить своё время на покупку" интегральной схемы Рида-Соломона.

Программная реализация До недавнего времени внедрение программного обеспечения в режиме "реального времени" требовало слишком много вычислительных мощностей, за исключением простейших кодов Рида-Соломона (т.е. кодов при малых значениях t). Основная трудность в реализации кодов Рида-Соломона в программном обеспечении то, что общецелевые процессоры не поддерживают арифметических операций поля Галуа.

Например, для реализации в программном обеспечении поля Галуа требуется тест на 0, два журнала по таблице окна, сумма по модулю и антижурнал по таблице. Тем не менее, тщательная разработка вместе с ростом производительности процессоров означает, что внедрённое программное обеспечение может работать при относительно высоких скоростях передачи данных. В таблице 3.2 приведены некоторые примеры базовых показателей на 166 МГц Pentium PC:

Таблица 3. Код Скорость передачи данных RS(255,251) 12 Мбит/с RS(255,239) 2,7 Мбит/с RS(255,223) 1,1 Мбит/с Эти скорости передач данных только для декодирования: кодирование значительно быстрее, так как требует меньшее количество вычислительных операций.

Эти данные приведены для примера. Реальные данные сейчас достигнуты гораздо выше по скорости передачи. Для стандарта MPEG-2 скорость транспортного потока может составлять до 80 Мбит/с в зависимости от профиля.

В цифровом телевидении пакет транспортного потока MPEG-2 составляет байт. В качестве внешнего кода используется код Рида-Cоломона (Reed-Solomon-Code, RS), который требует двух проверочных символов на одну исправляемую ошибку. В процессе кодирования кодом Рида-Соломона, используемым для передачи цифрового ТВ сигнала, на каждый пакет общего транспортного потока длиной 188 байт добавляется 16 проверочный байт. Получается новый пакет, содержащий необходимую избыточность и имеющий длину 204 байт. Это позволяет исправить 8 байт, искаженной помехой в процессе передачи.

Контрольные вопросы 1. С какой целью осуществляется кодирование источников информации?

2. Что такое энтропийное кодирование?

3. Расскажите в чем суть кодирования по Хаффману?

4. Достоинства и недостатки арифметического кодирования?

5. Классификация помехоустойчивых (кодов исправляющие ошибки) кодов?

6. В чем суть циклических кодов) 7. Дайте определение внутреннего и внешнего кода?

8. Что такое блочный код?

9. Какими способами можно реализовать кодеры и декодеры Рида-Соломона?

10. Поясните алгоритм кода Рида-Соломона?

11. Дайте сравнительную характеристику аппаратного и программного способов реализации обработки по алгоритму кода Рида-Соломона?

Лекция №5. Сжатие видеосигналов.

Видеокомпрессия. Принципы и методы компрессии. Сжатие без потерь и с потерями. Системы сжатия: JPEG, MPEG, DV.

Использование цифровых методов передачи приводит к увеличению полосы занимаемых частот и соответственно уменьшению скорости передачи изображений.

Эта проблема может быть решена путем разработки эффективных методов цифрового кодирования (сжатия) телевизионных изображений.

Интенсивное развитие методов и устройств сжатия сигналов изображений стимулируется в настоящее время развитием цифровых сетей передачи данных и компьютерных мультимедийных технологии.

Следует отметить, что методы и устройства сжатия различных сообщений (в том числе и телевидения) интенсивно взвивалось последние 20-30 лет, но только на базе новых технологий получены выдающиеся результаты.

Возможности сокращенного описания изображений обуславливаются в основном двумя факторами.

Первый связан с ограничениями зрительного восприятия получателя, благодаря которым исходное изображение можно без ущерба для субъективного качества аппроксимировать, более простым, экономно описываемым изображением (первичное сжатие).

Второй опирается на избыточность цифрового представления изображений.

Последовательность дискретных величин, поступающих с выхода устройства первичного сжатия изображений, как правило, содержит остаточную избыточность, которую можно уменьшить методами статистического (энтропийного) кодирования источников.

Методы сжатия изображений Первая группа методов сжатия основана на свойствах изображения и динамики его изменения от кадра к кадру. Его применение ведет к неизбежным потерям информация и ухудшению качества изображения.

Эти методы могут быть реализованы как в виде внутрикадрового кодирования, так и межкадрового кодирования: обычно используется сочетание этих процедур.

Вторая группа методов обеспечивает сжатие благодаря использованию статических свойств сигнала и не ведет к потере информации.

К первой группе методов следует отнести:

- кодирование с предсказанием;

- линейное кодирование с преобразованием (обычно с использованием ортогональных рядов Фурье, Адамара, Хартли, Гильберта, косинусного и др.);

- межкадровое кодирование, основанное на том, что большинство изображений незначительно изменяется от кадра к кадру;

- прореживание отсчетов (и кадров) с последующим их восстановлением путем интерполяции и экстраполяции;

- кодирование с разбиением изображения на фрагменты;

- гибридное (комбинированное) внутрикадровое и межкадровое кодирование, представляющее собой различные сочетания перечисленных методов кодирования с преобразованием.

Ко второй группе методов сжатия следует отнести:

- использование статистических кодов, например, кода Хаффмана и его модификаций, арифметических кодов;

- векторного квантования.

В современных устройствах сжатия видеоизображений обычно также используются различные комбинации из первой и второй групп.

В настоящее время имеется несколько стандартов (рекомендаций) международных и европейских организаций и групп экспертов по различным видам услуг в области кодирования видеосигналов для передачи подвижных и неподвижных изображений.

Основными требованиями, предъявляемыми к кодекам неподвижных изображений являются: высокое сжатие без существенной потери качества изображения, удовлетворение требований международных стандартов и рекомендаций, относительно невысокая сложность и стоимость.

Алгоритм сжатия неподвижных изображений В настоящее время алгоритм сжатия неподвижных кадров (видеоизображений) основывается на стандарте JPEG (Joint Photographic Experts Group). Указанный стандарт обеспечивает очень хорошее или отличное качество изображения для различных классов неподвижных видеоизображений.

Основой стандарта является алгоритм адаптивного дискретного косинусного преобразования (ADCT — Adaptive Discrete Cosine Transform), состоящей из трех основных частей: базовой системы, ряда расширителей возможностей и статистического кодирования.

Базовая система обеспечивает совместимость различных вариантов кодирования. В ней используется метод дискретного косинусного преобразования 8x8, равномерное квантование и код Хаффмана. Расширители возможностей могут применяться порознь или в сочетаниях.

Структурная схема видеокодека включает в себя дискретный косинусный преобразователь и статистический кодер Хаффмана.

На приемной стороне (в декодере) производятся обратные преобразования.

Алгоритм является достаточно сложным.

Кодирование изображения по алгоритму JPEG обычно начинается с преобразования цветового пространства в сигнал яркости Y и два цветоразностных сигнала U, V. Такой подход позволяет повысить эффективность сжатия. При этом степень сжатия компоненты яркости будет меньше, чем цветоразностных компонент, так как люди в гораздо меньшей степени замечают изменения в цвете.

После преобразования цветового пространства обычно, но необязательно, производится прореживание (U, V) данных цветности. При прореживании отбрасываются цветоразностные компоненты строк или столбцов пикселов с определенными номерами (например, каждой второй строки и каждого второго столбца).

Следующий этап процедуры сжатия данных заключается в преобразовании небольших блоков изображения при помощи двумерного дискретного косинусного преобразования (DCT - Discrete Cosine Transform), которое дает субъективно наилучший результат и описывается уравнением:

где v - горизонтальная координата графического блока, и вертикальная, х - вертикальная координат внутри блока, а у - горизонтальная координата внутри блока, C(u), C(v) = l/2 для u,v = 0 и С(и),C(v) = 1 в противном случае и, v 0.



Pages:     | 1 || 3 | 4 |   ...   | 6 |
 





 
© 2013 www.libed.ru - «Бесплатная библиотека научно-практических конференций»

Материалы этого сайта размещены для ознакомления, все права принадлежат их авторам.
Если Вы не согласны с тем, что Ваш материал размещён на этом сайте, пожалуйста, напишите нам, мы в течении 1-2 рабочих дней удалим его.