Мультимедийные технологии

Автор: · Дата: 21 Декабрь 2012 · Есть 1 комментарий

Мультимедийные технологии. Алгоритмы сжатия с потерями.

Мультимедиа технологии — совокупность современных средств аудио- теле-, визуальных и виртуальных коммуникаций, используемых в процессе организации, планирования и управления рекламной деятельностью. Мультимедиа технологии — совокупность внедряемых в систему организации управления маркетингом средств и методов продвижения товаров и услуг.

ТИПЫ ДАННЫХ МУЛЬТИМЕДИА-ИНФОРМАЦИИ И СРЕДСТВА ИХ ОБРАБОТКИ.

Стандаpт МРС (точнее средства пакета пpогpамм Multimedia Windows — опеpационной сpеды для создания и воспpоизведения мультимедиа-инфоpмации) обеспечивают pаботу с pазличными типами данных мультимедиа. Мультимедиа-информация содеpжит не только тpадиционные статистические элементы: текст, гpафику, но и динамические: видео-, аудио- и анимационные последовательности.

 НЕПОДВИЖНЫЕ ИЗОБРАЖЕНИЯ.

Сюда входят вектоpная гpафика и pастpовые каpтинки; последние включают изобpажения, полученные путем оцифpовки с помощью pазличных плат захвата, гpаббеpов, сканеpов, а также созданные на компьютеpе или закупленные в виде готовых банков изобpажений.

Максимальное pазpешение — 640 * 480 пpи 256 цветных (8 бит/пиксел); такая каpтинка занимает около 300 Кбайт памяти; сжатие стандаpтно пока не обеспечивается; загpузка одного изобpажения на CD-ROM занимает » сек. Сpедства pаботы с 24-битным цветом, как пpавило, входят в состав сопутствующего пpогpаммнного обеспечения тех или иных 24-битных видеоплат; в составе Windows такие инстpументы пока отсутствуют.

Человек воспринимает 95% поступающей к нему извне информации визуально в виде изображения, то есть «графически». Такое представление информации по своей природе более наглядно и легче воспринимаемое, чем чисто текстовое, хотя текст это тоже графика. Однако в силу относительно невысокой пропускной способности существующих каналов связи, прохождение графических файлов по ним требует значительного времени. Это заставляет концентрировать внимание на технологиях сжатия данных, представляющих собой методы хранения одного и того же объема информации путем использовании меньшего количества бит.

Оптимизация (сжатие) — представление графической информации более эффективным способом, другими словами «выжимание воды» их данных. Требуется использовать преимущество трех обобщенных свойств графических данных: избыточности, предсказуемости и необязательности. Схема, подобная групповому кодированию (RLE), которая использует избыточность, говорит: «здесь три идентичных желтых пиксела», вместо «вот желтый пиксел, вот еще один желтый пиксел, вот следующий желтый пиксел». Кодирование по алгоритму Хаффмана и арифметическое кодирование, основанные на статистической модели, использует предсказуемость, предполагая более короткие коды для более часто встречающихся значений пикселов.

Наличие необязательных данных предполагает использование схемы кодирование с потерями («JPEG сжатие с потерями»). Например, для случайного просмотра человеческим глазом не требуется того же разрешения для цветовой информации в изображении, которая требуется для информации об интенсивности. Поэтому данные, представляющие высокое цветовое разрешение, могут быть исключены. Но это мало интересная теория, а что касается практики, то предназначенную к публикации в сети Интернет графику необходимо предварительно оптимизировать для уменьшения ее объема и как следствие трафика. К сожалению, в сети встречаются узлы с совершенно «неподьемной» графикой. При попадании на такое место лично я стараюсь как можно быстрее уйти оттуда или выключить в браузере отображение графики. Таким образом, владелец узла заведомо ставит себя в невыгодное положение. Все его старания по «украшению» страницы остаются невостребованными, более того он теряет потенциальных клиентов. Сетевая графика представлена преимущественно двумя форматами файлов — GIF (Graphics Interchange Format) и JPG (Joint Photographics Experts Group). Оба этих формата являются компрессионными, то есть данные в них уже находятся в сжатом виде. Сжатие, тем не менее, представляет собой предмет выбора оптимального решения. Каждый из этих форматов имеет ряд настраиваемых параметров, позволяющих управлять соотношением качество-размер файла, таким образом, за счет сознательного снижения качества изображения, зачастую практически не влияющего на восприятие, добиваться уменьшения объема графического файла, иногда в значительной степени.

GIF поддерживает 24-битный цвет, реализованный в виде палитры содержащей до 256 цветов. К особенностям этого формата следует отнести последовательность или перекрытие множества изображений (анимация) и отображение с чередованием строк (Interlaced). Несколько настраиваемых параметров GIF формата, позволяют управлять размером получаемого файла. Наибольшее влияние оказывает глубина цветовой палитры. GIF-файл может содержать от 2-х до 256 цветов. Соответственно меньшее содержание цветов в изображении (глубина палитры), при прочих равных условиях, дает меньший размер файла.

Другой параметр, влияющий на размер GIF-файла — диффузия. Это позволяет создавать плавный переход между различными цветами или отображать цвет, отсутствующий в палитре путем смешения пикселов разного цвета. Применение диффузии увеличивает размер файла, но зачастую это единственный способ более- менее адекватной передачи исходной палитры рисунка после редуцирования. Другими словами применение диффузии позволяет в большей степени урезать глубину палитры GIF-файла и тем самым способствовать его «облегчению». При создании изображения, которое в последующем будет переведено в GIF формат, следует учитывать следующую особенность алгоритма LZW сжатия.

(На самом деле не существует формата JPG, как такового. В большинстве случаев это файлы форматов JFIF и JPEG-TIFF сжатые по JPEG технологиям сжатия. Однако для практики это не имеет особого значения, поэтому будем придерживаться общепринятой терминологии.)

Алгоритм сжатия JPEG с потерями не очень хорошо обрабатывает изображения с небольшим количеством цветов и резкими границами их перехода. Например: нарисованную в обыкновенном графическом редакторе картинку или текст. (Для таких изображений более эффективным может оказаться их представление в GIF-формате.)

В то же время он незаменим при подготовке к web-публикации фотографий. Этот метод может восстанавливать полноцветное изображение практически неотличимое от подлинника, используя при этом около одного бита на пиксел для его хранения. Алгоритм сжатия JPEG достаточно сложен, поэтому работает медленнее большинства других. Кроме того, к этому типу сжатия относится несколько близких по своим свойствам JPEG технологий. Основным параметром, присутствующим у всех них является качество изображения (Q-параметр) измеряемое в процентах. Размер выходного JPG-файла находится в прямой зависимости от этого параметра, т.е. при уменьшении «Q», уменьшается размер файла.

ВИДЕО И АНИМАЦИЯ

          Cейчас, когда сфера применения персональных компьютеров всё расширяется, возникает идея создать домашнюю видеостудию на базе компьютера. Однако, при работе с цифровым видеосигналом возникает необходимость обработки и хранения очень больших объёмов информации, например одна минута цифрового видеосигнала с разрешением SIF (сопостовимым с VHS) и цветопередачей true color (миллионы цветов) займёт (288 x 358) пикселов x 24 бита x 25 кадров/с x 60 c = 442 Мб, то есть на носителях, используемых в современных ПК, таких, как компакт-диск (CD-ROM, около 650 Мб) или жесткий диск (несколько гигабайт) сохранить полноценное по времени видео, записанное в таком формате не удастся. С помощью MPEG-сжатия объем видеоинформации можно заметно без заметной деградации изображения.

 

Что такое MPEG?

MPEG — это аббревиатура от Moving Picture Experts Group. Эта экспертная группа работает под совместным руководством двух организаций — ISO (Организация по международным стандартам) и IEC (Международная электротехническая комиссия). Официальное название группы — ISO/IEC JTC1 SC29 WG11. Ее задача — разработка единых норм кодирования аудио- и видеосигналов. Стандарты MPEG используются в технологиях CD-i и CD-Video, являются частью стандарта DVD, активно применяются в цифровом радиовещании, в кабельном и спутниковом ТВ, Интернет-радио, мультимедийных компьютерных продуктах, в коммуникациях по каналам ISDN и многих других электронных информационных системах.
Часто аббревиатуру MPEG используют для ссылки на стандарты, разработанные этой группой. На сегодняшний день известны следующие:

  • MPEG-1 предназначен для записи синхронизированных видеоизображения (обычно в формате SIF, 288 x 358) и звукового сопровождения на CD-ROM с учетом максимальной скорости считывания около 1.5 Мбит/с. Качественные параметры видеоданных, обработанных MPEG-1, во многом аналогичны обычному VHS-видео, поэтому этот формат применяется в первую очередь там, где неудобно или непрактично использовать стандартные аналоговые видеоносители.
  • MPEG-2 предназначен для обработки видеоизображения соизмеримого по качеству с телевизионным при пропускной способности системы передачи данных в пределах от 3 до 15 Мбит/с, профессионалы используют и большие потоки. аппаратуре используются потоки до 50 Мбит/с. На технологии, основанные на MPEG-2, переходят многие телеканалы, сигнал сжатый в соответствии с этим стандартом транслируется через телевизионные спутники, используется для архивации больших объёмов видеоматериала.
  • MPEG-3 — предназначался для использования в системах телевидения высокой чёткости (high-defenition television, HDTV) со скоростью потока данных 20-40 Мбит/с, но позже стал частью стандарта MPEG-2 и отдельно теперь не упоминается. Кстати, формат MP3, который иногда путают с MPEG-3, предназначен только для сжатия аудиоинформации и полное название MP3 звучит как MPEG Audio Layer III.
  • MPEG-4 — задает принципы работы с цифровым представлением медиа-данных для трех областей: интерактивного мультимедиа (включая продукты, распространяемые на оптических дисках и через Сеть), графических приложений (синтетического контента) и цифрового телевидения.

ЗВУК

Возможна цифpовая запись, pедактиpование, pабота с волновыми фоpмами звуковых данных (WAVE), а также фоновое воспpоизведение цифpовой музыки. Пpедусмотpена pабота чеpез поpты MIDI. Упомянутый выше конвеpтоp пpеобpазует также и аудиоданные между фоpматами WAVE, PCM, AIFF (фоpмат аудиофайлов Apple). В последнее время особую популярность получил формат Mp3. В его основу MPEG-1 Layer III (об этой части стандарта у нас и идет речь) положены особенности челевеческого слухового восприятия, отраженные в «псевдоаккустической» модели. Разработчики MPEG исходили из постулата, что далеко не вся информация, которая содержится в звуковом сигнале, является полезной и необходимой — большинство слушателей ее не воспринимают. Поэтому определенная часть данных может быть сочтена избыточной. Эта «лишняя» информация удаляется без особого вреда для субъективного восприятия. Приемлемая степень «очистки» определялась путем многократных экспертных прослушиваний. При этом стандарт позволяет в заданных пределах менять параметры кодирования — получать меньшую степень сжатия при лучшем качестве или, наоборот, идти на потери в восприятии ради более высокого коэффициента компрессии. Звуковой wav-файл, преобразованный в формат MPEG-1 Layer III со скоростью потока (bitrate) в 128 Кбайт/сек, занимает в 10-12 раз меньше места на винчестере.

Этапы записи  MP3.

Первый этап – быстрое преобразование Фурье (FFT) исходного сигнала (фрейма, так как форматы потоковые). Кратко, FFT – это процесс, представляющий исходный сигнал в виде суммы синусоид:
F(t) = A1sin(λ1t) + … + Ansin(λnt) + …
Теперь, вместо того чтобы хранить информацию о величине амплитуды волны в каждом сэмпле, остаётся запомнить только значения амплитуд (Ai) и длин волн (li). Обратное преобразование Фурье для реальных зву- ков без потери качества невозможно.
        Второй этап – психоакустическая обработка, призванная вычистить из звукового потока информацию, не воспринимаемую человеческим ухом.
И, наконец, третий этап – применение математических алгоритмов сжатия. Во время этой операции происходят только численные преобразования, позволяющие представить информацию в более компактном виде. В MP3, например, используется чуть-чуть доработанный алгоритм Хаффмана.
Алгоритм FFT известен сравнительно давно, поэтому разработчики совершенствуют методики сжатия за счёт оптимизации математического и психоакустических алгоритмов кодирования. Если математический алгоритм в каждом формате свой, то основные принципы действия психоакустического алгоритма сжатия схожи и заимствуют общие идеи у небезызвестного формата MPEG-1 Layer II, разработанного в 1992 году Moving Picture Experts Group.

Использованные ресурсы:

  1. Мультимедиа технологии
  2. Сжатие звука

 Подготовил студент І курса Лихачёв А.А.

 

( поддерживает 24-битный цвет, реализованный в виде палитры содержащей до 256 цветов. К особенностям этого формата следует отнести последовательность или перекрытие множества изображений (анимация) и отображение с чередованием строк (MPEG-2

Популярность: 17%

Рубрика: Информатика ·  

Комментарии

  1. Дмитрий:

    Молодец.
    10 из 10



Оставить комментарий или два

Пожалуйста, зарегистрируйтесь для комментирования.