Тарифы Услуги Сим-карты

Подробнее об аудио форматах. Аудио-форматы: виды и их описание

Существует множество различных аудио-форматов. Вы даже не можете себе представить, насколько много аудио-форматов существует. Сейчас мы рассмотрим только наиболее популярные из них, а если вам нужна исчерпывающая информация, то ее вы можете найти в Википедии.

Аудио форматы

Звук - само по себе явление аналоговое. Чтобы его можно было записать в компьютер, его нужно оцифровать. Оцифрованный звук занимает очень и очень много пространства. Поэтому используют специальные алгоритмы кодирования и сжатия данных - кодеки. Кодеки обеспечивают кодирование/декодирование аудио-/видеоданных, а также сжатие/распаковку таких данных. Скачать набор кодеков для Windows:

Тип формата медиафайла (аудио или видео - без разницы) определяется его расширением. Например, у файлов в формате MP3 расширение.mp3. Кодек для этого формата всегда одинаковый - MPEG Layer-З. А вот для формата MP4 кодеки могут быть разными.

Некоторые форматы, например MP4 и FLV, могут содержать в себе как видео-, так и аудиопотоки. Поэтому если вы видите файл с расширением.mp4, то однозначно нельзя сказать, что в нем - только музыка или только видео, или же фильм - аудио и видео. Ведь изначально в таких форматах заложена возможность передачи как аудио, так и видео.

Все мы знаем, что раз информация сжимается, то возможны ее потери. Поэтому все кодеки можно разделить на две группы: с потерей качества и без потери качества. Пусть вас не пугает слово «с потерей» - как правило, кодеки отсекают «лишнюю» информацию, которая не различима для нашего глаза и уха (практически не различима).

К кодекам, обеспечивающим сжатие без потери качества, относят:

  • FLAC (Free Lossless Audio Codec);
  • APE (Monkey’s Audio);
  • ALAC (Apple Lossless Audio Codec).

А вот кодеки с потерей качества:

Если вы - фанат звука, то есть смысл поискать музыку в формате FLAG. Для обычного же бытового прослушивания вполне хватит самого распространенного формата MP3. К тому же, чтобы ощутить всю разницу между форматами MP3 и FLAC, нужно профессиональное оборудование для воспроизведения звука, к сожалению, планшет к такому оборудованию не относится. Поэтому не вижу смысла загружать музыку в формате FLAC на планшет.

Теперь вкратце рассмотрим сами аудио форматы:

  • WAV - самый первый (или один из первых) аудиоформатов. Используется для хранения несжатых аудиозаписей. Одна минута записи в формате WAV занимает 10 Мб. Обычно в этот формат копируют Audio CD, а потом получившиеся WAV-файлы сжимают МРЗ-кодеком для экономии пространства.
  • MP3 (MPEG Layer-3) - самый распространенный звуковой формат. Он урезает звук с потерей качества, но вырезается лишь звук, который не слышится человеческим ухом. В результате человек не слышит разницы, а места звук занимает меньше. Основная характеристика этого формата - битрейт (bitrate). Чем выше битрейт, тем лучше качество звука. Несжатый Audio CD имеет битрейт 1411,2 Кбит/с. Максимальное качество звучания в случае с форматом MP3 достигается при битрейте 320 Кбит/с. Все, что ниже 320 Кбит/с, -хуже качеством. Разница между 128 Кбит/с и 320 Кбит/с уже ощущается на слух, поэтому, если есть возможность скачать записи с более высоким битрейтом, сделайте это.
  • WMA (Windows Media Audio) - формат, разработанный компанией Microsoft для ОС Windows. Компания Microsoft пыталась создать замену для MP3, но, как показало время, у нее ничего не вышло.
  • OGG - открытый формат, поддерживающий кодирование аудио различными кодеками. Наиболее часто в OGG используется кодек Vorbis. По качеству сжатия формат сопоставим с MP3, но при этом менее распространен с точки зрения поддержки в аудиопроигрывателях и плеерах. Если есть возможность скачать музыку в формате MP3 и OGG, следует выбрать MP3, потому что ваш аудио-проигрыватель может не поддерживать формат OGG.
  • ААС - запатентованный аудиоформат, обеспечивающий лучшее качество звучания, чем MP3. На данный момент это лучший алгоритм кодирования звука с потерями. Файл этого формата может иметь расширения аас, mp4, m4a, m4b, т4р, т4г.
  • FLAC - формат сжатия без потерь. Он не вносит изменений в аудиопоток, поэтому закодированный с его помощью звук идентичен оригиналу. Используется для прослушивания звука на звуковых системах высокого уровня.

Видео форматы

Всевозможных форматов и стандартов видеоконтента не меньше, чем аудиоформатов. Начнем с международных стандартов, определяющих кодирование и формат хранения данных медиафайла:

  • MPEG-1 (Moving Picture Experts Group 1) - это стандарт сжатия видео и аудио. Для видео используется формат Video CD, а для аудио формат MPEG audio layer 3, или сокращенно всем известный формат MP3.
  • MPEG-2 (Moving Picture Experts Group 2) - этот стандарт используется в DVD и цифровом телевидении DBV. В этом формате снимают видео в различных устройствах для съемки видео.
  • MPEG-3 (Moving Picture Experts Group 3) - этот стандарт был разработан для телевидения высокой четкости HDTV, теперь стал частью стандарта MPEG-2.
  • MPEG-4 (Moving Picture Experts Group 4) - этот стандарт используется для сжатия цифрового видео и аудио. Состоит из нескольких стандартов, включает в себя многие возможности MPEG-1 и MPEG-2. В этом стандарте используются различные кодеки: DivX, Xvid, Н.264 (AVC) и другие. Формат MP4 является одной из спецификаций этого стандарта.

Медиафайл (правильнее именно медиафайл, а не видеофайл, поскольку в файле, который мы привыкли считать видеофайлом, есть потоки аудио и видео) имеет две ключевые характеристики: кодек и тип контейнера. Кодек, как мы уже знаем, определяет алгоритм кодирования и сжатия данных. Тип контейнера определяет формат записи с использованием различной информации: видео- и аудиоданные, субтитры и прочая информация, помещенная в контейнер. Примеры кодеков видео - DivX, Xvid, Н.264, Theora. Примеры контейнеров - AVI, QuickTime, 3GP, Ogg, MKV (Matroska).

Наиболее популярные форматы медиафайлов:

  • 3GP - разработан для использования на мобильных телефонах, в ЗС-сетях. Гарантирует мощное сжатие, что позволяет использовать формат на слабых мобильных телефонах.
  • AVI (Audio/Video Interleaved) - разработка Microsoft, один из самых распространенных в мире форматов. В этом формате можно использовать разные кодеки.
  • FLV (Flash Video) - создан для передачи видео через Интернет. Самый распространенный формат в Интернете, часто используется на разных видеохостингах, предназначенных для хранения видео. Обеспечивает хорошее качество картинки при низком битрейте.
  • M2TS - видеофайл формата Blu-Ray.
  • MKV (Matroska) - контейнер, который может содержать видео, аудио, субтитры и прочее. Этот формат может содержать различные типы субтитров и поддерживает добавление нескольких звуковых дорожек в видео файл.
  • OGG - бесплатный, открытый формат, разработанный для хранения медиаконтента, закодированного разными кодеками.
  • ReadMedia - формат, созданный компанией RealNetworks. Используется в основном для трансляции телевидения и потокового видео в Интернете. Низкий битрейт и низкое качество картинки.
  • MOV - контейнер, разработанный корпорацией Apple для QuickTime. Это формат операционной системы Mac OS X.
  • MP4 - формат одной из спецификаций стандарта MPEG-4. Может содержать несколько видео- и аудиопотоков, субтитры, анимацию, панорамные изображения.
  • SWF (Shockwave Flash или Small Web Format) - видеоформат для флеш-анимации, векторной графики, видео и аудио в сети Интернет.
  • WMV (Windows Media Video) - разработка Microsoft. Попытка создать аналог MP4, которая тоже не увенчалась успехом.
  • WebM - открытый формат, предложенный корпорацией Google в качестве замены стандарта H.264/MPEG4.

Страница 1
Музыкальные audio форматы.

В мире музыки существует огромное количество музыкальных форматов их модификаций и версий, созданных гигантами музыкальной индустрии и небольшими компаниями, получившими общественное признание в электронном мире.


Для этих целей были разработаны различные физические методы хранения аудиоданных, например: виниловые пластинки, магнитная лента, компакт-диски, DAT, MD (минидиск), DVD или преобразование нот в музыкальных форматах (MIDI), точно таким же образом появилось множество различных компьютерных методов хранения аудиоданных - digital: OGG, Mp3, Flac, Wav форматов.
Невозможно рассмотреть и обсудить все звуковые форматы, кодеки их достоинства и недостатки, по этому в своей статье мы постараемся рассказать о наиболее популярных расширениях audio files, с которыми Вам, возможно, придется работать.

Почему мы не можем использовать какой ни будь один универсальный формат кодирования аудио-файлов?

Потому, что для реализации различных функций необходим свой формат. Например: для воспроизведения CD в дисководе компакт-дисков, для записи музыки или звуковых эффектов в видеоиграх, для записи дорожки фильма или видеоклипа, для проигрывания в мобильных телефонах или передачи файлов через Интернет, кроме того, существует ряд операционных систем получивших наибольшее распространение в мире. В их число входят: Amiga, Macintosh, NEXT и персональные компьютеры с операционной системой Windows. Кроме того работа dj, звукорежиссера, cj, видеоинженера или простого любителя музыки - достаточно сильно отличаются по своей сути. Для этого может потребоваться, чтобы Ваши аудиоданные были сохранены своим способом. Например, звук для компакт-диска должен быть сохранен с использованием разрядности 16 бит и частоты сэмплирования 44,1 кГц. Однако для загрузки звука через Интернет нам лучше использовать другую разрядность и частоту сэмплирования, поскольку каждая минута 16-битного, 44-килогерцевого звука занимает примерно 10 Мбайт, т.е. средний трэк продолжительностью 5 минут составит 50 "метров" - это слишком большой объем данных для среднестатистического пользователя. В этой статье представлена краткая информация о самых популярных музыкальных форматах.

AA (Audible Audio Book File)

AA (Audible Audio Book File) - формат является закрытым, разработан компанией Audible. Применяется, для записи аудиокниг, которые продаются через сервисы Audible и iTunes. Существует возможность замедлять или ускорять скорость прослушивания файлов - digital pitch, возможность оставлять закладки при прослушивании аудио книг, защита файлов, при доставке звуковых записей посредством internet.

AAC (Advanced Audio Coding)

AAC (Advanced Audio Coding) - формат аудио-файла с меньшей потерей качества при кодировании, чем Mp3 при одинаковых размерах. Кодирование музыки без потерь качества оригинала с помощью профиля ALAC. AAC - семейство алгоритмов аудио кодирования MPEG4. В отличие от гибридного набора фильтров mp3, AAC использует MDST технологию (модифицированное косинусное преобразование) - это значит, что слушатель получает более лучшее качество звука, чем при MP3 кодировании с таким же или меньшим битрейтом. Возможные расширения AAC файлов: .m4a . m4b .m4p.

AIFF

AIFF - Это формат аудиоданных для платформы Apple Macintosh. Формат.aiff поддерживает 8бит и16-битные mono и stereo. Если файлы этого формата содержат заголовок Mac-Binary (тексты, фото, информацию о правообладателе, единый номер и т.п.), в этом случае файл будет иметь расширение.snd. Аудиофайл с расширением.snd можно прослушать с помощью программы Sound Forge. "Форж" конечно откроет такой файл, но распознает его, как формат Macintosh Resource, на качестве звучания - это не отразится.

APE (Monkey"s Audio)


APE - (Monkey"s Audio), разработчик Мэтью Т. Эшланд - формат цифрового звука без потерь качества (lossless). Кодек Monkey"s Audio выпускается только для платформы Microsoft Windows, хотя существует ряд неофициальных кодеков для MacOS, Linux, BeOS. Файлы Monkey"s Audio используют следующие расширения: .ape - для хранения аудио и.apl - для хранения метаданных. Данный формат не является свободным, т.к. лицензия на него серьезно ограничивает распространение.ape files.

DTS

DTS - Digital Theater System , по сути - это Dolby Digital, а точнее его конкурент. Формат DTS использует минимальный уровень сжатия, чем Dolby, так что фактически он звучит лучше, что доказывают на практике DVD диски, на которых записаны дорожки в DTS или в DD формате. DTS в домашних кинотеатрах используется максимальный битрейт 1,536 kbps (full bitrate), такой звук более качественный, чем AC-3 format от Dolby Digital. DTS - использует 6 свободных аудио дорожек и поддерживает систему распределения звука 7.1, при таком битрэйте DTS 4.0 - будет звучать также объемно, как и "Долби" 5.1.

FLAC

FLAC - (Free Lossless Audio Codec). В отличие от кодеков с потерями - Mp3, Ogg и AAC, не удаляет никакой информации из аудиопотока и предназначен для прослушивания музыки на высококачественной Hi-Fi, Hi-End аппаратуре и для архивирования профессиональной аудио-коллекции. В настоящее время формат FLAC поддерживается многими аудио плейерами и музыкальными приложениями. Чтобы хранить основные типы метаданных, базовый декодер использует теги ID3v1 и ID3v2, поэтому их можно свободно добавлять и редактировать.

MIDI

MIDI - (Musical Instrument Digital Interface), в отличие от других форматов, MIDI хранит не цифровой звук, а наборы команд: проигрываемые ноты, ссылки на инструменты, параметры звука. Удобство формата MIDI, заключается в использовании устройства, производящего аранжировку по обозначенным аккордам. Миди файлы, как правило, имеют на несколько порядков меньший размер, чем оцифрованный звук такого же качества. Формат MIDI - универсален и разработан так, чтобы любой секвенсор мог читать и записывать данные без потерь. При этом, непонятная другим программным приложениям информация MIDI - не приводит к недоразумениям, а просто игнорируется. Мидюшный формат минусовки позволяет сохранять информацию об используемом инструменте, темпе, обозначении размера, информацию о музыкальных ключах, названии трека и паттернов и их количестве.

MP3

MP3 - (MPEG Layer версия 3) На данный момент, MP3 является самым популярным форматом цифрового кодирования музыки. MP3 является форматом сжатия с потерями, то есть часть звуковой информации, согласно психоакустической модели, ухо человека воспринять практически не может удаляется из исходного файла - безвозвратно. До сих пор не утихают споры по поводу качества Mp3…Во-первых, качество полученного MP3 зависит не только от битрейта сжатого файла, но и от версии используемой кодирующей программы - кодека. Многие музыкальные гурманы, предпочитают сжимать музыку с "максимальным качеством" - 320kbps, либо переходить на другие форматы, например FLAC, где битрейт в среднем ~1000 kbps. На данный момент MP3 является лидером по общепризнанности, но при этом не является профессиональным, по техническим параметрам, форматом. Профессиональные музыканты и dj уже давно не используют треки с битрейтом менее 320kbps.

MOD

MOD - формат разработан для платформы Amiga. Каждый файл MOD содержит оцифрованные записи real звучания инструментов, так называемые сэмплы, чем-то похож на структуру MIDI. Cj или композитор, пишущий в формате MOD, применяет программу, называемую трэкером, в которой указывает, какой именно инструмент, в какое время, какой нотой и октавой должен прозвучать - эта последовательность нот записывается в список - трек, а несколько параллельно звучащих треков образуют блок, называемый паттерном. Совокупность паттернов образует модуль - файл в формате MOD, с расширением.mod. Одна линейка трекера соответствует одному реальному каналу, в котором cj может проиграть или отредактировать пронумерованные ноты. Нотам могут назначаться различные "орнаментами" - например: тремоло, глиссандо и т.д..

OGG

OGG - Vorbis был разработан в 2002 г. коллективом Xiphophorus, как альтернатива всем платным лицензионным аудио форматам. Ogg Vorbis совместим со всеми популярными платформами. Формат не ограничивает пользователя только двумя аудиоканалами (левый и правый), он поддерживает до 255 отдельных каналов с частотой дискретизации до 192 кГц и разрядностью до 32 бит, поэтому Vorbis великолепно подходит для кодирования 6-канального звука DVD-Audio для домашнего кинотеатра.

TTA

TTA - True Audio - бесплатный, аудио кодек, осуществляющий сжатие музыкальных файлов без потерь в режиме реального времени. Кодек основан на адаптивных предсказывающих фильтрах и обладает всеми улучшенными характеристиками, как и большинство современных кодеров. Сжатый размер файлов будет на 30 % - 70 % меньше, чем original music file. TTA формат поддерживает тэги ID3v1 и ID3v2. Используя True Audio кодек, можно разместить до 20 audio CD на одном DVD-R диске.

VQF

VQF - (Interleave Vector Quanization) - разработан в Японии и основывается на технологии TwinVQ. Если сравнить VQF и MP3, то первый формат на 30-50% будет "компактнее", при одинаковом качестве звука. Это дает VQF - значительное преимущество перед MP3 форматом. Но процесс при кодировании, декодировании (decoder) VQF, занимает примерно на 30% больше ресурсов процессора PC, чем Mp3 аудио.

WAV

WAV - (Microsoft Wave) - не менее популярен чем MP3, но wave файлы не имеют сжатия. Звук сохраняется в моно или стерео с частотой дискретизации 44,1 КГц, 8 или 16 бит.

WMA - (Windows Media Audio) разработанный компанией Microsoft, как альтернатива mp3. Многие меломаны недолюбливают формат WMA за большое количество ошибок различного рода, формат WMA постоянно развивается и улучшается. Например, в новых версиях этого расширения добавлены сложные алгоритмы кодирования звука без потерь (lossless), многоканальное кодирование объемного звука - это очень перспективное свойство, для WMA т.к. файлы могут содержать еще и видео данные. Файлы обозначены расширением.wma и.asf.
страница 1

Прежде чем приступить к обзору наиболее распространенных аудиокодеков, поясним, что это такое и каково их назначение. Кодек, или, другими словами, кодировщик, — это программное либо аппаратное средство для кодирования и декодирования информации (в нашем случае — аудиоинформации) по определенному алгоритму. На рынке представлено огромное количество кодеков, мы же рассмотрим лишь некоторые из них — самые популярные и востребованные.

одирование, или сжатие, может быть двух видов: с потерями информации и без потерь. Для каждого вида кодирования существуют свои виды аудиокодеков. Чем же кодирование информации без потерь отличается от кодирования информации с потерями?

При кодировании информации без потерь сжатие данных не приводит к потере информации, а следовательно, декодируемый аудиофайл абсолютно идентичен оригиналу. При кодировании данным способом сокращение первоначального объема информации достигает 20-50%. Все чаще к такому способу прибегают не только аудиоманы, но и простые пользователи. По мере роста дискового пространства и снижения цен на накопители все больше пользователей предпочитает хранить аудиоданные, закодировав их именно этим способом. Сегодня алгоритмов, позволяющих выполнить данную операцию, существует довольно много, но самыми популярными являются те, что реализованы в кодеках FLAC, Monkey’s Audio, WavPack, и TTA.

Сжатие данных с потерями используется для получения файла минимального размера. Полного соответствия между оригиналом и его преобразованной копией при таком кодировании уже нет, и возможность восстановления потерянной информации тоже отсутствует. Для достижения минимального объема файла применяются различные алгоритмы кодирования — от математических алгоритмов сжатия, при которых качество дорожки не страдает, до так называемой психоакустической модели, предусматривающей удаление из оригинала «ненужных» звуков и сужение частотного диапазона. В связи с особенностями восприятия звука человеческим ухом «ненужными» звуками можно условно назвать те детали аудидорожки, удаление которых не будет сильно заметно. Сам процесс удаления «ненужных» звуков называется квантованием. При кодировании данных с потерями размер оригинала удается уменьшить в несколько раз (в основном от 3 до 12 раз), при этом чем выше степень сжатия, тем меньше соответствие между оригиналом и получаемым аудиофайлом.

Методов сжатия с потерями существует достаточно много, наиболее известные из них — MPEG-1 Layer 3, MPEG-2/4 AAC, Ogg Vorbis, Windows Media Audio, MusePaсk и др.

Сжатие без потерь качества

FLAC

Одним из наиболее популярных форматов для сжатия звука без потерь качества является кодек FLAC. Основными достоинствами этого аудиокодека являются его постоянное обновление и, конечно же, многоплатформенность: FLAC компилируется на множестве платформ — Unixes (Linux, BSD, Solaris, OS X), Windows, BeOS и OS/2. Такая всеобъемлющая поддержка операционных систем способствует широкому использованию данного аудиокодера.

Еще одно достоинство аудиокодека FLAC — наличие (помимо базовых кодера и декодера в виде библиотек, которые входят в комплект инсталлятора) графической оболочки, позволяющей упростить процесс кодирования, а также внешних модулей (плагинов) для разных проигрывателей (включая Winamp разных версий, Foobar2000 и т.д.). В комплект также входят утилита командной строки, выполняющая сжатие и распаковку файлов, и утилита для редактирования метаданных в файлах.

Интересная отличительная особенность FLAC состоит в том, что он позволяет делать архивную копию аудиодиска, записываемую в один файл. В дальнейшем такая копия может быть легко записана на диск в случае утери оригинального диска или его повреждения. FLAC использует восемь степеней сжатия. Как и в любом кодере, от степени сжатия зависит скорость кодирования и размер получаемого файла. К потоку FLAC могут быть добавлены тэги ID3v1 и ID3v2. Эти данные не относятся к формату, однако декодер умеет их пропускать.

Monkey’s Audio

Пожалуй, самым популярным в настоящее время кодеком, сжимающим информацию без потерь, является Monkey’s Audio. Обусловлено это прежде всего бесплатностью данного кодека и достаточно качественным сжатием аудиопотока, которое он обеспечивает. Единственным фактором, ограничивающим сферу его применения, является отсутствие поддержки мультиплатформенности — кодек Monkey’s Audio присутствует только на платформе Windows. Тем не менее поддержка данного формата реализована в ряде проигрывателей, а, например, плагин для проигрывателя Winamp поставляется вместе с Monkey’s Audio. Кроме того, существует возможность установки DirectShow-фильтров для других совместимых плееров. Плагин для воспроизведения поддерживает все распространенные функции и ID3-тэги.

Кодек Monkey’s Audio, безусловно, оценят те, кому необходим максимально качественный звук. Кодек обеспечивает сжатие около 40-50%. При кодировании данных доступны несколько различных степеней сжатия — от параметра, обеспечивающего быстрое кодирование, до параметра, осуществляющего более качественное сжатие с затратой большего процессорного времени. Еще раз отметим, что пользователю при применении компрессии с наивысшей степенью сжатия стоит учитывать, что при проигрывании такого файла программным плеером потребуется больше процессорного времени для его декодирования.

По заверениям разработчика, Monkey’s Audio позволяет кодировать WAV-файлы с любой частотой дискретизации, с 8-, 16- или 24-битным динамическим диапазоном, в моно- или стереорежимах.

После установки дистрибутива Monkey’s Audio пользователь получает возможность кодировать аудиофайлы не только во внутренний формат Monkey’s Audio (*.ape), но и в некоторые другие форматы, которые осуществляют сжатие данных с потерями. Все эти кодеки поддерживаются через графическую оболочку программы. Отметим, правда, что в поставку входят только кодеки, осуществляющие компрессию без потери качества, а все остальные пользователю придется установить в систему самостоятельно.

Как уже подчеркивалось, при всех своих достоинствах Monkey’s Audio остается абсолютно бесплатным, а кроме того, открыт его исходный код, что позволяет разработчикам включать поддержку кодека в свои программы.

WavPack

WavPack — открытый кодек под платформу Windows. При разработке данного формата предполагалось, что он будет использоваться для сжатия информации без потерь, и только впоследствии в него были добавлены функции кодирования с потерями. Кодек является бесплатным, что повышает его привлекательность. Обладает он также и плагинами под более распространенные плееры, установка которых осуществляется пользователем вручную.

Основной особенностью WavPack является возможность создания сразу двух файлов, один из которых является файлом, полученным с потерей качества, а другой — корректирующим: с его помощью можно восстановить основной файл до оригинального состояния.

TTA

TTA (True Audio) — бесплатный мультиплатформенный аудиокодек для компрессии без потерь 8- ,16- или 24-битных аудиофайлов формата WAV. Создан он российскими разработчиками. Кодек TTA обеспечивает компрессию до 30% и способен работать в режиме реального времени. Из достоинств данного кодека стоит отметить тот факт, что пакет TTA содержит DirectShow-кодеки (компрессор, декомпрессор, сплиттер), позволяющие другим приложениям легко работать с потоками True Audio. С корректно установленными кодеками пользователь может проигрывать файлы формата TTA в таких плеерах, как RealOne, RadLight, Windows Media, и в других DirectShow-совместимых проигрывателях.

Сжатие с потерями качества

MPEG-1 Layer 3, или MP3

История формата MPEG началась еще 1988 году, когда был основан комитет Moving Pictures Expert Group. В этом же году была начата разработка формата MPEG-1, который является форматом видеосжатия. Завершение работы над форматом и его стандартизация произошли несколько позже. К моменту окончательной стандартизации формата MPEG-1 было создано три звуковых кодера этого семейства — MPEG-1 Layer I, Layer II и Layer 3. Последний из них является в настоящее время самым популярным цифровым форматом аудиосжатия. Формат MPEG-1 Layer 3 (его более привычное название — MP3) был разработан немецким институтом Fraunhofer IIS совместно с университетом Erlangen. Работа над ним была начата в 1987 году, но только в 1992-м формат приобрел официальный статус и стал неотъемлемой частью MPEG-1.

Продвижение формата MP3 происходило довольно медленно, что объясняется двумя причинами: платность формата и отсутствие проигрывателей музыки данного формата (кроме плеера от Fraunhofer IIS).

Формат MP3 разрабатывался специально для передачи звука по сети, при этом закодированный файл должен был обладать небольшим объемом при качественном звуке. Именно эти параметры (небольшой размер файла при битрейте 128 Кбит/с и достаточно качественное звучание по сравнению с оригиналом) стали в конечном счете главными факторами успеха формата.

Многие пользователи уже поняли, что данный формат не отвечает больше потребностям времени. На смену МР3 идут новые, улучшенные форматы, однако у него еще много приверженцев, и его отмирание, по нашему мнению, произойдет не скоро. Этому тоже есть простое объяснение: если раньше MP3-файлы можно было слушать только на компьютере, то теперь появляется все больше различных аппаратных средств для их прослушивания — формат поддерживается бытовыми DVD-приводами, автомагнитолами, современными мобильными телефонами, карманными компьютерами и т.д.

MPEG-2/4 AAC

В 1994 году был утвержден новый стандарт MPEG-2, который получил продолжение в виде одного из достаточно известных аудиокодеков MPEG-2 AAC (MPEG-2 Advanced Audio Coding). Чуть позже, после того как компания Apple лицензировала MPEG-4, формат стал называться MPEG-4 AAC. Первоначальным разработчиком формата MPEG-2 AAC является все тот же институт Fraunhofer IIS, который совместно с компаниями AT&T, Sony, NEC и Dolby представил данный формат в начале 1998 года.

Сегодня это один из главных конкурентов формата MP3. Как и в MP3, в основе алгоритма AAC лежит психоакустическая модель кодирования. Однако MPEG-4 AAC обладает рядом достоинств по сравнению с MP3. Прежде всего это поддержка многоканального звука и большое количество усовершенствований, направленных на улучшение качества выходного аудиосигнала.

Формат, несомненно, стал бы популярным, если бы не одно обстоятельство, которое несколько приостановило его развитие. После окончания работ над MPEG-2 AAC некоторые из компаний-соучредителей забрали исходные коды стандарта и на их базе создали собственные форматы. Получившиеся форматы не совместимы друг с другом, а кроме того, являются коммерческими. На данный момент существует несколько AAC-кодеков, среди которых наиболее известным является AAC LC, применяемый в технологии Apple QuickTime. Также распространен Nero AAC, используемый в пакете Nero Burning Rom.

Достоинством кодека MPEG-2 AAC является то, что он поддерживается аппаратными плеерами, один из ярких представителей которых популярный плеер Apple iPod. Кроме того, файлы данного формата доступны для покупки через Интернет-магазин компании Apple. Столь широкая поддержка этого формата именитой компанией, а также его применение в промышленных масштабах вселяют в пользователей доверие к данному аудиокодеку.

Ogg Vorbis (OGG)

Аудиокодек Ogg Vorbis увидел свет в 2000 году. Он является открытым и свободным для распространения. Алгоритм Ogg Vorbis рассчитан на сжатие данных на всех возможных битрейтах без ограничений, то есть от 8 до 512 Кбит/с, но при этом только в режиме переменного битрейта (VBR). Алгоритм предполагает хранение внутри файлов подробных комментариев об исполнителе и названии композиции. В алгоритме предусмотрена возможность кодирования нескольких аудиоканалов, а также редактирование содержимого файлов. Кодек поддерживает потоковое воспроизведение. Для хранения данных используется собственный универсальный формат, рассчитанный на хранение любой мультимедийной информации системы Ogg Squish.

Аудиокодек лучше работает на низких битрейтах — до 128 Кбит/с, чем на высоких. В связи с этим существует альтернативный кодек, улучшающий работу кодека Ogg Vorbis на более высоких битрейтах.

В пользу формата Ogg Vorbis можно привести аргумент, который уже упоминался при описании формата MP3, — широкая аппаратная поддержка формата. Недостатком его является невозможность обработки многоканального звука.

Windows Media Audio (WMA)

Разработку аудиокодека, известного сейчас как Windows Media Audio (WMA), начала фирма Voxware, и тогда он назывался Voxware Audio Codec. Впоследствии компания отказалась от разработки данного продукта, а компания Microsoft купила его и доработала. Вследствие этого у кодека изменилось название — на Windows Media Audio — и он стал бесплатным.

В последнее время кодек WMA набирает популярность, поскольку компания Microsoft встроила его в свои операционные системы Windows 2000 и Windows XP.

Сейчас существует несколько версий WMA, которые отличаются друг от друга как поддержкой различных битрейтов, так и качеством кодирования.

На данный момент WMA9 является последней версией кодека и логическим продолжением WMA8. Кодек WMA9 практически не отличим от старой версии, за исключением того, что в нем появилась поддержка переменного битрейта (VBR) и применяется технология Fast Streaming, призванная сократить время буферизации передаваемого конечному пользователю WMA-контента. Разработчики также заявляют о заметном повышении качества кодирования по сравнению с WMA8.

Отметим, правда, что теперь в комплект включены два кодека, один из которых осуществляет сжатие с потерей качества, а другой — без.

Среди основных преимуществ формата нужно упомянуть его достаточно широкую распространенность, возможность воспроизведения на любой Windows-системе и аппаратную поддержку большинством современных плееров. Но и недостатков, останавливающих пользователей от применения данного формата, довольно много. Назовем лишь некоторые из них: формат является закрытым и разрабатывался в коммерческих целях; кодек обладает системой защиты от произвольного копирования (DRM) и различными несовместимыми версиями; имеет низкую скорость кодирования и автоматически добавляет незначительный участок тишины в конце аудиотрека во избежание щелчков.

MusePack (MPC)

Кодек MusePack (первоначальное название — Mpeg Plus) базируется на MPEG-1 Layer II, отсюда его направленность на кодирование преимущественно на более высоких битрейтах, нежели MP3. Данным аудиокодеком предусмотрено кодирование только в режиме переменного битрейта (VBR). Скорость компрессии и декомпрессии в формат заметно выше скорости выполнения этих операций применительно к MP3-файлам. В среднем качество кодирования MPC на высоких битрейтах заметно выше качества, обеспечиваемого MP3, что прежде всего связано с различиями в механизмах кодирования. Недостатком кодека является отсутствие поддержки многоканального звука и аппаратной поддержки.

В MusePack можно настроить качество кодирования, реализованное в виде нескольких встроенных настроек (presets), каждая из которых рассчитана на определенный диапазон. Другой интересной особенностью MusePack является то, что он позволяет использовать в качестве исходного материала не только WAV-файлы, но и файлы, закодированные большинством популярных кодеков, которые выполняют сжатие без потери качества.

Мы рассмотрим различные форматы звуковых файлов:

WAVE (.wav) - наиболее широко распространенный звуковой формат. Используется в OC Windows для хранения звуковых файлов. В его основе лежит формат RIFF (Resource Interchange File Format), позволяющий сохранять произвольные данные в структурированном виде. Для записи звука используются различные способы сжатия, поскольку звуковые файлы имеют большой объем. Самый простой способ сжатия - импульсно-кодовая модуляция (Pulse Code Modulation, PCM), но он не обеспечивает достаточно хорошего сжатия.

AU (.au,.snd) - формат звуковых файлов, используемый на рабочих станциях фирмы Sun (.au) и в операционной системе NeXT (.snd). Получил широкое распространение в сети Internet, на ранней стадии развития которой играл роль стандартного формата для звуковой информации.

MPEG-3 (.mp3) - формат звуковых файлов, один из наиболее популярных на сегодняшний день. Был разработан для сохранения звуков, отличных от человеческой речи. Используется для оцифровки музыкальных записей. Предшествующие версии формата: MP1 и MP2. При кодировании применяется психоакустическая компрессия, при которой из мелодии удаляются звуки, плохо воспринимаемые человеческим ухом. Ранние версии обеспечивают худшую компрессию, но менее требовательны к ресурсам компьютера при воспроизведении. Характеристики процессора напрямую влияют на качество звучания, - чем слабее процессор, тем больше искажения звука.

MIDI (.mid) - цифровой интерфейс музыкальных инструментов (Musical Instrument Digital Interface). Этот стандарт разработан в начале 80-х годов для электронных музыкальных инструментов и компьютеров. MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком - это сокращенная форма записи музыки в числовой форме. MIDI-файл представляет собой последовательность команд, которыми записаны действия, например, нажатие клавиши на пианино или поворот регулятора. Эти команды, посылаемые на устройство воспроизведения MIDI-файлов, управляют звучанием, небольшое MIDI-сообщение может вызвать воспроизведение звука или последовательности звуков на музыкальном инструменте или синтезаторе, поэтому MIDI-файлы занимают меньший объём (единица звукового звучания в секунду), чем эквивалентные файлы оцифрованного звука.

MOD (.mod) - музыкальный формат, в нем хранятся образцы оцифрованного звука, которые можно затем использовать как шаблоны для индивидуальных нот. Файлы в этом формате начинаются с набора образцов звука, за которыми следуют ноты и информация о длительности. Каждая нота воспроизводится с помощью одного из приведенных в начале звуковых шаблонов. Такой файл относительно невелик и имеет структуру, базирующуюся на нотах. Это облегчает его редактирование с помощью программ, имитирующих традиционную музыкальную запись. Он, в отличие от MIDI-файла, полностью задает звук, что позволяет воспроизводить его на любой компьютерной платформе.



IFF (.iff) - Interchange File Format – формат, первоначально разработанный для компьютерной платформы Amiga. Сейчас также используется на компакт-дисках в форме CD-I. Его структура очень похожа на структуру формата RIFF.

AIFF (.aiff) - Audio Interchange File Format - формат для обмена звуковыми данными, используется на компьютерных платформах Silicon Graphics и Mac. Во многом напоминает формат Wave, однако в отличие от него позволяет использовать оцифрованный звук и шаблоны. Многие программы способны открывать файлы в этом формате.

RealAudio (.ra, .ram) - формат, разработанный для воспроизведения звука в Internet в реальном времени. Разработан фирмой Real Networks (www.real.com). Получающееся качество в лучшем случае соответствует посредственной аудиокассете, для качественной записи музыкальных произведений использование формата mp3 более предпочтительно.

4.3. MIDI и цифровой звук: достоинства и недостатки

Формат WAVE представляет собой один из многочисленных, но далеко не единственный формат для записи цифрового звука. В отличие от MIDI-данных данные цифрового звука действительно представляют звук, записанный в виде тысяч единиц, называемых квантами (samples). Цифровые данные представляют амплитуду (или громкость) звука в дискретные моменты времени. Звучание цифровых данных не зависит от устройства воспроизведения и поэтому их звучание всегда одинаково. Но за это приходится расплачиваться большими объемами звуковых файлов.

MIDI-данные по отношению к цифровым данным - то же самое, что и векторная графика по отношению к растровым изображениям. То есть MIDI-данные зависят от устройств воспроизведения звука, а цифровые данные не зависят. Так же как вид векторных графических изображений зависит от принтера или экрана монитора, так и звучание MIDI-файлов зависит от MIDI-устройства для воспроизведения этих файлов. Аналогично, звучание мелодии, сыгранной на концертном фортепиано, будет отличаться от звучания этой же мелодии на простом пианино. Цифровые данные, с другой стороны, идентичны и не зависят от системы воспроизведения. Стандарт MIDI в этом смысле аналогичен стандарту PostScript и позволяет управлять инструментами на понятном языке.

По сравнению с цифровым звуком MIDI имеет следующие преимущества:

§ MIDI-файлы занимают меньший объем памяти, и размер этих файлов не влияет на качество звучания. В среднем MIDI-файлы в 200 - 1000 раз меньше цифровых файлов и поэтому занимают малый объем в оперативной памяти, на дисках, и для них не требуется больших ресурсов центрального процессора.

§ В некоторых случаях звучание MIDI-файлов лучше, чем цифровых аудиофайлов. При этом источник звучания MIDI-файлов должен быть высокого качества.

§ Вы можете изменять длину MIDI-файлов, изменяя темп звучания и при этом сохраняя качество и громкость звучания. MIDI-данные можно легко редактировать, даже на уровне отдельных нот. Вы можете манипулировать небольшими сегментами MIDI-композиции (с точностью до миллисекунд), что невозможно в случае цифрового звука.

Основной недостаток MIDI-файла вытекает из его достоинств. Поскольку MIDI-данные не являются сами по себе звуком, то воспроизведение будет настолько точным, насколько устройство воспроизведения MIDI-данных идентично устройству, которое использовалось для создания исходного файла. Даже звук MIDI-инструмента в соответствии со стандартом General MIDI зависит от электронного устройства воспроизведения и используемого при этом метода. MIDI-звук не используют для воспроизведения речи.

Основное преимущество цифрового аудио перед MIDI-звучанием заключается в том, что качество воспроизведения цифрового звука всегда постоянно, и здесь MIDI-звучание уступает цифровому звучанию. Существуют две причины, по которым следует работать с цифровым звуком:

§ более широкий выбор программ и систем, которые поддерживают работу с цифровым звуком;

§ для подготовки и создания цифровых звуковых элементов не требуется знание музыкальной теории, чего не скажешь о MIDI-данных.

Практически любой пользователь компьютера периодически слушает на нем музыку, которая хранится в электронном виде. Форматов для хранения музыки существует достаточно много, каждый из них был разработан для конкретных задач:

  • Воспроизведение с CD диска;
  • Звуковое сопровождение компьютерной игры;
  • Аудиодорожка в ;
  • Потоковое воспроизведение через Интернет;
  • Рингтоны для мобильных телефонов.

Попробуем разобраться в некоторых из них, также как и в …
Основные определения

  • Битрейт – объем информации, используемый при кодировании для воспроизведения 1 секунды. Чем он выше – тем меньше искажений, и звук максимально соответствует оригиналу.
  • Lossless – кодирование звука без потерь качества. При конвертировании в lossless-форматы и обратно получаем абсолютно одинаковый звук.
  • Lossy – форматы сжатия, рассчитанные на то, что человек просто физически не может слышать определенные частоты, которые пропускаются в процессе конвертации. При этом можно значительно сэкономить на объеме дискового пространства.

Audio-CD

Формат, положивший начало эпохе цифрового звука после перехода с виниловых пластинок. Был принят за стандарт в 1979 году компаниями Philips и Sony. В формате audio-CD физически музыка может храниться только на оптическом носителе, при записи на жесткий диск звуковая дорожка должна быть переконвертирована.

Благодаря высочайшему качеству звука и возможности воспроизведения на любом проигрывателе формат остается очень популярным, несмотря на то, что он достаточно устарел.

Flac

Пожалуй, самый распространенный формат для хранения музыки в losseless. По сравнению с остальными кодеками, обеспечивающими сжатие аудио без потерь, flac, разработанный компанией xiph.org , абсолютно бесплатен и дает минимальный размер выходного файла.

Mp3

Самый массовый музыкальный формат, принятый в качестве неофициального стандарта для любого устройства воспроизведения. Его популярность основана на том, что благодаря срезанию неслышимых ухом частот при практически том же качестве звука mp3 файл составляет 30% от оригинального losseless-файла.

Первая звуковая дорожка в mp3-формате появилась еще в 1994 году. Одна из причин популярности – возможность хранения разнообразной дополнительной информации в тегах аудиофайлов и удобство организации музыкальной библиотеки.

Ogg

Новый lossy-формат, увидевший свет в 2002 году как бесплатная альтернатива платным форматам. В отличие от своих предшественником, в частности mp3, допускает возможность многоканального кодирования и хранения многоканального аудио. Получил наибольшее распространение в видеоиграх.