Тарифы Услуги Сим-карты

Популярные форматы аудио файлов. Форматы аудио файлов

Практически любой пользователь компьютера периодически слушает на нем музыку, которая хранится в электронном виде. Форматов для хранения музыки существует достаточно много, каждый из них был разработан для конкретных задач:

  • Воспроизведение с CD диска;
  • Звуковое сопровождение компьютерной игры;
  • Аудиодорожка в ;
  • Потоковое воспроизведение через Интернет;
  • Рингтоны для мобильных телефонов.

Попробуем разобраться в некоторых из них, также как и в …
Основные определения

  • Битрейт – объем информации, используемый при кодировании для воспроизведения 1 секунды. Чем он выше – тем меньше искажений, и звук максимально соответствует оригиналу.
  • Lossless – кодирование звука без потерь качества. При конвертировании в lossless-форматы и обратно получаем абсолютно одинаковый звук.
  • Lossy – форматы сжатия, рассчитанные на то, что человек просто физически не может слышать определенные частоты, которые пропускаются в процессе конвертации. При этом можно значительно сэкономить на объеме дискового пространства.

Audio-CD

Формат, положивший начало эпохе цифрового звука после перехода с виниловых пластинок. Был принят за стандарт в 1979 году компаниями Philips и Sony. В формате audio-CD физически музыка может храниться только на оптическом носителе, при записи на жесткий диск звуковая дорожка должна быть переконвертирована.

Благодаря высочайшему качеству звука и возможности воспроизведения на любом проигрывателе формат остается очень популярным, несмотря на то, что он достаточно устарел.

Flac

Пожалуй, самый распространенный формат для хранения музыки в losseless. По сравнению с остальными кодеками, обеспечивающими сжатие аудио без потерь, flac, разработанный компанией xiph.org , абсолютно бесплатен и дает минимальный размер выходного файла.

Mp3

Самый массовый музыкальный формат, принятый в качестве неофициального стандарта для любого устройства воспроизведения. Его популярность основана на том, что благодаря срезанию неслышимых ухом частот при практически том же качестве звука mp3 файл составляет 30% от оригинального losseless-файла.

Первая звуковая дорожка в mp3-формате появилась еще в 1994 году. Одна из причин популярности – возможность хранения разнообразной дополнительной информации в тегах аудиофайлов и удобство организации музыкальной библиотеки.

Ogg

Новый lossy-формат, увидевший свет в 2002 году как бесплатная альтернатива платным форматам. В отличие от своих предшественником, в частности mp3, допускает возможность многоканального кодирования и хранения многоканального аудио. Получил наибольшее распространение в видеоиграх.

На сегодняшний день существует около трех десятков распространенных цифровых аудиоформатов. Зачем понадобилось создавать такое количество видов звуковых файлов для хранения одного типа контента и как со всем этим управляться вы узнаете из этого материала.

Вступление

Наверняка многие пользователи предпочитают использовать домашний компьютер не только в качестве рабочей лошадки, но и как мультимедийный центр, на котором можно просматривать фильмы или семейные фотографии, а так же слушать любимую музыку. Хотя наверняка, для прослушивания музыкальных композиций более подходящими являются компактные цифровые плееры или мобильные телефоны, но в отличие от них, компьютер умеет не только проигрывать музыку.

Каким бы большим объемом встроенной памяти не обладал ваш музыкальный плеер, скорее всего, хранить в нем всю фонотеку вряд ли удастся. Более того, с помощью ПК можно создавать, редактировать, упорядочивать и искать музыку. Так же не стоит забывать, что на сегодняшний день существует около трех десятков распространенных цифровых аудио форматов, а большинство плееров далеко не всеядны, и способны воспроизводить только некоторые из них.

Так зачем же понадобилось создавать такое количество музыкальных форматов для хранения одного типа контента? Все дело в том, что звук в подавляющем большинстве случаев хранится в «сжатом» виде, так как одна минута несжатой композиции занимает на жестком диске около 10 Мб. С одной стороны это вроде бы не много, а с другой, если вы меломан и ваша коллекция состоит из нескольких сотен или даже тысяч песен, то становится ясно, что звук необходимо сжимать, для уменьшения занимаемого им места на электронных носителях информации.

Для сжатия музыкальных файлов используются различные особые алгоритмы, которые впоследствии определяют структуру и особенности представления звуковых данных или так называемые цифровые аудиоформаты файлов. Все звуковые форматы можно разбить на три группы: аудиоформаты без сжатия, со сжатием без потерь и с применением сжатия с потерями.

Без сжатия

Одним из самых распространенных форматов, относящихся к этому типу, можно смело считать известнейший WAV. Звук в файлах с таким расширением хранится без какого-либо сжатия и изменений. Правда места для хранения несжатых файлов требуется гораздо больше и поэтому наиболее широкое применение WAV находит лишь в профессиональных аудио и видео приложениях, где звук перед обработкой не должен иметь потери в качестве. Хранение же обычных музыкальных композиций в таком виде является неоправданной расточительностью.

Для воспроизведения WAV-файлов вам не потребуется какое-то специальное программное обеспечение, так как этот формат понимают все медиаплееры, включая и встроенный в систему Windows штатный проигрыватель аудиофайлов Windows Media.

Еще одним форматом, использующимся для хранения несжатого аудио, о котором стоит упомянуть, является разработка компании Appleпод названием AIFF (Audio Interchange File Format). Как вы, наверное, уже догадались, наиболее часто он используется в компьютерах Macintosh под управлением систем Mac OS X.

Сжатие без потерь (lossless )

Алгоритмы, осуществляющие сжатие аудиофайлов без потерь работают по принципу обычных архиваторов. Обеспечивая не самый высокий уровень сжатия (от 40 до 60%), при этом они практически не влияют на качество звука. Так же стоит отметить, что в этом случае, закодированные данные можно полностью восстановить до первоначального вида. Поэтому использование сжатия без потерь наиболее часто применяется в тех случаях, когда важно сохранить идентичность сжатых данных оригиналу.

Наиболее популярными аудиоформатами в этой группе являются FLAC (Free Lossless Audio Codec), APE (Monkey’s Audio), WMA (Windows Media Lossless) и ALAC (Apple Lossless Audio Codec). У каждого из них есть свои плюсы и свои минусы. Например, кодек APEдает несколько больший выигрыш в сжатии, а FLAC является более распространенным. В общем же, все настоящие меломаны хранят свои музыкальные коллекции именно в lossless-форматах, так как в них не удаляется никаких данных из аудиопотока, а созданные с помощью этих кодеков файлы, можно прослушивать даже на высококачественной звуковой аппаратуре.

Для воспроизведения сжатых без потерь форматов, как правило, используются сторонние плееры (кроме WMA), такие как MPlayer, foobar, AIMP, Winamp, VLC и прочие, так как в них уже встроены все необходимые кодеки. Другим вариантом является отдельная установка пакета дополнительных кодеков (например, K-Lite), после чего прослушивание файлов в lossless-формате становится доступным практически из любого аудиопроигрывателя.

Сжатие с потерями

Это самая популярная группа алгоритмов, которые обеспечивают максимальную (до 10 раз и даже более) степень сжатия звука. Правда в отличие от предыдущих форматов, здесь аудиофайл теряет в качестве, а насколько сильно - напрямую зависит от степени его сжатия.

Для определения качества оцифрованного звука наиболее часто применяется такой показатель, как битрейт - скорость звукового потока, получившаяся после сжатия и измеряемая в килобитах в секунду (kbps). Как мы уже говорили, в среднем минута несжатого звука занимает около 10 Мб, что соответствует аудиопотоку примерно в 1400 кбит/c. После кодирования с потерями, его битрейт может снизиться до 56 кбит/с. При этом, стоит учитывать, что для сохранения естественного звучания скорость потока должна быть не ниже 192 или 256 кбит/c. Если же битрейт потока составляет 320 кбит/c и более, то разница в звучании для большинства людей между сжатым и несжатым аудио практически исчезает.

Самым популярным форматом здесь однозначно считается знаменитый и всеми любимый MP3, разработанный специалистами известной группы MPEG (Moving Picture Experts Group). Наиболее широко он используется для кодирования аудиофайлов, размещаемых в интернете и различных файлообменниках из-за возможности существенно уменьшить размер передаваемых данных, что при низкой скорости подключения к сети немаловажно.

Другими известными форматами из этой серии являются AAC (Advanced Audio Coding) и OGG Vorbis. При этом, будучи менее популярными, их алгоритмы сжатия совершеннее, чем у основного конкурента. Так при одинаковом размере файла, они обеспечивают лучшее качество звукового ряда по сравнению с MP3. Еще одно серьезное преимущество данных форматов - возможность кодирования до 48 звуковых каналов у AAC и 255 у OGG, против всего двух у MP3.

Стоит отметить, что и формат WMA - собственность компании Microsoft, изначально создавался для хранения и трансляции аудиоинформации в сжатом виде с потерями, а кодирование без потери качества добавилось к нему не так давно, начиная с Windows Media Audio 9.1. Номинально этот формат обеспечивает лучшую степень сжатия, чем MP3, что дает возможность разработчикам противопоставлять его в качестве альтернативы конкурирующим алгоритмам AAC и OGG. Правда широкому распространению WMA мешает его закрытость и ограниченность применения на многих платформах (операционных системах). Да и встроенная поддержка цифровой системы управления авторскими правами (DRM) не добавляет популярности детищу Microsoft.

Не смотря на то, что MP3 проигрывает своим конкурентам, как по эффективности сжатия, так и по качеству звучания, он до сих пор продолжает оставаться самым популярным аудиоформатом. Секретом такого успеха, наверное, можно назвать банальную инерцию мышления, так как за многие годы к нему привыкло большинство пользователей, производителей аппаратуры и разработчиков программного обеспечения. Именно поэтому MP3-файлы можно прослушать вообще на всем, что способно проигрывать цифровой звук - будь то мобильный телефон, персональный компьютер с любой популярной операционной системой, портативный аудиоплеер, современный музыкальный центр или DVD-проигрыватель.

И хотя другие форматы пока что такой поддержкой похвастаться не могут, у них тоже все не так уж и плохо. Так AAC нашел широкую поддержку со стороны компании Apple, которая использует его алгоритмы для хранения аудиокниг, подкаст, музыкальных композиций в магазине iTunes и рингтонов. Так что для поклонников компьютеров Macintosh, планшетов iPad, смартфонов iPhone и плееров iPod этот формат можно считать «родным».

Файлы WMA легко воспроизводятся на любом ПК под управлением операционной системы Windows, которая является самой распространенной в мире. При этом многие производители портативных аудиоплееров и стационарных проигрывателей оптических дисков так же поддерживают этот формат. А вот для прослушивания файлов в форматах OGG Vorbis или AAC в Windows-системах придется установить специальные кодеки. Хотя это не проблема. Установка вышеупомянутого бесплатного пакета кодеков K-Lite Codek Pack позволит проигрывать на вашем компьютере с помощью любимого плеера практически любые звуковые файлы.

Заключение

В заключение давайте посмотрим, какой набор программного обеспечения вам понадобится, что бы превратить свой домашний компьютер в универсальный инструмент для работы с аудиофайлами. Для удобства, разделим все приложения на несколько основных групп.

Плееры - служат для непосредственного воспроизведения звуковых файлов, а так же часто используются для каталогизации и упорядочивания музыкальных коллекций. Их количество столь огромно, что и не сосчитать. Но все же, что бы несколько облегчить вам выбор, приведем, на наш взгляд, двенадцать самых популярных: Windows Media Player (встроен в систему), Winamp, KMPlayer, iTunes, GOM Player, jetAudio, VLC Media Player (VideoLAN), AIMP, BSPlayer, Real Player, WinDVD и Foobar2000.

Конверторы - приложения, способные осуществлять перекодировку из одного формата в другой. Для этой цели можно использовать большинство популярных плееров, не прибегая к использованию специальных программ. Хотя в некоторых случаях без этого не обойтись.

Рипперы (грабберы) - позволяют извлекать цифровую звуковую информацию с оптических носителей (Audio-CD, DVD) и сохранять ее в различных форматах. Несмотря на многочисленность всевозможным грабберов, на этом поприще наибольшую популярность снискало приложение EAC (Exact Audio Copy), позволяющее делать наиболее точные копии дисков. К другим популярным рипперам относятся: Audiograbber, Reaper, Easy CD-DA Extractor и прочие.

Редакторы - программы, предназначенные для создания, записи и редактирования звуковых данных. В этой группе существуют как довольно простые программы, позволяющие сделать элементарные операции с аудиофайлом (вырезать, обрезать, объединить, нормализовать и т.д.), так и настоящие монстры для профессиональной работы со звуком. Среди небольших редакторов можно выделить приложение Nero WaveEditor, за его скромный размер и при этом довольно высокую функциональность. К наиболее популярным профессиональным решениям обработки звука относятся: Adobe Audition, Sound Forge, Cubase, Sony Vegas Pro и другие.

Конечно, чисто теоретически все эти необходимые функции может сочетать в себе только одна программа, но на практике использовать единственное приложение для всех задач не всегда удобно. Да и добиться от одной программы качественного выполнения всех задач практически невозможно.

В любом случае гораздо удобнее иметь под рукой несколько специализированных приложений, которые и места занимают меньше, и с задачами своими по отдельности справляются лучше.

Cразу оговоримся, что статья говорит ТОЛЬКО об общих характеристиках и не будет включать в себя некоторые подробности. В будущем Лайфхакер проведёт собственное беспристрастное исследование. А сегодня попробуем обобщить уже так или иначе известный опыт.

Есть аналог и цифра.

Аналог - хорошо, но недолговечно и неудобно. Поэтому аналоговые носители, несмотря на высокие продажи винила, не вернутся.

Аудиоцифра может быть трёх основных типов:

  • в формате, не использующем сжатие;
  • в формате, использующем сжатие без потерь (lossless);
  • в формате, использующем сжатие с потерями (lossy).

На графиках - хороший AudioCD, сжатый OGG с переменным битрейтом 350 кбит/с и MP3 с использованием Lame. Чем ниже располагается график, тем ближе звучание к оригиналу. Получается очень интересная картина. Несмотря на то, что MP3 обладает явно срезанными высокими частотами, в отличие от OGG, в котором видно завал ниже 2 кГц.

Частотно-временное распределение звука говорит о не менее интересных вещах. При постоянном битрейте 320 кбит/с MP3 почти совпадает с оригинальной записью. Кажется, теперь всё встаёт на свои места. Но… На самом деле всё ещё больше запутывается.

Зачем вообще пользоваться lossy, когда есть доступный lossless

Здравый смысл.

Дело в том, что большая часть аналоговых записей не содержит того количества информации, которое необходимо было бы хранить в высококачественных форматах. Не стоит забывать, что родной частотой дискретизации для CD является 44,1 кГц, квантование - всего 16 бит.

Предыдущие графики неплохо демонстрируют высокую точность передачи MP3. А ведь для аудиокассеты, магнитной ленты (если, конечно, это не мастер-тейп) характеристики AudioCD недостижимы. Да и для массового студийного оборудования возможность записи аналогового звука, соответствующего AudioCD, появилась относительно недавно. Нет никакого смысла оцифровывать во FLAC (и тем более в WAV) концертную запись или пластинку из доцифровой эпохи, в особенности сделанные с магнитных носителей. Они не содержат тех спектров и того количества информации, которые могут хранить контейнеры без сжатия.

Что изменилось сегодня

Редкий звукорежиссёр делает цифровую мастер-запись (с которой затем производится размножение на физические носители), используя современные технологии на полную катушку. Поэтому шанс того, что 24-битный трек на самом деле всего лишь 16-битный, крайне высок.

Аналоговую высококачественную запись на высококачественном оборудовании сегодня встретить ещё сложнее - если только у фанатов подобного звучания. Таким, например, является Джек Уайт, экс-лидер группы White Stripes. При этом часть его записей относится к вариациям lo-fi, и искать там запредельные звуковые характеристики дорожки становится своеобразным удовольствием для гурманов.

Если представить себе идеальный исходник, то только тренированный слух или прослушивание на качественном аудиооборудовании позволит найти сжатый файл. И уже опираясь на это (и ), стоит сделать следующий вывод:

Необходимым и достаточным для среднеценового оборудования является AAC, в отсутствие которого (и при отсутствии исходников, которые можно кодировать в AAC) - MP3 с постоянным битрейтом 320 кбит/с, созданный при помощи кодека Lame 3.93 (рекомендуемые ключи при декодировании: —cbr -b320 -q0 -k -m s).

Исключение составляют записи, изначально полученные в высоком качестве, скажем, записанные на DVD-Audio, SACD, или записи, изначально собранные в DSD (или аналогичном формате) с высоким битрейтом.

Хотя кое-какие особенности у lossless есть. И о них мы расскажем в следующий раз.

Является основным аудио форматом для многих и многих систем воспроизведения цифрового звука и используется как стандартный формат звуковых файлов в персональных компьютерах. К тому же, он имеет солидный набор спецификаций, изрядно пополнившийся за последнее время. Его полное название - Microsoft RIFF/WAVE - Resource Interchange File Format/Wave - формат файлов передачи ресурсов/волновая форма, и создан он был инженерами Microsoft и Intel. В свою очередь, WAV расшифровывается как Waveform Audio File Format.

WavPack (расширение.WV)

WavPack также включает уникальный «гибридный» режим, который предоставляет все преимущества сжатия без потерь с дополнительным бонусом: вместо создания одного файла, в этом режиме создается относительно небольшой файл высокого качества с потерей (.wv), который может проигрываться сам по себе, а также файл «коррекции» (.wvc), который (в комбинации с предыдущим.wv) позволяет полностью восстановить оригинал. Для некоторых пользователей это означает, что им никогда не придётся выбирать между сжатием без потерь и с потерей качества.

Формат имеет очень хорошую поддержку в проигрывателях. Помимо, разумеется, плагина для Winamp с официального сайта кодека http://www.wavpack.com можно закачать плагины для Adobe Audition (!) и Nero Burning Rom. Есть отличный плагин для XMMS – аналога Winamp для Linux. Кроме того существует проект по разработке DirectShow фильтров для WavPack – это позволит использовать формат в любой Windows-программе, в том числе и Windows Media Player. Скачать последнюю версию можно отсюда. Для WavPack существует фронтэнд от сторонних разработчиков. Его качаем тут.

С технической точки зрения также придраться не к чему. Поддерживается многоканальный звук, 32-битное разрешение аудиопотока, частота семплирования – до 192 кГц (!).

Формат, как и исходные коды программы для сжатия являются открытыми. К большому сожалению кодер скомпилирован лишь для платформы Windows, однако всегда остаётся возможность самостоятельно перекомпилировать доступные исходные коды для своей операционной системы.

Сайт, как и сам кодек регулярно обновляются, что не может не радовать.

DTS - Digital Theater System, по сути - это Dolby Digital, а точнее его конкурент. Формат DTS использует минимальный уровень сжатия, чем Dolby, так что фактически он звучит лучше, что доказывают на практике DVD диски, на которых записаны дорожки в DTS или в DD формате. DTS в домашних кинотеатрах используется максимальный битрейт 1,536 kbps (full bitrate), такой звук более качественный, чем AC-3 format от Dolby Digital. DTS - использует 6 свободных аудио дорожек и поддерживает систему распределения звука 7.1, при таком битрэйте DTS 4.0 - будет звучать также объемно, как и "Долби" 5.1.

Windows Media Audio (WMA)

Лицензируемый формат файла, разработанный компанией Microsoft для хранения и трансляции аудио-информации.

Номинально формат WMA характеризуется хорошей способностью сжатия, что позволяет ему «обходить» формат MP3 и конкурировать по параметрам с форматами Ogg Vorbis и AAC. Но как было показано независимыми тестами, а также при субъективной оценке качество форматов все таки не является однозначно эквивалетным, а преимущество даже перед MP3 однозначным, как это утверждается компанией Microsoft.

Кодек является частью комплекта Windows Media Audio. Он бесплатный, однако формат, равно как и программа для кодирования являются закрытыми. Разумеется, версия существует только для платформы Windows.

В принципе, WMA Lossless подеерживает все необходимые функции: теги, высокие частоты семплирования, многоканальный звук (включая 7.1), трансляцию аудио через сеть и т.д. Кроме того, встроенная поддержка декодера в Windows Media Player избавляет пользователя от необходимости скачивать что-либо из Интернета для воспроизведения музыкального файла.

MP3 - (формат кодирования звуковой дорожки MPEG) - лицензируемый формат файла для хранения аудио-информации.

Самый популярный формат сжатия на сегодняшний день. Формат МР3 (MPEG Layer 3) был разработан, после ряда промежуточных форматов, институтом Фраунхофера в Германии. Вообще то, формат.МР3 основан на обмане человеческого уха. После некоторых исследований выяснилось, что человеческому слуху свойственно адаптироваться к появлению новых звуков, что выражается в повышении порога слышимости. Поэтому одни звуки способны маскировать (то есть, делать субъективно неслышимыми) другие. Вот и в этом формате часть звуков, которые, как считает соответствующая теория, делаются неслышимыми, просто убираются из общего звучания. После чего получившийся «полуфабрикат» кодируется по методу Хоффмана. Обязательно следует учитывать то, что в формате МР3 программы, сжимающие звук из оригинального, не являются стандартизированными, то есть каждый грамотный программист может реализовать свою схему сжатия. А стандартам подчиняются только декодеры, что приводит к тому, что качество воспроизведения формата МР3 далеко не всегда зависит от плеера, проигрывающего этот файл. В связи с разными способностями и пристрастиями реализаторов различных кодеров, одни из них лучше справляются с симфонической музыкой, другие - с роком и металлом, третьи - с рэпом и рэйвом и так далее.

JointStereo, являющийся одной из особенностей МР3, означает, что вместо кодирования стерео как двух независимых каналов производится кодирование т.н. центрального канала и разницы, отличающей его от исходных стереоканалов. Довольно много составляющих звука в стереоканалах одинаковы, и их кодирование в общем канале позволяет высвободить дополнительную полосу для более подробного кодирования разницы, что приводит к некоторому улучшению качества.

Обязательно следует упомянуть и о Variable Bit Rate, или VBR. Это означает, что кодер изменяет степень сжатия «на лету», в зависимости от характера звука. Такой подход приводит к уменьшению итогового размера файла или, при увеличении требований к качеству, при том же размере файла позволяет добиться лучшего звучания.

Появившийся в 2001 году кодек MP3 Pro был создан компанией Coding Technologies совместно с Thomson Multimedia. В его основе лежит МР3. В нем используется технология SBR (Spectral Band Replication), за счет чего кодек обеспечивает хорошее качество на низких битрейтах. Однако качество кодирования на средних и высоких скоростях передачи данных уступает качеству почти всех других кодеков. В итоге MP3 Pro применяется больше для трансляций в интернете и демонстраций фрагментов новых музыкальных композиций.

Vorbis - свободный формат сжатия звука с потерями, официально появившийся летом 2002 года. Психоакустическая модель, используемая в Vorbis, по принципам действия близка к МР3 и подобным, однако математическая обработка и практическая реализация этой модели существенно отличаются, что позволило авторам объявить свой формат совершенно независимым от всех предшественников. Для хранения аудиоданных в формате Vorbis чаще всего применяется медиаконтейнер Ogg, такой файл обычно имеет расширение.ogg и называется двойным именем Ogg Vorbis.

На 2006 год распространён существенно меньше, чем MP3. По всевозможным оценкам является вторым по популярности форматом компрессии звука с потерями. Широко используется в компьютерных играх и в файлообменных сетях для передачи музыкальных произведений.

Vorbis применяет более качественную психоакустическую модель, чем его конкуренты, дающую лучшую чёткость воспроизведения при равной плотности потока.

Формат не ограничивает пользователя только двумя аудиоканалами (стерео - левый и правый). Он поддерживает до 255 отдельных каналов с частотой дискретизации до 192 кГц и разрядностью до 32 бит (чего не позволяет ни один другой формат сжатия с потерями), поэтому Vorbis великолепно подходит для кодирования 6-канального звука DVD-Audio.

К тому же, формат Vorbis - «sample accurate». Это гарантирует, что звуковые данные перед кодированием и после декодирования не будут иметь смещений, дополнительных или потерянных сэмплов. Это легко оценить, когда вы кодируете non-stop музыку (когда один трек постепенно переходит в другой) - в итоге сохранится целостность звука.

Формат изначально разрабатывался с возможностью потокового вещания. Это даёт формату достаточно полезный побочный эффект - в одном файле можно хранить несколько композиций с собственными тегами. При загрузке такого файла в плеер должны отобразиться все композиции, будто их загрузили из нескольких различных файлов.

Формат имеет гибкую систему тегов. Заголовок тегов легко расширяется и позволяет включать тексты любой длины и сложности (например, текст песни), перемежающиеся изображениями (например, фотография обложки альбома). Текстовые теги хранятся в UTF-8, что позволяет писать на нескольких языках одновременно и исключает возможные проблемы с кодировками.

Ogg Vorbis по умолчанию использует переменный битрейт, при этом значения последнего не ограничены какими-то жёсткими значениями, и он может варьироваться даже на 1 kbps. При этом стоит заметить, что форматом жёстко не ограничен максимальный битрейт, и при максимальных настройках кодирования он может варьировать от 400 kbps до 700 kbps. Такой же гибкостью обладает частота дискретизации - пользователям предоставляется любой выбор в пределах от 2 кГц до 192 кГц.

Vorbis был разработан сообществом «Xiphophorus» для того, чтобы заменить все платные запатентованные аудио форматы. Несмотря на то что это самый молодой формат из всех конкурентов МР3, Ogg Vorbis имеет полную поддержку на всех известных платформах (Microsoft Windows, GNU/Linux, MacOS, PocketPC, Palm, Symbian, DOS, FreeBSD, BeOS и др.), а также большое количество аппаратных реализаций. Популярность на сегодняшний день значительно превосходит все альтернативные решения.

FLAC (англ. Free Lossless Audio Codec - свободный аудиокодек без потерь) - популярный свободный кодек для сжатия аудио. В отличие от кодеков с потерями Ogg Vorbis, MP3 и AAC, не удаляет никакой информации из аудиопотока и подходит как для ежедневного прослушивания, так и для архивирования аудиоколлекции. На сегодня формат FLAC поддерживается многими аудиоприложениями.

FLAC является членом семейства кодеков, разрабатываемых Xiph.Org. К слову, в него же входит известный ogg vorbis – один из лучших lossy-алгоритмов сжатия музыки. В качестве контейнера для аудиоданных используется, разумеется, OGG (файлы с расширением.ogg) и ещё один open-source контейнер – Matroska (файлы с расширением.mka).

Сразу стоит отметить полную открытость как формата, так и алгоритма FLAC. Они не патентованы, поэтому могут совершенно безвозмездно использоваться в любых программах. Именно этим обусловлена широкая поддержка FLAC в проигрывателях – любой серьёзный плеер имеет плагин для FLAC. Кроме этого существуют аппаратные mp3-плееры с поддержкой кодека FLAC.

FLAC поддерживает теги собственного формата “FlacTags”. Есть возможность кодирования многоканального звука – серьёзное преимущество по сравнению с Monkey’s Audio. Формат поддерживает любые частоты семплирования в диапазоне от 1 Гц (!) до 65,535 Гц. Разрядность аудио от 4-х (!) до 32-х бит.

Считается, что в сравнении с остальными lossless-кодеками FLAC наиболее эффективно расходует ресурсы системы при раскодировании (воспроизведении) аудио. К сожалению, это достигается за счёт значительного повышения времени кодирования (сжатия).

Сайт FLAC регулярно обновляется, выходят новые версии кодека. Вообще, по активности развития FLAC безусловно лидирует. Вполне возможно, что в будущем это сделает его основным форматом.

AAC (англ. Advanced Audio Coding) - формат аудио-файла с меньшей потерей качества при кодировании, чем MP3 при одинаковых размерах. Формат также позволяет сжимать без потери качества исходника (профиль ALAC AAC).

AAC изначально создавался как преемник MP3 с улучшенным качеством кодирования. Формат AAC, официально известный как ISO/IEC 13818-7, вышел в свет в 1997 как новая, седьмая, часть семьи MPEG-2. Существует также формат AAC, известный как MPEG-4 Часть 3.

Этот тип файлов является стандартным для систем Apple Macintosh и систем обработки звука, построенных на его основе. Apple AIFF расшифровывается как Audio Interchange File Format - формат файла обмена звуком, он в чем-то схож с WAV. Его особенностью является то, что он позволяет размещать вместе со звуковой волной дополнительную информацию, в частности, самплы WaveTable (примеры звучания инструментов вместе с параметрами синтезатора), что улучшает качество итогового результата. Хотя в настоящее время компьютеры Apple способны воспроизводить файлы практически любых форматов, в том числе и МР3.

Иногда компании создают свои проприетарные форматы, которые поддерживают только их собственные плееры. Apple Lossless был создан одноименной компанией для плеера iPod в качестве альтернативы FLAC, используемом на других плеерах. Если вы не используете iPod, то можете никогда не столкнуться с этим форматом.

Monkey"s Audio (APE)

Monkey"s Audio или APE (от английского ape - обезьяна) – популярный формат кодирования цифрового звука без потерь. Распространяется бесплатно вместе с открытым исходным кодом и набором программного обеспечения для кодирования и воспроизведения, а также плагинами к популярным плеерам. Файлы Monkey’s Audio используют следующие расширения: .ape для хранения аудио и.apl для хранения метаданных. Несмотря на открытый исходный код, Monkey"s Audio не является свободным, так как его лицензия накладывает значительные ограничения на использование.

Средний битрейт в аудиофайле составляет 600-700 кбит/с; сравните с 128 кбит/с в Mp3. Среднее сжатие составляет 40-50 % в зависимости от жанра музыки: если классические или джазовые произведения сжимаются самым лучшим образом, то композиции в стиле trash-metal или что-то подобное «электронно шумовое» покажет наихудший результат. Для кодеков с потерями при приемлемом качестве сжатие составляет около 80 %.

Существуют четыре степени сжатия. Максимальная компрессия может показаться единственно верным решением, даже несмотря на довольно большое время сжатия. Однако нужно учитывать ещё и расход ресурсов системы, воспроизводящей файл, – для максимально сжатого файла он относительно высок.

Формат.APE обеспечивает поддержку тегов для поиска композиций в музыкальной коллекции. Ещё одним плюсом является проверка целостности файла при раскодировании. Поддерживается восстановление оригинального wav-файла из сжатого.APE.

Monkey’s Audio имеет графический фронтэнд под Windows, иначе говоря удобную оконную программу для управления процессом кодирования. Остальные кодеки требуют использования командной строки или фронтэндов сторонних разработчиков. Самое приятное, что фронтэнд Monkey’s Audio можно использовать и с другими кодеками – Rkau, Wavpack, Shorten и даже lossy-кодеками mp3 и ogg vorbis.

Немного о недостатках. Кодек Monkey’s Audio существует только под Windows. Однако на сайте написано, что «версии под Mac и Linux уже разрабатываются». К слову сказать, сам сайт не обновлялся достаточно давно, что не является хорошим признаком. Также отсутствует какая-либо поддержка среди производителей аппаратных плееров.

MIDI (англ. Musical Instrument Digital Interface - цифровой интерфейс музыкальных инструментов) - стандарт на аппаратуру и программное обеспечение, позволяющее воспроизводить (и записывать) музыку путем выполнения/записи специальных команд, а также формат файлов, содержащих такие команды. Воспроизводящее устройство или программа называется синтезатором (секвенсором) MIDI и фактически является автоматическим музыкальным инструментом.

В отличие от других форматов, хранит не оцифрованный звук, а наборы команд (проигрываемые ноты, ссылки на проигрываемые инструменты, значения изменяемых параметров звука), которые могут воспроизводиться по-разному в зависимости от устройства воспроизведения. Удобство формата MIDI как формата представления данных позволяет реализовывать устройства, производящие автоматическую аранжировку по заданным аккордам, а также приложения 3D-визуализации звука. Кроме того, такие файлы, как правило, имеют на несколько порядков меньший размер, чем оцифрованный звук сравнимого качества.

Статья взята с сайта cjcity.fdstar.ru

Термином «аудио» сегодня обозначают все, что так или иначе связано со звуком. Это и обработка, и воспроизведение, и сведение и просто прослушивание аудиозаписей. Мало кому известно, что за время своего существования все популярные аудио-форматы претерпевали существенные изменения, порой в лучшую сторону, а порой даже в худшую.


Проблема заключается в том, что, когда создатели пытались повысить качество записи при использовании нового формата, это значительно увеличивало размер полученного результата. А уменьшение размера конечного файла приводило в результате к существенной потере качества. Но так дела обстояли не всегда.

Первый аудио-формат, который использовался в компьютерных играх

Первое упоминание о компьютерном звуке связано с созданием различных примитивных видео-игр. Тогда звук воспроизводился при помощи системного динамика. Как не пытались разработчики программного обеспечения тех времен, добиться того уровня качества, которое было бы совместимо с кассетными и бобинными магнитофонами не получилось. Именно это заставило многих разработчиков задуматься над вопросом, как изменить формат аудио, чтобы звук был более естественным и натуральным. Именно эта проблема и привела к сегодняшней конкуренции на рынке аудио-устройств. В результате используемые форматы сильно сказываются на качестве воспроизводимого материала и настройках основных параметров воспроизведения.

Формат WAV

Первое полноценное качество аудио-форматов связано именно с этим форматом. Обозначение расширения WAV было образовано от английского слова «wave», что в переводе на русский значит волна. Именно этот формат и стал первым аудио-форматом, обрабатываемым при помощи компьютерных программ на высокопрофессиональном уровне. У файлов с расширением WAV имелись следующие характеристики:

— глубина звука;
— частота дискретизации;
— битрейт и т.д.

Данный формат был совместим даже с тем звуком, который можно было получить после обработки аудио-CD с помощью эквалайзера и других инструментов. Однако, размер файла в этом случае был совершенно не оправдан. Например, самый обычный трек продолжительностью в 3 минуты мог занимать до 50 Мегабайт.

CD-диски

Аудио-CD или, если говорить точнее, расширение.cda, появились примерно в то же время, что и формат wav. Но в отличие от файлов с расширением wav, .cda не поддается редактированию. Но его можно открыть в любой программе по обработке аудио, перекодировать и изменить формат и сохранить на жестком диске. Сохранить изменения на CD, само собой, не получится.

MP3 кодек

После появления в музыкальной индустрии кодека LAME MP3 Encoder случилась настоящая революция в мире аудио. Теперь аудио-файлы стали «весить» в десятки раз меньше. При максимальном сжатии размер пятиминутной композиции редко превышает 7 Мб. Это было существенным прорывом. Кроме того, в данном расширении наконец-то была реализована возможность откорректировать некоторые характеристики и настроить дополнительные параметры, такие, как ID3-теги. В них может содержаться информация о названии трека, исполнителе, альбома и дате его выпуска.

Разумеется, данный формат сразу же получил большое распространение. Практически все интернет-сообщество использует данный универсальный формат. Так что можно сказать, что формат MP3 совершил настоящий переворот в сфере компьютерного звука. На сегодняшний день это один и наиболее востребованных и популярных аудио-форматов. Хотя сегодня ему на смену уже приходят другие аудио-форматы. Но это мы обсудим немного позже.

AIFF-файлы

Существует еще одна разновидность аудио-файлов. Это так называемый формат aiff. Изначально данный формат создавался для использования на компьютерах Macintosh. Немного позже случилась трансформация, в результате которой удалось добиться совместимости различных форматов аудио и возможности их использования на различных платформах и операционных системах.

OGG-формат

Данный аудио-формат также встречается довольно часто. Он был разработан специалистами компании Vorbis. Отметим, что данный формат имеет ряд недостатков. Прежде всего, несмотря на небольшой размер файлов использование данного формата приводит к высокой нагрузке на системные ресурсы компьютера.

Также для работы с данным аудио-форматом необходимо использовать собственные декодеры и кодеки, которые могут не устанавливаться в автоматическом режиме. Так, например, тем, кто работал с программой FL Studio Producer Edition для работы с данным форматом нужно было вручную активировать установочный файл в формате.inf. Иначе файлы формата OGG данным приложением просто не воспроизводились. Несмотря на все эти недостатки, аудио-файлы формата OGG сегодня встречаются довольно часто, да и звучание у них неплохое.

Обсудим еще один формат аудио-файлов – AMR. Его смело можно отнести к низкопробным аудио-форматам. Данный формат возник в эпоху примитивных мобильных телефонов, которые не могли устанавливать в качестве мелодии звонка файлы в формате.mp3. AMR был разработан с целью замены натурального звучания, однако при этом использование данного формата приводило к существенной потере качества. Качество аудио-файлов, сохраненных в данном формате, нельзя даже сравнить с современными «продвинутыми» аудио-форматами.

Формат MIDI

Возможно кому-то это покажется странным, но формат MIDI также относится к аудио-форматам. Сегодня принято считать, что MIDI-система представляет собой простой набор команд. Однако это довольно спорное утверждение. Аббревиатура MIDI расшифровывается как Musical Instrument Digital Interface.

Эта система предназначена для редактирования и записи аудио-файлов путем нажатия клавиш, изменения темпа, тональности, высоты и добавлением различных эффектов. Файлы с расширениями.midi или.mid легко воспроизводятся на современных программах аудио-записи и секвенсорах. При этом используется стандартный набор звуков в формате GS, GM или XG. Первые два формата разработаны компанией Roland, последний – корпорацией Yamaha. В формате GS и GM присутствует набор 128 стандартных звуков, в формате XG их почти в три раза больше.

Вот мы и подошли к одному из самых уникальных аудио-форматов на сегодняшний день. Музыкальные композиции в формате FLAC сегодня получили широкое распространение. В первую очередь, это связано с качеством звучания, а ведь именно на это обращают внимание настоящие меломаны. Если разобраться в истории создании данного формата, то можно обнаружить, что создан он был на основе MP3. Ранее было использовано разделение аудиокомпозиций на отдельные треки. В формате FLAC такого нет.

В структуре аудио-файла в формате FLAC имеется один или два файлов. Один из них информационный. Для воспроизведения данного формата нужно использовать специальные аудиоплееры. Одним из таких плееров является программа AIMP. При запуске основного файла, в окошке плеера появляется целый список музыкальных дорожек, которые содержатся в контейнере. Переключение между композициями в данном плеере осуществляется по тому же принципу, что и в любом другом проигрывателе. Преимуществом данного формата является исключение возможности случайного удаления треков (как уже было сказано ранее, все дорожки содержатся в одном файле).

Совместимость различных аудио-форматов

Сегодня многие аудио-форматы совместимы друг с другом. Современные DVD-плееры и программные проигрыватели без труда справится с воспроизведением любого из них. Это же относится и профессиональным редакторам звука. Программы для обработки сегодня распознают практически все известные на настоящий момент аудио-форматы, даже несмотря на некоторые специфические характеристики операционных систем. Секвенсоры, аудио-редакторы и дополнительные модули способны работать с различными форматами аудио в кроссплатформенном режиме.

Преобразование аудио-форматов

Существует несколько способов изменения аудио-файлов. Например, можно открыть файл в его «родном» формате, а сохранить в другом. Можно сделать еще проще. Для преобразования аудио-форматов используются специальные программы – конверторы. Чтобы преобразовать аудио-файл, его достаточно загрузить в данную программу в начальном формате, потом выбрать конечный и конвертировать. Вот так, легко и просто!

Обработка звука

Иначе дело обстоит со специальными программами для обработки. При необходимости изменить частотные характеристики исходных файлов без профессиональных программных пакетов не обойтись. С помощью таких приложений можно изменять качество аудио-файлов. Причем менять можно не только стандартную частоту дискретизации. Такие программные приложения позволяют изменять настройку глубины с 16 до 24 или даже 32 бит.

Также можно настроить пропускную воспроизводимую способность, или проще говоря битрейт. Стандартно используется значение битрейта в 128 кбит/c, однако лучшего качества звука удается достичь на отметке в 320 Кбит/сек. Не все способны уловить разницу между звуков со стандартными параметрами и звуком, характеристики в котором выставлены по максимуму.

Но лучше все-таки одни раз попробовать воспроизвести один и тот же трек с разными характеристиками на хорошей аудио-аппаратуре. Вы сразу же заметите разницу. Программы для обработки аудио позволяют не только редактировать вышеперечисленные параметры. В мощных программных пакетах для обработки звука, как правило, присутствует множество модулей. Это могут быть и лимитеры, и программные эквалайзеры, и кроссоверы, и компрессоры, и нормалайзеры и много всего другого. Использование каждого модуля позволяет настроить звучание композиции на свой вкус. При помощи таких программ можно обрабатывать аудиофайлы любого формата.

Сравнение

В заключение попробуем провести краткий анализ всех рассмотренных в данной статье аудио-форматов. Формат WAV несмотря на свою «тяжеловесность» может использоваться в качестве промежуточного формата для последующего конвертирования. Чаще всего файлы этого типа встречаются при записи живого звука или сохранении открытых проектов. Формат.cda на сегодняшний день утратил свою актуальность. Форматы OGG и AIFF лучше всего использовать в виртуальной студии. Формат AMR на сегодняшний день можно считать устаревшим.

Аудиофайлы в формате MIDI используются в основном музыкантами. Лучшим на сегодняшний день аудио-форматом является FLAC. По мнению многих специалистов именно он является самым продвинутым. Однако и уже привычный всем MP3 рано списывать со счетов. Индустрия видео и звука не стоит на месте, наверняка в скором времени нас ждет еще огромное число новых аудио-форматов.