100% MPEG?
(без претензий на полноту)
«OldFedor, не надо доверять
слепо чеккерам и тестерам.
Не всё, что они пишут
MPEG - им является» (ALLexxess)
"Все, что изложено ниже
многие знают, я - нет" (OldFedor)
__Время от времени я сталкиваюсь с неприятным фактом - тест показывает, что некоторый файл ххх.flac вдруг оказывается на yy% MPEG без явных, казалось бы, на то оснований. Как «доктор прописал» - пользуюсь auCDtect. Процент для MPEG может колебаться (в моей, не шибко большой, практике) от 50 до 100%, а вот CDDA от 100 до 49%.
__Кстати, тоже не понятно - 49% CDDA это сиречь 51% MPEG? Или как? Точного ответа я до сих пор не нашел.
__Я задавал вопросы, меня направляли, тыкали носом, консультировался с гуру и … я выложил-таки первый пост, с приложением результатов теста. А на душе кошки…Ей-ей, ни сколько не лукавлю.
__Но причины такого поведения auCDtect мне были не понятны.
__А раз так. То это повод разобраться тщательнее.
__И вот, что мне удалось выяснить.
__Речь, в первую очередь, идет об «ужасном» МР3 (сокращение от MPEG Layer3, не путать с MPEG – 3). Если коротко, то моделируется психоакустическое восприятие, удаляется информация не различимая человеческим ухом* (вопрос - кто решил и чьи уши?, видимо риторический), а оставшаяся информация дополнительно сжимается. Что-то вроде JPEG для звука.
__МР3 действительно часть информации удаляет безвозвратно и восстановлению она не подлежит. Именно за счет удаления имеется возможность сильного (по объему) сжатия.
__Но никогда, даже на самых высоких битрейтах, МР3 файл не будет звучать как исходный (про разные «уши» - не надо, знаю). Весьма близкое соответствие – да, но не lossless (то биш, «бит в бит» при декодировании).
__Так…Я чистый практик.
__Из (*) четко следует – раз что-то удалили, значит это можно обнаружить.
__Что удалили? Копаюсь дальше…
__Не вдаваясь в подробности (для самообразования залез в психоакустическую модель, в алгоритм Хаффмана и много в чего еще) установил, что главное:
__- во первых - ограничен частотный диапазон (весьма сильно, начиная с частоты среза) – это я знал, но на анализаторах спектра (аппаратных и программных) наблюдать не доводилось;
__- во вторых – ограничен динамический диапазон. Это для меня была новость!
___А все просто. Те самые «уши» не в состоянии уловить шепот после громкого (мощного) звука, временное понижение чувствительности уха к текущему сигналу. Именно этот факт (купирование, скрадывание слабого сильным) и позволяет удалить дополнительно еще «лишнюю» инфу из исходного файла.
__Также учитывается неспособность большинства людей (?) различать сигналы, по мощности лежащие ниже определенного уровня, разного для разных частотных диапазонов.
__Степень сжатия (читай удаления) регулирует при кодировании bitrate.
__Термин битрейт в общем случае обозначает общую величину потока, количество передаваемой за единицу времени информации, и поэтому не связан с внутренними тонкостями строения потока, его смысл не зависит от того, содержит ли поток моно или стерео, или пятиканальное аудио с текстом на разных языках, или что-либо еще.
__Говорят (инет), что на проведенных тестах специально приглашенные опытные эксперты, специализирующиеся на субъективной оценке качественности звучания, не смогли различить звучание оригинального трека на CD и закодированного в формат MP3 с с битрейтом в 256 kbs. Оставим это на их совести.
__Весьма распространено и утверждение, что на самом деле, хотя и 256 kbs, и даже 320 kbs тоже не дают возможности осуществить полностью прозрачное кодирование, но отличия от CD Audio, по которому кодируется тестовый MP3, сравнимы с отличиями самого CD Audio от исходного аналогового сигнала, из которого он был получен путем оцифровки. То есть потери, конечно, есть, но несущественны с точки зрения того, кому качество CD Audio представляется достаточным. Фактически, их обнаружение является нетривиальной задачей на аппаратуре высокого класса.
__Теперь стало понятно. Надо найти, как это удаление обнаружить. Конечно, все это уже давно сделали – бери да пользуйся. Но я прохожу этот путь впервые.
__И вот что я выудил.
__1. Для МРЗ в зависимости от bitrate частоты среза разные. И это я проверил. На одном и том же треке и получил (kbps/ кГц ) 256-320/18-20 , 192/ 17-18 , 128/ 14-16.
__Внимание! Исключительно важен характер музыки.
Интернет дает следующее
96 kbps - срез на 15000 Hz
128 kbps - срез на 16000 Hz
160 kbps - срез на 16500 - 17000 Hz
192 kbps - срез на 18000 - 18500 Hz
224 kbps - срез на 19000 Hz
256 kbps - срез на 19500 Hz
320 kbps - срез на 20000 - 20500 Hz
http://www.metal-tracker.com/forum/showthread.php?tid=1228
__2. А вот отсутствие тихих участков (психоакустическая модель в МР3) – вы не увидите. Только прослушав.
__3. Первоисточник:
__- либо это оригинал (аналоговый сигнал после оцифровки в студии);
__- либо, как говорят, «подняли» из МР3, т.е. апконверт (upconvert).
__Апконверт - это программное увеличение битрейта аудио файлов. Например, из битрейта 128 kbps, сделали 320 kbps. При апконверте происходит сильное ухудшение качества за счёт среза частот спектра (как правило от 16 до 20 kHz в зависимости от битрейта). Срезанные частоты никаким апконвертом уже не вернуть. Это легко заметить на графике частотного спектра.
__Или прошлись по цепочке MP3 - WAV - CDA - Flac (Ape)
__Выявить апконверт можно только спектральным анализом аудио файла, и то не всегда.
__Это и есть – из чего «поднимали».
__4. auCDtect (преобразование Фурье) выдает спектрограмму, по которой достоверно установить первоисточник не всегда удается.
__Это информация к размышлению, но не доказательство.
__Лично проанализировав auCDtect-ом до сотни треков сделал для себя выводы:
__4.1. в крайних случаях (точно CDDA и точно МР3 при 128 kbps и ниже) определение достоверное;
__4.2. при 160 kbps и выше неуверенное определение. Именно здесь и появляются проценты у CDDA и MPEG.
__Почему? auCDtect по статистическому распределению граничных частот определяет две характерные - среднюю и максимально вероятную граничную частоты. Вот вторая часть этого алгоритма и есть причина % в заключении. На основе значений этих частот делается вывод об источнике звукового файла – оригинальная запись или обратное восстановление из MPEG-подобного источника.
__ % в приговоре – характеристика вероятностная, не детерминированная.
__4.3. Мне не удалось определить, начиная с какого порога, принимается решение об MPEG. Ориентировочно – если энергия спектра выше 18 кГц менее 10% - MPEG.
__4.4. Для принятия решения требуется еще другая спектрограмма, а точнее АЧХ.
__Различают в основном, два вида
спектрограмм:
__1. Спектрограмма (сонограмма) – псевдо-трехмерная диаграмма: по оси абсцисс - время, по оси ординат – частота, третье измерение с указанием амплитуды на определенной частоте в конкретный момент времени представлено интенсивностью или цветом каждой точки изображения. Это и выдает auCDtect.
__Пример как ее читать см.
galaxy-file__2. Спектральная плотность или АЧХ - двумерная диаграмма: по оси абсцисс - частота, по оси ординат – спектральная плотность (энергия) или амплитуда.
__В качестве примера ниже выложены спектрограммы для вызвавшего споры поста Ozzy Osbourne – Scream, приговор которому auCDtect дал 95% MPEG (две разные проги).
__Посмотрели? Занятно, не правда ли?
__Итог.
__1. Банально, но…Аналогом CD может быть только lossless!, т.е. образ этого CD.
__Кстати, как я понял, у винила вообще аналогов нет, его битрейт должен быть равен бесконечности.
__Утверждение, что аналог CD это MP3 с битрейтом 320 kbps - МИФ.
__2. После того, как Вы получили в итоге 95% MPEG необходимо получить и проанализировать сонограмму и спектральную плотность. Дальше – от вашего решения.
__MPEG 95% - не приговор!
__3. auCDtect - более-менее точно говорит о том, был ли трек, снятый с Вашего CD декодирован с MP3 файла или нет.
__4. С другой стороны, даже если тестер выдает, скажем CDDA 80%, не факт, что это не MP3.
__5. Чем пользовался: Adobe Audition, Tau Analyzer, Wavosaur, Sonic Visualiser.
__ Обращаю Ваше внимание – это мои данные. Возможно, в чем-то спорные и, если, кто-то имеет другие - поделитесь.
__Мое мнение - весьма полезно дополнять материал еще и спектральной плотностью
__Я так думаю.
__А Вы?
__С уважением, OldFedor.
__P.S. Уважаемый crocus, Вы были абсолютно правы, когда предложили задуматься над 95% MPEG «Touch And Go» (lossless-galaxy)
__Если бы был добавлен один из этих рисунков все вопросы бы исчезли. Не так ли?