|
Страница 1 из 3 Одним из факторов, снижающих эффективность методов дифференциального кодирования, является частота. Как вы могли предположить, при кодировании низкочастотных звуков обычно получается достаточно много небольших приращений, в то время как при кодировании высокочастотных звуков, наблюдается тенденция получения множества приращений большей величины. Один из способов повышения эффективности методов дифференциальной модуляции заключается в делении диапазона частот звука на две или более частей или выделении частотных поддиапазонов и последующей компрессии каждого из них по отдельности. Применение нескольких поддиапазонов дает возможность воспользоваться знаниями о том, как устроен слух человека для получения еще более качественной компрессии. Поскольку человек в одних диапазонах частот слышит лучше, чем в других, вы можете использовать различные параметры компрессии для разных поддиапазонов. Поддиапазоны, расположенные вблизи центра слышимой человеком области, удастся оставить без изменений, в то время как менее различимые диапазоны могут подвергаться менее точной обработке, либо вообще не учитываться. Методы поддиапазонного кодирования не просты - они основаны как на сложном математическом аппарате, используемом для выделения и анализа поддиапазонов, так и на тщательном изучении слуха человека, необходимом для разработки рекомендаций по обработке каждого из поддиапазонов. Обычно поддиапазонное кодирование позволяет сжать ИКМ аудиоданные в 10-20 раз. Все наиболее совершенные из действующих сегодня день методов компрессии, включая MPEG-аудио, Dolby AC-2 и AC-3, систему Sony MiniDisk (ATRAC), а также RealAudio, основаны на поддиапазонном кодировании.
Компрессия речи человека
До сих пор мы говорили о подходах, разработанных для обработки звуков всех типов, как музыки, так и речи. Если вам необходимо обработать только речь, то вы можете воспользоваться методами, разработанными специально для этого. Самый простой метод кодирования речи называется кодированием пауз. Дело в том, что в разговоре человека присутствует много пауз. Часть их - короткие паузы между словами и фразами, остальное - более длинные паузы между предложениями или репликами разных людей. Часто, выделяя эти паузы и заменяя их компактными кодами, в которых указывается длительность паузы, за счет сжатия удается сэкономить до 50% первоначального объема речевой информации.
|