Как аудиоданные понижаются до 5512 Гц PCM? Я прочитал несколько статей, и выполняются следующие шаги: декодирование аудио в PCM, преобразование его в Mono и затем его уменьшение.
Для преобразования в моно каналы каждого кадра усредняются для получения моносигнала?
Как только моносигнал получен, как он понижается?
если частота дискретизации с пониженной частотой дискретизации = частота дискретизации, деленная на целочисленный коэффициент, как это применяется к аудиоданным в моносигнале?
Понижение частоты дискретизации может быть выполнено в два этапа: фильтрация нижних частот и интерполяция. Если вы не хотите слышать артефакты, фильтр нижних частот должен быть очень высокого качества, чтобы убрать потенциальное алиасинг выше новых Fs / 2, не искажая остаток полосы пропускания ниже. И фильтр нижних частот, и интерполятор могут быть объединены в один этап с помощью КИХ-фильтра с многофазным или непрерывным ядром, аналогичным или аналогичным оконной функции Синка.
При понижающей дискретизации 44100 ровно в 8 раз, шаг интерполяции становится тривиальным, просто используйте очень высококачественный фильтр нижних частот, прежде чем отбрасывать выборки для удаления.
Других решений пока нет …