У меня есть проект по распознаванию речи. Хотя я использовал библиотеку «sndfile.h», я застрял в чтении входного звука. У меня вопрос: данные, прочитанные функцией sf_readf_float()
это сигнал во временной области, не так ли? Если нет, то что это? Есть ли формула для преобразования его в сигнал во временной области?
Да, данные, которые возвращает libsndfile, являются данными во временной области: сэмплы аудио из входного файла. Функция sf_readf_float
возвращает выборки в «кадрах», причем один кадр представляет собой набор выборок из каждого канала в данный момент времени. Также, sf_readf_float
масштабирует выборки в диапазоне [-1.0, 1.0] — см. this note
для деталей.
Посмотри на sndfile-инструменты например код, который читает звуковые файлы, используя libsndfile. sndfile-микс к моно Пример должен быть хорошей отправной точкой.
Других решений пока нет …