Я реализую метод сдвига высоты тона, описанный в Николя Жюльерат & Удар Хирсбруннера в статье 2010 года «Низкочастотный сдвиг высоты звука в частотной области». У меня большая часть алгоритма реализована до сих пор (вот код если вам интересно, но это не должно иметь значения для этого вопроса).
Я застрял на последнем шаге Раздела 3.5: Обработка эффекта модуляции. Применение окна фон Ханна к этапам анализа и синтеза было достаточно простым, но кажется, что в статье отсутствуют некоторые детали того, как рассчитать эту кривую, на которую я должен делиться:
Во-вторых, цикл измененных окон анализа рассчитывается для
коэффициент масштабирования тока, коэффициент перекрытия, окно анализа и синтеза
окно; и полученная кривая амплитудной модуляции вычисляется.
После процесса обратного DFT и наложения-сложения результирующий
отсчеты временной области делятся на вычисленную амплитудную модуляцию
кривая, чтобы «демодулировать» результат.
В документе приведены некоторые примеры изображений, но я не могу понять, как эти кривые должны быть рассчитаны. (Эта операция должна вписываться в строку 119 суть, которую я связал выше.) Алгоритм в настоящее время звучит хуже, чем стандартный подход фазового вокодера при низких задержках, поэтому похоже, что этот шаг демодуляции имеет решающее значение для качества алгоритма.
Я не знаю, откуда взялась эта амплитудная модуляция, поэтому я не совсем уверен, с чего бы я даже начал выяснять, как рассчитать кривую. Я мог бы провести через алгоритм несколько синусоидальных волн и посмотреть, что получится, но эта информация в основном уже представлена изображениями и не помогает мне понять фактическую формулу.
Итак, кто-нибудь знает, как я могу рассчитать кривую амплитудной модуляции для этого алгоритма?
Задача ещё не решена.
Других решений пока нет …