Ищите код, который будет обрабатывать медиафайл для «Кто сказал, что и когда», другими словами, «Сегментация докладчика по динамику» и какое время для каждого. Неверные ответы: выполнение каких-либо ручных работ по обработке медиа-файла .. спасибо!
Вы можете использовать диаризацию колонок от Kaldi, это не легко настроить, но результаты отличные.
Также есть много других библиотек — LIUM, Bob и т. Д.