Я пытаюсь использовать Speex Accoustic Echo Cancellation с Qt 5.2.0, но удаляется только часть эха, он все еще остается.
Вот мой тест (не оптимизированный для управления памятью). Он записывает голос, удаляет эхо и воспроизводит его через 400 мс с очень маленькой эхоподавлением.
Есть идеи, где мой код неверен?
//************
// declared in MainWindows.h
QAudioInput* m_audioInput;
QAudioOutput* m_audioOutput;
QIODevice* m_ioIn;
QIODevice* m_ioOut;
QList<QByteArray> m_listBA;
//************
void MainWindow::InitSpeex()
{
int loc_samplingRate=16000;
int loc_frameSize=320;
m_echo_state = speex_echo_state_init(loc_frameSize, 10*loc_frameSize);
speex_echo_ctl(m_echo_state, SPEEX_ECHO_SET_SAMPLING_RATE, &loc_samplingRate);
m_preprocess = speex_preprocess_state_init(loc_frameSize, loc_samplingRate);
}
void MainWindow::DestroySpeex()
{
speex_echo_state_destroy(m_echo_state);
speex_preprocess_state_destroy(m_preprocess);
m_echo_state = NULL;
m_preprocess = NULL;
}
void MainWindow::Start()
{
QAudioFormat format;
// Set up the desired format, for example:
format.setSampleRate(SAMPLING_RATE);
format.setChannelCount(1);
format.setSampleSize(16);
format.setCodec("audio/pcm");
format.setByteOrder(QAudioFormat::LittleEndian);
format.setSampleType(QAudioFormat::UnSignedInt);
QAudioDeviceInfo loc_infoInput = QAudioDeviceInfo::defaultInputDevice();
if (!loc_infoInput.isFormatSupported(format)) {
qWarning() << "Default format not supported, trying to use the nearest.";
format = loc_infoInput.nearestFormat(format);
}
m_audioInput = new QAudioInput(format, this);QAudioDeviceInfo loc_infoOutput(QAudioDeviceInfo::defaultOutputDevice());
if (!loc_infoOutput.isFormatSupported(format)) {
qWarning() << "Raw audio format not supported by backend, cannot play audio.";
return;
}
m_audioOutput = new QAudioOutput(format, this);
m_ioIn = m_audioInput->start();
m_ioOut = m_audioOutput->start();
connect(m_ioIn, SIGNAL(readyRead()), this, SLOT(on_data_input()));
}
void MainWindow::on_data_input()
{
// push data on the list
m_listBA.push_back( m_ioIn->readAll() );// il list is about 400ms of sample
if( m_listBA.size() > 20)
{
// send oldest sample to speex and play it
speex_echo_playback(m_echo_state, (spx_int16_t*)m_listBA[1].constData());
m_ioOut->write( m_listBA.takeFirst() );
// get most recent sample, remove echo and repush it on the list to be played later
speex_echo_capture(m_echo_state, (spx_int16_t*)m_listBA[m_listBA.size()-1].data(), m_AECBufferOut);
loc_vad = speex_preprocess_run(m_preprocess, m_AECBufferOut);
m_listBA.takeLast();
m_listBA.push_back( QByteArray((const char*)m_AECBufferOut, sizeof( m_AECBufferOut)) );
}
}
Мне интересно, что вы пытаетесь сделать с m_listBA
, Очевидно, это FIFO, но вы не используете [0].
Кроме того, почему вы добавляете необработанный ввод в список, чтобы удалить его несколькими строками позже?
Наконец, m_AECBufferOut может быть указателем. В таком случае, sizeof(m_AECBufferOut)
вероятно, это 4 или 8. Это НЕ сколько байтов вывода у вас есть.
В основном, ваши настройки работают без отмените эхо и убедитесь, что оно добавляет задержку. Только тогда вы должны попытаться заставить эхоподавление работать. Если первая часть работает, вам не нужно размещать ее здесь.
Других решений пока нет …