У меня есть несколько ip камер в локальной сети. Я получаю видеопоток с библиотекой live555 (я взял за основу testRtspClient) и декодирую кадры с помощью ffmpeg (avcodec_decode_video2). Все отлично работает.
Проблемы начинаются, когда я пытаюсь декодировать поток из интернета.
Первая проблема — некоторые пакеты теряются, поэтому появляются дефекты. Но это не проблема. Проблема — после остановки и запуска видеопотока необходимо подождать около 5 минут потоковой передачи, прежде чем ffmpeg сможет что-то декодировать с той же ip-камеры. Если пакеты не потеряны, то все в порядке.
Вторая проблема — есть камера, которая отправляет видео с разрешением 2048х1538. Кадр такого разрешения отправляется несколькими пакетами. live555 обычно объединяет их, но когда кадр передается в декодер, декодер возвращает длину пакета, но полученный кадр всегда равен 0.
Вот мой код:
#define RECEIVE_BUFFER_SIZE 1000000
AVCodecContext* avCodecContext; //definition
AVFrame *frame; //definition
...
//init code
_fReceiveBuffer = new uint8_t[RECEIVE_BUFFER_SIZE+512]; //buffer to receive frame
ZeroMemory(_fReceiveBuffer, RECEIVE_BUFFER_SIZE + 512); //zeros
_bufferSize = RECEIVE_BUFFER_SIZE * sizeof(uint8_t); //buffer size
static const uint8_t startCode[4] = { 0x00, 0x00, 0x00, 0x01 }; //this is for 0 0 0 1
//before frame will transfer to decoder
memcpy(_fReceiveBuffer, (void*)startCode, sizeof(uint8_t)* 4);
_fReceiveBuffer += sizeof(sizeof(uint8_t)* 4);
_bufferSize -= sizeof(sizeof(uint8_t)* 4);
AVCodec *codec = avcodec_find_decoder(AV_CODEC_ID_H264); //find codec
avCodecContext = avcodec_alloc_context3(codec);
avCodecContext->flags |= AV_PKT_FLAG_KEY;
avcodec_open2(avCodecContext, codec, NULL);
frame = av_frame_alloc();
//frame
void DummySink::afterGettingFrame(unsigned frameSize, unsigned numTruncatedBytes,
struct timeval presentationTime, unsigned durationInMicroseconds) {
if (strcmp(fSubsession.codecName(), "H264") == 0)
{
//code from onvif device manager
static const uint8_t startCode3[] = { 0x00, 0x00, 0x01 };
static const uint8_t startCode4[] = { 0x00, 0x00, 0x00, 0x01 };
auto correctedFrameSize = frameSize;
auto correctedBufferPtr = fPlObj->_fReceiveBuffer;
if (frameSize < sizeof(startCode4) || memcmp(startCode4, correctedBufferPtr, sizeof(startCode4)) != 0){
if (frameSize < sizeof(startCode3) || memcmp(startCode3, correctedBufferPtr, sizeof(startCode3)) != 0){
correctedFrameSize += sizeof(uint8_t)* 4;
correctedBufferPtr -= sizeof(uint8_t)* 4;
}
}
ProcessFrame(correctedBufferPtr, correctedFrameSize, presentationTime, durationInMicroseconds);
}
continuePlaying();
}
void DummySink::ProcessFrame(unsigned char* framePtr, int frameSize, struct timeval presentationTime, unsigned duration) {
AVPacket avpkt;
av_init_packet(&avpkt);
avpkt.data = framePtr;
avpkt.size = frameSize;
while (avpkt.size > 0) {
int got_frame = 0;
int len = avcodec_decode_video2(avCodecContext, frame, &got_frame, &avpkt);
if (len < 0) {
//TODO: log error
return;
}
else if (got_frame == 0)
{
//I tried this code, bacause "codecs which have the AV_CODEC_CAP_DELAY capability set have a delay between input and output"//but it didn't help
/*AVPacket emptyPacket;
av_init_packet(&emptyPacket);
emptyPacket.data = NULL;
emptyPacket.size = 0;
emptyPacket.stream_index = avpkt.stream_index;
len = avcodec_decode_video2(avCodecContext, frame, &got_frame, &emptyPacket);
if ( got_frame == 1) goto next;*/
return;
}
next:
//... here code for view with DirectDraw - everithing ok with it
avpkt.size -= len;
avpkt.data += len;
}
}
Я также пытался отправить кадр в декодер с информацией SPS и PPS:
0 0 0 1 sps 0 0 0 1 pps 0 0 0 1 frame
но это не поможет.
Интересно, что avcodec_decode_video2 не возвращает кадр со второй проблемой (возвращает весь размер кадра), но ширина и высота в avCodecContext установлены правильно. Я не могу понять, почему он не возвращает кадр.
Может кто-нибудь помочь с этими проблемами?
Я решил эти проблемы, используя rtp поверх tcp вместо rtp поверх udp.
Других решений пока нет …