У меня есть файл PDF (содержимое в виде изображения в PDF), мне нужно извлечь текст и изображения из файла PDF. Я пробовал библиотеки PDF Converter в Laravel, но ни одна не работает. Итак, я преобразовал этот PDF в изображение с помощью Imagick, после чего с помощью TesseractOCR извлек текст из изображения (формат jpg), теперь мне нужно извлечь изображения также. Есть ли возможность извлечь как текст, так и изображение из изображения.
Мой PDF как ниже
Я пробовал библиотеку TesseractOCR в laravel, теперь я могу успешно извлечь текст.
$file = public_path().'/images/S29A57P1-4.jpg';
echo (new TesseractOCR($file))
->lang('eng')
->run();
Я хочу извлечь как текст, так и изображения из PDF или изображения.
Задача ещё не решена.
Других решений пока нет …