Я извлекаю текст из файлов PDF. это код:
<?php
require("PdfToText.php");
$file = 'SamplePF' ;
$pdf = new PdfToText ( "$file.pdf" ) ;
echo ( $pdf -> Text ) ;
?>
Этот класс отлично работает для некоторых файлов PDF.
Проблема с этим классом:
Пожалуйста, предложите какое-нибудь решение. Благодарю вас!
Я не уверен, что это может быть именно та проблема, из-за которой вы не можете извлечь, но я также столкнулся с чем-то похожим при извлечении данных из PDF. Иногда файлы PDF блокируются паролями владельцев, что накладывает определенные ограничения на документ и не позволяет изменять, копировать или извлекать содержимое и т. Д., Чтобы защитить его проблемы с авторским правом. Проверьте эту ссылку для получения дополнительной информации о паролях владельцев.
Таким образом, вы можете сначала попытаться удалить пароль владельца, а затем попытаться извлечь такие PDF-файлы. Чтобы удалить пароли владельца, в Интернете доступно несколько инструментов, вы можете выбрать тот, который вам больше подходит.
Других решений пока нет …