извлечь текст из PDF в PHP не работает для всех файлов PDF

Я извлекаю текст из файлов PDF. это код:

<?php

require("PdfToText.php");

$file   =  'SamplePF' ;
$pdf    =  new PdfToText ( "$file.pdf" ) ;
echo ( $pdf -> Text ) ;

?>

Этот класс отлично работает для некоторых файлов PDF.
Проблема с этим классом:

  1. для некоторых файлов PDF он берет текст со случайной страницы / строки, а не в
    последовательность страниц мудрая.
  2. для некоторых файлов PDF он не показывает никакого результата.
  3. для некоторых файлов PDF он извлекает только одну или две строки.

Пожалуйста, предложите какое-нибудь решение. Благодарю вас!

0

Решение

Я не уверен, что это может быть именно та проблема, из-за которой вы не можете извлечь, но я также столкнулся с чем-то похожим при извлечении данных из PDF. Иногда файлы PDF блокируются паролями владельцев, что накладывает определенные ограничения на документ и не позволяет изменять, копировать или извлекать содержимое и т. Д., Чтобы защитить его проблемы с авторским правом. Проверьте эту ссылку для получения дополнительной информации о паролях владельцев.

Таким образом, вы можете сначала попытаться удалить пароль владельца, а затем попытаться извлечь такие PDF-файлы. Чтобы удалить пароли владельца, в Интернете доступно несколько инструментов, вы можете выбрать тот, который вам больше подходит.

0

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]