Я использую парсер pdf для поиска в папке содержит много файлов pdf для поиска в содержимом файлов pdf.
код работает нормально только для максимум 3 файлов с небольшими размерами:
$keyword = "Calibri"; //the keyword is dynamic
$dir = new DirectoryIterator('C:\wamp\www\pdfdemos\cv');
$parser = new \Smalot\PdfParser\Parser();
foreach ($dir as $file) {
if($file->isFile() && $file->getExtension() =='pdf'){
if ($file->getFilename() =="." || $file->getFilename() =="..") {
continue;
}else{
echo "File name: ".$file->getFilename()."<br />";
$pdf= $parser->parseFile('C:\wamp\www\pdfdemos/cv/'.$file->getFilename());
$pages = $pdf->getPages();
$text = $pdf->getText();
if(stripos(strtolower($text), $keyword)) {
echo "Keyword Matches";
echo "<br/><hr />";
}else{
echo "Keyword Not Matches";
unset($text);
}
}
}
}
Код работает максимум с тремя файлами, в противном случае я получаю сообщение «Этот сайт недоступен».
я работаю локально и использую wamp сервер
я использую библиотеку парсера PDF: https://pdfparser.org
Пожалуйста помоги
Задача ещё не решена.
Других решений пока нет …