Я занимаюсь разработкой веб-сайта. Я хочу найти PDF-файл для поиска строки и показать результаты на веб-сайте. Файл PDF доступен, и когда пользователь вводит какой-либо текст для поиска, результаты должны отображаться. Я пробовал с «объектом PDF», и это не то, что я хочу сделать. Мне нужно не просматривать PDF на веб-сайте, а искать в PDF.
Libpoppler может помочь. Разбирает PDF.
С Libpoppler приходит pdftotext
утилита командной строки, которая может соответствовать вашим целям (она входит в пакет Debian) poppler-utils
). Лучше однако может быть pdfgrep
инструмент для поиска текста в PDF-файлах, который не поставляется с Libpoppler. Все они доступны в Debian, возможно, в других местах.
Других решений пока нет …