Поиск текста в PDF-файлах без использования инструмента командной строки «pdftotext», но с использованием его API

Я хотел бы найти тексты и их ограничивающие рамки в файлах PDF.

Инструмент, который, кажется, работает лучше всего pdftotext (XPDF основе).

Однако я не смог понять, как можно использовать этот инструмент без командной строки, и не нашел API без командной строки. Я хотел бы иметь возможность использовать это в программе на C ++ без использования системного вызова.

Кто-нибудь знает как это сделать?

0

Решение

pdftotext (XPDF) имеет (раздвоенного) родного брата на основе Poppler библиотека, которая была разветвлена ​​из кодовой базы XPDF 10 лет назад.

Хранилище исходного кода Poppler находится здесь:

Там вы должны легко узнать, как использовать C ++ API в Poppler.

1

Другие решения


По вопросам рекламы [email protected]