Я хотел бы найти тексты и их ограничивающие рамки в файлах PDF.
Инструмент, который, кажется, работает лучше всего pdftotext
(XPDF основе).
Однако я не смог понять, как можно использовать этот инструмент без командной строки, и не нашел API без командной строки. Я хотел бы иметь возможность использовать это в программе на C ++ без использования системного вызова.
Кто-нибудь знает как это сделать?
pdftotext
(XPDF) имеет (раздвоенного) родного брата на основе Poppler библиотека, которая была разветвлена из кодовой базы XPDF 10 лет назад.
Хранилище исходного кода Poppler находится здесь:
Там вы должны легко узнать, как использовать C ++ API в Poppler.