Преобразование PDF в текстовый документ с использованием переполнения стека

Я пытаюсь конвертировать PDF в документ с помощью Libreoffice в PHP, который не работает.

path/to/soffice --infilter="writer_pdf_import" --convert-to doc file.pdf /path/to/test.docx

PS: есть ли другие лучшие решения для анализа pdf и извлечения изображений, а не только текста, а затем преобразовать его в doc-представления.

1

Решение

Ну, вы не показали ошибку, поэтому я не знаю, почему не работает ваша команда. Но эта команда не является командой Libreoffice. Вы используете команду soffice:

Это пример использования libreoffice:

path/to/libreoffice --headless --invisible --convert-to doc your_source_file.pdf

Заметка: Это решение только конвертирует текст без изображений.

Альтернатива 01: Если LibreOffice не работает в вашей системе, ** Abiword также работает аналогичным образом.

устанавливать Abiword набрав следующую команду в терминале:

sudo apt-get install abiword

Затем выполните преобразование:

abiword --to=doc your_source_file.pdf

Альтернатива 02: Если вы хотите продолжать использовать команду soffice, возможно, вы можете использовать этот синтаксис:

path/to/soffice --headless --convert-to <TargetFileExtension>:<NameOfFilter> your_source_file.pdf

В вашем примере используйте «MS Word 2007 XML» для doc файлы или «Microsoft Word 2007/2010/2013 XML» и «Microsoft Word 2007-2013 XML» для docx в качестве фильтра:

path/to/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" your_source_file.pdf

Здесь вы можете найти больше фильтров.

4

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]