Я пытаюсь конвертировать PDF в документ с помощью Libreoffice в PHP, который не работает.
path/to/soffice --infilter="writer_pdf_import" --convert-to doc file.pdf /path/to/test.docx
PS: есть ли другие лучшие решения для анализа pdf и извлечения изображений, а не только текста, а затем преобразовать его в doc-представления.
Ну, вы не показали ошибку, поэтому я не знаю, почему не работает ваша команда. Но эта команда не является командой Libreoffice. Вы используете команду soffice:
Это пример использования libreoffice:
path/to/libreoffice --headless --invisible --convert-to doc your_source_file.pdf
Заметка: Это решение только конвертирует текст без изображений.
Альтернатива 01: Если LibreOffice не работает в вашей системе, ** Abiword также работает аналогичным образом.
устанавливать Abiword набрав следующую команду в терминале:
sudo apt-get install abiword
Затем выполните преобразование:
abiword --to=doc your_source_file.pdf
Альтернатива 02: Если вы хотите продолжать использовать команду soffice, возможно, вы можете использовать этот синтаксис:
path/to/soffice --headless --convert-to <TargetFileExtension>:<NameOfFilter> your_source_file.pdf
В вашем примере используйте «MS Word 2007 XML» для doc
файлы или «Microsoft Word 2007/2010/2013 XML» и «Microsoft Word 2007-2013 XML» для docx
в качестве фильтра:
path/to/soffice --headless --convert-to docx:"Microsoft Word 2007/2010/2013 XML" your_source_file.pdf
Других решений пока нет …