Результат ‘Smalot PDF Parser’: текст не в одной строке

Question

Результат ‘Smalot PDF Parser’: текст не в одной строке

Поэтому я установил PDF Parser (http://www.pdfparser.org/). Я проверил их сайт и использовал демо. Это дало мне результат, который я хотел. После нескольких часов поисков, как использовать композитор, мне наконец удалось заставить его работать. Теперь я застрял со следующей проблемой, как получить результат из демо.

Я использовал пример кода, приведенный на странице документации. Он извлек текст, но весь текст находится в одной строке. Когда я использую демо, каждая новая страница начиналась с нового абзаца, и каждый фрагмент текста помещался на отдельной строке. Код:

<?php

// Include Composer autoloader if not already done.
include 'vendor/autoload.php';

// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf    = $parser->parseFile('document.pdf');

// Retrieve all pages from the pdf file.
$pages  = $pdf->getPages();

// Loop over each page to extract text.
foreach ($pages as $page) {
echo $page->getText();
}

?>

Как я уже сказал, когда использовал код выше, я получил весь текст в одну строку. У меня вопрос, как я могу получить тот же результат, что и сценарий на демонстрационной странице?

0

pdf pdf-parsing php

Решение

Другие решения

Других решений пока нет …

Источник

Accepted Answer

Я была такая же проблема. Зациклите это так с nl2br

// Loop over each page to extract text.
foreach ($pages as $page) {
echo nl2br($page->getText());
}

0