Я анализирую PDF-файл с табличной структурой через smalot / PdfParser. Код довольно прост, как показано ниже.
// Include Composer autoloader if not already done.
include 'vendor/autoload.php';
// Parse pdf file and build necessary objects.
$parser = new \Smalot\PdfParser\Parser();
$pdf = $parser->parseFile('p04.pdf');
// Retrieve all pages from the pdf file.
$pages = $pdf->getPages();
// Loop over each page to extract text.
foreach ($pages as $page) {
$data = $page->getTextArray();
var_dump($data);
}
Это выводит массив, как и ожидалось, но массив не включает в себя столбцы, имеющие пустые значения.
Образец PDF
Поскольку я читаю массив для обработки данных, его массив вызывает несогласованность при пропуске пустых столбцов.
Любая помощь будет высоко ценится.
Большое спасибо
Задача ещё не решена.
Других решений пока нет …