Обучение Tesseract4.0 (LSTM) по ограничивающим рамкам на уровне слов

Я хотел бы обучить Тессеракта на моем собственном наборе данных, состоящем из изображений слов. У меня есть информация ограничивающего прямоугольника, но для всего слова, а не для каждого символа. Я сослался на следующую доступную документацию по теме обучения Tesseract 4.0.
https://github.com/tesseract-ocr/tesseract/wiki/TrainingTesseract-4.00

В документации упоминается, что «поля должны быть только на уровне текстовой строки. Таким образом, гораздо проще получать данные обучения из существующих данных изображений». Но позже в вики формат блока, который допускает использование блоков на уровне текстовой строки, еще не реализован («Формат файла блока — второй вариант (НЕ ИМЕЕТ ОСУЩЕСТВЛЕНО)»). Поэтому я хотел бы знать, есть ли способ обучить Тессеракту, основываясь только на информации о ограничивающем поле слова, а не на уровне персонажа?

2

Решение

Задача ещё не решена.

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]