Некоторые слова (пройти обучение) не могут быть распознаны через Tesseract-OCR

Question

Некоторые слова (пройти обучение) не могут быть распознаны через Tesseract-OCR

В настоящее время я использую Tesseract-OCR для распознавания некоторых текстов на картинке. Но теперь у меня есть вопрос. Поскольку некоторые слова не могут быть распознаны. Я специально обучил их, и это все равно не сработало!

Нужны ли мне дополнительные файлы при обучении языковым данным, такие как файлы DAWG и т. Д.
понятия не имею об этом. Потому что иногда он может распознать несколько из них, когда слова отображаются в определенных местах и направлениях.

Это действительно сбивает с толку. Искренне нуждаюсь в вашей помощи. Заранее спасибо!

Другая информация:

Я использую упрощенный китайский. (Я не знаю, есть ли какие-либо параметры, которые я не установил при использовании китайского)
Так как картина, которую я хочу узнать, это таблица. в нем есть несколько строк. Не могли бы вы иметь представление об этой ситуации при распознавании таблиц для повышения точности.
Поскольку я не знаю, вызвано ли это особой формой слов. Я вставляю некоторые слова прямо здесь.上下午一二三四五

Большое спасибо !

0

c++image-recognition ocr tesseract training-data

Решение

Задача ещё не решена.

Другие решения

Других решений пока нет …

Источник