Некоторые слова (пройти обучение) не могут быть распознаны через Tesseract-OCR

В настоящее время я использую Tesseract-OCR для распознавания некоторых текстов на картинке. Но теперь у меня есть вопрос. Поскольку некоторые слова не могут быть распознаны. Я специально обучил их, и это все равно не сработало!

Нужны ли мне дополнительные файлы при обучении языковым данным, такие как файлы DAWG и т. Д.
понятия не имею об этом. Потому что иногда он может распознать несколько из них, когда слова отображаются в определенных местах и ​​направлениях.

Это действительно сбивает с толку. Искренне нуждаюсь в вашей помощи. Заранее спасибо!

Другая информация:

  1. Я использую упрощенный китайский. (Я не знаю, есть ли какие-либо параметры, которые я не установил при использовании китайского)

  2. Так как картина, которую я хочу узнать, это таблица. в нем есть несколько строк. Не могли бы вы иметь представление об этой ситуации при распознавании таблиц для повышения точности.

  3. Поскольку я не знаю, вызвано ли это особой формой слов. Я вставляю некоторые слова прямо здесь.上 下午 一二 三四五

Большое спасибо !

0

Решение

Задача ещё не решена.

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]