В настоящее время я использую Tesseract-OCR для распознавания некоторых текстов на картинке. Но теперь у меня есть вопрос. Поскольку некоторые слова не могут быть распознаны. Я специально обучил их, и это все равно не сработало!
Нужны ли мне дополнительные файлы при обучении языковым данным, такие как файлы DAWG и т. Д.
понятия не имею об этом. Потому что иногда он может распознать несколько из них, когда слова отображаются в определенных местах и направлениях.
Это действительно сбивает с толку. Искренне нуждаюсь в вашей помощи. Заранее спасибо!
Другая информация:
Я использую упрощенный китайский. (Я не знаю, есть ли какие-либо параметры, которые я не установил при использовании китайского)
Так как картина, которую я хочу узнать, это таблица. в нем есть несколько строк. Не могли бы вы иметь представление об этой ситуации при распознавании таблиц для повышения точности.
Поскольку я не знаю, вызвано ли это особой формой слов. Я вставляю некоторые слова прямо здесь.上 下午 一二 三四五
Большое спасибо !
Задача ещё не решена.
Других решений пока нет …