Я начинаю новый проект для школы, и мне было интересно, есть ли какие-либо доступные ресурсы. Я немного покопался в некоторых проектах OCR с открытым исходным кодом, обнаружив, что Tesseract является одним из наиболее точных (но все же несколько грязных). У кого-нибудь есть идеи, с чего я мог бы начать, или они могут подтолкнуть меня в правильном направлении с помощью Tesseract или любых других библиотек / примеров.
Камера расположена на контейнере с серийным номером. Этот серийный номер (символы и цифры, выделенные жирным белым цветом на разных цветах) должен быть распознан через изображение (снимок экрана потока прямой трансляции), а затем этот серийный номер ищется в базе данных, чтобы получить необходимую информацию. Буду признателен за любое движение в правильном направлении.
Язык предпочтительно написан на Java / C ++, поскольку у меня действительно есть опыт работы с этими двумя языками программирования, и мне было бы легче начать, если бы я мог использовать любой из этих двух языков.
Камера расположена на контейнере с серийным номером.
Я бы предположил, что это означает, что изображение, с которым вы будете работать, всегда будет иметь одинаковые размеры, более или менее. Если нет, вам, возможно, придется манипулировать изображением, чтобы область, покрывающая серийный номер, не сильно различалась между изображениями.
Камера расположена на контейнере с серийным номером. Тот
серийный номер (буквы и цифры, выделены жирным белым на разных цветах)
Вы делаете какую-либо предварительную обработку изображения? Как, например, взять любой не белый пиксель и превратить его в черный цвет? Это сделало бы ваше распознавание текста не зависимым от цвета изображения, увеличивая его гибкость.
Обрезка изображения для отправки в OCR с включением только тех цифр, которые вы хотите декодировать, также должна улучшить функциональность OCR.
Если это все еще не работает для вас, вы можете попробовать обучить свою сеть Tesseract, как показано Вот.
Других решений пока нет …