Моя задача — проанализировать какой-нибудь простой текст, содержащий информацию о пользователях, включая браузер, версию и какие операционные системы, используемые каждым пользователем, и извлечь такую информацию (браузер / версия, операционная система / версия ….)
Есть ли какие-либо общие фреймворки / библиотеки (в Java [предпочтительнее] или C ++), которые имеют схожую проблему? Я считаю, что каждая проблема синтаксического анализа может иметь разные свойства и требует немного разных подходов, но если вам известно о них, пожалуйста, поделитесь или предложите, так как это будет полезно для прояснения шагов проблемы и, возможно, избежания повторной работы или ошибок или повышение эффективности.
Я нашел схему Oracle для анализа текста, которая кажется довольно интересной 🙁http://www.oracle.com/webfolder/technetwork/data-quality/edqhelp/Content/processor_library/text_analysis/parse.htm)
Количество входных данных может быть довольно большим, но, чтобы упростить вопрос, мы можем пока игнорировать большой объем данных.
Задача ещё не решена.
Других решений пока нет …