Разбор пользовательских данных как текста — без формата в тексте

Моя задача — проанализировать какой-нибудь простой текст, содержащий информацию о пользователях, включая браузер, версию и какие операционные системы, используемые каждым пользователем, и извлечь такую ​​информацию (браузер / версия, операционная система / версия ….)

Есть ли какие-либо общие фреймворки / библиотеки (в Java [предпочтительнее] или C ++), которые имеют схожую проблему? Я считаю, что каждая проблема синтаксического анализа может иметь разные свойства и требует немного разных подходов, но если вам известно о них, пожалуйста, поделитесь или предложите, так как это будет полезно для прояснения шагов проблемы и, возможно, избежания повторной работы или ошибок или повышение эффективности.

Я нашел схему Oracle для анализа текста, которая кажется довольно интересной 🙁http://www.oracle.com/webfolder/technetwork/data-quality/edqhelp/Content/processor_library/text_analysis/parse.htm)

Количество входных данных может быть довольно большим, но, чтобы упростить вопрос, мы можем пока игнорировать большой объем данных.

0

Решение

Задача ещё не решена.

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]