НЛП: лемматизация с переполнением стека lemmaGen

Я улучшаю чат-бота и хочу найти лемму слов во входном предложении. Chatbot написан на C ++, и я нашел бесплатный инструмент лемматизации с открытым исходным кодом под названием LemmaGen. Я скачал версию 2.2 для c ++, но она не содержит документации о том, как на нее ссылаются или даже используют.

Кто-нибудь имел опыт работы с LemmaGen для c ++ в прошлом? Любая информация будет полезна.
Большое спасибо

4

Решение

Я не использовал версию C ++, но я использовал версию C #. Использование LemmaGen для C # просто и довольно просто. Сначала вы инициализируете объект типа Lemmatizer с параметром файла модели, а затем вы можете вызвать его открытый метод для лемматизации слова, представленного в виде строки. Так что все, что вам нужно сделать, это токенизировать ваш текст, а затем лемматизировать каждый токен один за другим. Метод возвращает строку, которая представляет лемму входного слова.

Я думаю, что использование версии C ++ аналогично.

2

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]