Как лемматизировать с помощью инструментов stanford-nlp?

Я установил PHP API для инструментов NLP Stanford (из https://github.com/agentile/PHP-Stanford-NLP) и мне удалось получить пометки POS, используя приведенный там пример кода:

$pos = new \StanfordNLP\POSTagger(
'/path/to/stanford-postagger-2014-08-27/models/english-left3words-distsim.tagger',
'/path/to/stanford-postagger-2014-08-27/stanford-postagger.jar'
);
$result = $pos->tag(explode(' ', "What does the fox say?"));
var_dump($result);

Однако мне также нужны леммы. Мой вопрос: возможно ли получить их с помощью POS-тегера? Или я должен использовать CoreNLP для этого?

Если последний случай, как я могу запустить его в PHP?

Большое спасибо.

1

Решение

  • Я думаю, что вам нужен CoreNLP. Насколько я знаю, только CoreNLP имеет класс лемматизатора.
  • Есть пакеты PHP. В ссылке на CoreNLP установите флажок «Дополнительные инструменты => Расширения => Другие языки программирования»
    • Если вы хотите использовать CoreNLP, используйте сервер CoreNLP, который основан на Java, поэтому вам нужно установить среду Java вместе с PHP
    • После установки сервера CoreNLP вы можете звонить на него через командную строку. Пакеты PHP могут сделать это для вас
0

Другие решения

Других решений пока нет …

По вопросам рекламы [email protected]