Я использую разрешение сопутствующих ссылок, где мы объединяем различные функции и выполняем их один за другим, чтобы получить окончательный результат.
Все исполняемые файлы от разных поставщиков с открытым исходным кодом. Реализация всех функций, таких как NER, POS, синтаксический анализ и т. Д., Пока невозможна. Поэтому я должен использовать существующий (и Стэнфорд лучше всего подходит для этого).
Проблема в том, что требуется много времени, чтобы выполнить все по одному и дать результат. Около 25-30 секунд
Каждый раз, когда я выполняю, он компилирует связанные файлы и выдает результат. Это в любом случае сократить это время выполнения?
Все команды находятся в .sh
сценарий оболочки, и я выполняю его через файл Python.
Вот набор выполняемых команд
Получение NER (Распознавание именованных сущностей)
java -mx700m -cp $ 1 / stanford-ner.jar edu.stanford.nlp.ie.crf.CRFClassifier -loadClassifier $ 1 / классификаторы / ner-eng-ie.crf-3-all2008-distsim.ser.gz -textFile $ 2
(файл java jar)
Получение POS (часть речи)
java -mx300m -classpath $ 1 / stanford-postagger.jar edu.stanford.nlp.tagger.maxent.MaxentTagger -model $ 1 / models / bidirectional-wsj-0-18.tagger -textFile $ 2
(файл java jar)
Использование анализа минипара для разбора текста
инструменты / минипар / pdemo / pdemo -p инструменты / минипар / данные / < $ 1> $ 1.minipar
(исполняемый файл c ++)
Обнаружение упоминаний
java MentionDetection $ 1
(файл класса)
java создатьNPSpan $ 1 $ 1.pred
(файл класса)
создание файла объектов
java -cp.: edu.mit.jwi.jar CherryPick cr $ 1
модель соединения CR
tools / svmrank / svm_classify $ 1 modelrank> $ 1.entities
(исполняемый файл c ++)
Получение ответа
java MakeResponse $ 1
(Файлы классы)
Задача ещё не решена.