Ищите корпоративное решение для разбиения текста на предложения

Легко разработать ручной / основанный на регулярных выражениях алгоритм разделения текста на предложения. Но игнорирование семантики в конечном итоге приведет к ошибкам синтаксического анализа при обработке большого количества текста.

Я ищу решение уровня предприятия, которое также анализирует семантику и дает точные результаты.

Целевой язык — EN.

2

Решение

NLTK в Python обеспечивает хороший надежный результат, если используются правильные функции.
Также Апачи открывают НЛП следует считать.

1

Другие решения

Я провел некоторый анализ точности различных инструментов сегментации предложений, которые вы можете найти в ПРОЧИТАЙТЕ мое предложение по сегментации Ruby gem или на этом страница. Язык программирования каждого инструмента также известен большинству. Я не сталкивался с инструментами сегментации, написанными на PHP. Я предполагаю, что если вы хотите корпоративное решение, вам нужно будет перенести инструмент с другого языка программирования (или найти кого-то, у кого уже есть).

Инструменты сегментации предложений:

1

По вопросам рекламы [email protected]