Мой вопрос заключается в том, как извлечь соответствующую категорию из естественного контента.
Например, ниже находится новостная статья из газеты.
«Арсенал» завершил подписание «Шкодран Мустафи» из Валенсии, так как «канониров» вступили в последний день, сделав шесть подписаний этим летом в форме Лукаса Переса, Гранита Хака и молодого трио Роб Холдинга, Такумы Асано и Келечи Нвакали, наряду с немцами. Международный. Эта новость пришла через несколько часов после того, как клуб из северного Лондона объявил о передаче «Переса» в Эмираты, что, вероятно, приведет к прекращению их трансферного бизнеса этим летом.
Я хочу классифицировать этот контент в категории Спортивный. Есть ли хорошо написанная библиотека на каких-либо языках программирования, таких как python, php, ruby?
Вопрос вдохновения: http://www.newsnow.co.uk/
Я видел еще один вопрос, связанный с этим, но ответ не удовлетворял моему требованию.
Это рубинем, который может помочь вам в этом. проверять этот
Других решений пока нет …