Я создаю приложение для Android для регистрации жалоб пользователей по любой конкретной проблеме, связанной с правительством. Я хотел бы сделать жалобы уникальными без какой-либо двусмысленности в моей базе данных. Я использую базы данных php и mysql. Я хотел бы сопоставить сходства между жалобами с использованием программного обеспечения, такого как wordnet, для устранения идентичных жалоб и внесения изменений в предложения для пользователей. Так как я могу это сделать? Есть только Wordnet или какой-либо другой надежный метод?
Рекомендации (тип, который вы запрашиваете, а не тот, который вы строите) не разрешены в переполнении стека, и я ожидаю, что этот вопрос будет закрыт. Надеюсь, я смогу закончить это до того, как это произойдет.
В то время как вещи из единственного случая и неоднозначность кажутся вещами, от которых вы хотите избавиться, есть большая ценность в записи всего, что говорят люди так, как они это говорят. Это верно даже в случае переполнения стека, вопросы могут быть закрыты как дубликаты, но мы не удаляем их, мы храним их так, чтобы, если кто-то напишет вопрос таким образом и попадет сюда из Google, мы все равно поймем его понимание проблема.
Проблема, с которой вы столкнулись, заключается не столько в алгоритме, сколько в дизайне продукта. Независимо от того, какой алгоритм сопоставления вы выбрали для определения сходства (а их много), вы все равно должны решить, как эффект объявления достаточно похожих вещей оказывает на ваших пользователей. Это, вероятно, поможет вам принять решение о том, как определить сходство. (то есть это сходство слов, сходство n-грамм символов, концептуальное сходство и т. д.)
Как только вы выберете сходство и столкнетесь с конкретной проблемой, получая желаемый эффект (то есть вы можете описать свои входные данные и то, что вы ожидаете получить в качестве выходных данных), вот такой вопрос вы можете задать здесь.
Других решений пока нет …