Есть ли способ (с помощью библиотек, если это необходимо) нормализовать любую переменную PHP (целое число, строки, файлы, bytarray, и т. Д. И т. Д.), Так что эти данные могут быть измерены расстоянием между ними?
С расстоянием, которое я имею в виду, F («привет») должно быть близко к F («ад»).
Тем не менее, не только для строки, но СУЩЕГО рода данных.
Я думал о том, чтобы сначала передать все в двоичный файл, но управление битами PHP не так просто.
В C ++ это можно сделать намного проще.
Например, я должен быть в состоянии рассчитать расстояние между f («привет») и f (3333).
(разные типы данных).
Может быть, сбросить все в байтовый массив?
Спасибо
Функция Левенштейна может быть что-то, чтобы посмотреть.
Со страницы php.net:
<?php
// input misspelled word
$input = 'carrrot';
// array of words to check against
$words = array('apple','pineapple','banana','orange',
'radish','carrot','pea','bean','potato');
// no shortest distance found, yet
$shortest = -1;
// loop through words to find the closest
foreach ($words as $word) {
// calculate the distance between the input word,
// and the current word
$lev = levenshtein($input, $word);
// check for an exact match
if ($lev == 0) {
// closest word is this one (exact match)
$closest = $word;
$shortest = 0;
// break out of the loop; we've found an exact match
break;
}
// if this distance is less than the next found shortest
// distance, OR if a next shortest word has not yet been found
if ($lev <= $shortest || $shortest < 0) {
// set the closest match, and shortest distance
$closest = $word;
$shortest = $lev;
}
}
echo "Input word: $input\n";
if ($shortest == 0) {
echo "Exact match found: $closest\n";
} else {
echo "Did you mean: $closest?\n";
}
?>
Приведенный выше пример выведет:
Введите слово: морковь
Вы имели в виду морковь?
Других решений пока нет …