У меня есть список строк с ключевыми словами.
//random keywords random order
$array = array(
'Keyword7 keyword4 keyword9 keyword1'
'keyword4 keyword9 Keyword7 keyword2'
'Keyword7 keyword4 keyword9 keyword3'
'keyword3 keyword9 Keyword7 keyword5'
);
Я хотел бы найти ключевое слово / ы, которое существует во всех строках "Keyword7" and Keyword9"
и удали их. Я хотел бы теперь установить эти ключевые слова в качестве ключа моего нового массива.
$new_array = array();
$new_array["Keyword7 Keyword9"] = array();
Значение этого нового массива теперь должно быть теми же строками, но теперь в них отсутствует родительское ключевое слово / s.
$new_array = array(
'Keyword7 keyword9' =>array(
array(
' keyword4 keyword1'
' keyword4 keyword2'
' keyword4 keyword3'
' keyword3 keyword5'
);
)
)
«keyword4» — это следующее совпадение, которое встречается чаще всего, так что это будет дальше. сопровождаемый следующим лучшим соответствием «keyword3» или «keyword5».
$new_array = array(
'Keyword7 keyword9' =>array(
'keyword4' => array(
'keyword1'
'keyword2'
'keyword3'
),
'keyword3' =>array(
'keyword5'
)
)
)
Следующие строки представляют собой все уникальные ключевые слова, которые массив заполнен.
Что я сделал до сих пор
подготовил массив
$keywordlist_array = array();
foreach ($keywordlist as $key => &$string) {
$new_str = trim(preg_replace('/\s+/', ' ',$string),' ');
$arr = explode(' ', $new_str);
asort($arr);
$keys = array_values($arr);
$keywordlist_array[$key] = array_combine($keys, array_fill_keys($keys, 0));
$string = implode(' ', $arr);
}
Это удаляет лишние пробелы и упорядочивает слова в алфавитном порядке, чтобы упростить сравнение. Я также сохраняю версию массива строки для дальнейшего использования.
Этот цикл подсчитывает количество вхождений каждого ключевого слова во всех строках, это работает, но мне не удалось его использовать.
foreach ($keywordlist_array as $key_1 => $array_1) {
foreach ($keywordlist_array as $key_2 => $array_2) {
foreach (array_keys($array_1) as $keyword) {
if(array_key_exists($keyword,$array_2)){
$keywordlist_array[$key_1][$keyword]++;
}
}
}
}
Я также создал функцию, которая выполняет большую часть работы, но когда дело доходит до массива с несколькими родительскими ключами, я застреваю.
function keywordListToNestedArray($keywordlist_array){
$new_array = array();
$length = count($keywordlist_array);
$all_share_keywords = false;
$some_share_keywords = false;
$keywords = array();
$new_keywordlist_array = array();
$max_values = array();
foreach ($keywordlist_array as $key => $arr) {
if(in_array($length, $arr)){
$all_share_keywords = true;
if(!$keywords){
foreach ($arr as $keyword => $value) {
if($value == $length){
$keywords[] = $keyword;
}
}
}
if($keywords){
$new_keywordlist_array[$key] = array_diff_key($arr, array_flip($keywords));
}
} else {
}
}
if($all_share_keywords){
$keyword = implode(' ', $keywords);
$new_array[$keyword] = keywordListToNestedArray($new_keywordlist_array );
} else if($some_share_keywords){
// will have multiple new parents
} else {
//all values equal 1 (one occurance)
foreach ($keywordlist_array as $key => $keywords) {
$new_array[$key] = implode(' ', array_keys($keywords));
}
}
return $new_array;
}
$new_array = keywordListToNestedArray($keywordlist_array);
Возможные функции PHP, которые могут помочь, — Similar_text () и Levenshtein (),
Вопрос в том, «что бы вы сделали или как бы вы достигли этого?». полный кодированный ответ не нужен, просто нужна небольшая помощь, чтобы начать с этим.
У меня было немного свободного времени, поэтому я попробовал. Это не идеально, но делает то, что вы хотите. Может быть, это поможет вам.
Ex. выход:
Array ([ключевое слово1] => массив ([ключевое слово2] => массив ([ключевое слово3] => массив ([0] => ключевое слово4 [1] => ключевое слово5 [2] => ключевое слово7 [3] => ключевое слово6 [4]) => ключевое слово10 [5] => ключевое слово9 [6] => ключевое слово8))))
<?php
$keywords = array(
'keyword1 keyword2 keyword3 keyword4',
'keyword1 keyword2 keyword3 keyword5',
'keyword1 keyword2 keyword7 keyword6',
'keyword1 keyword10 keyword9 keyword8'
);
//create a new array with all the keywords
$keywordArray = [];
foreach($keywords as $keyword){
$pieces = explode(" ", $keyword);
foreach($pieces as $piece){
$keywordArray[] = $piece;
}
}
//count each keyword appearence
$keywordCount = array_count_values($keywordArray);
//create associative array key names
$max = count($keywords);
$newArray = [];
while($max >= 0){
$myStr = "";
foreach($keywordCount as $key => $value){
if($value == $max){
$myStr .= $key." ";
}
}
if($myStr != ""){
$newArray[$myStr] = $max;
}
$max--;
}
//get final array data
end($newArray);
$values = explode(" ", key($newArray));
foreach($values as $value){
if($value != ""){
$finalArray[] = $value;
}
}
unset($newArray[key($newArray)]);
reset($newArray);
//add previous key and final data to it
end($newArray);
$testArray[key($newArray)] = $finalArray;
$rKey = key($newArray);
unset($newArray[key($newArray)]);
reset($finalArray);
//repeat proccess from bottom to top
while(!empty($newArray)){
end($newArray);
$testArray[key($newArray)] = $testArray;
unset($newArray[key($newArray)]);
unset($testArray[key($testArray)]);
reset($newArray);
}
unset($testArray[$rKey]);
print_r($testArray);
?>
Других решений пока нет …