Я хотел бы заменить слова предложения на основе стоп-слов другого вектора, используя Rcpp
, Пример в R
следующим образом:
library(stringr)
library(tm)
x <- "I love eating burgers every day and night"idVector <- str_split(x,pattern = " ")[[1]]
idVector <- idVector[!idVector %in% stopwords(kind = "en")]
idVector <- paste0(idVector, collapse = " ")
print(idVector)
Мне было бы интересно создать Rcpp
функционировать и выполнять группу по строкам data.table
чтобы убрать огромное количество предложений. Используя текущий подход, это занимает значительное количество времени.
Заранее спасибо!
Задача ещё не решена.
Других решений пока нет …