Я учусь быть знакомым с пакетом Rcpp, и у меня есть фрейм данных R Д.Ф. со списком столбцов, созданным в два этапа:
df<- data.frame(w= 1:3, x=3:5, y=6:8, z = I(list(1:2, 1:3, 1:4)))
df <- as.data.frame(do.call(cbind, lapply(df[1:3], function(x) Map("*",
df$z, x))))
>df
w x y
1, 2 3, 6 6, 12
2, 4, 6 4, 8, 12 7, 14, 21
3, 6, 9, 12 5, 10, 15, 20 8, 16, 24, 32
Я работаю с набором данных почти 2 миллиона строк. Чтобы сэкономить много времени для удаления, я хочу получить прямой доступ к фрейму данных и выполнить следующую операцию непосредственно с расположением Rcpp, чтобы сгенерировать фрейм данных df1.
df1 <- as.data.frame (4*sin(df*pi))
Основываясь на информации, полученной с этого сайта, я структурировал свой код, который, как я ожидал, смог работать следующим образом:
library(Rcpp)
cppFunction('NumericVector transfo(Rcpp::DataFrame x) {
int nrow = x.nrow(), ncol = x.ncol();
NumericVector out(nrow*ncol);
int pi;
int vol = 4;
for (int j = 0; j < ncol; j++) {
for (int i = 0; i < nrow; i++) {
out[i, j] = sin(x[i,j]*pi)*vol;
}
}
return out;
}')
Но с transfo(df)
:
Я получаю ошибку:
Expecting a single value: [extent=3].
Я буду благодарен за любой намек на то, где моя ошибка приходит.
Ваша структура данных очень необычна, и я не уверен, что вы получите много возможностей от использования C ++ здесь. Но вы можете использовать что-то вроде этого:
#include <Rcpp.h>
using namespace Rcpp;
// [[Rcpp::export]]
DataFrame df_sin(DataFrame df) {
R_xlen_t nCols = df.cols();
R_xlen_t nRows = df.rows();
List result(nCols * nRows);
result.attr("dim") = Dimension(nRows, nCols);
colnames(result) = as<CharacterVector>(df.names());
for (R_xlen_t i = 0; i < nCols; ++i) {
List column = as<List>(df[i]);
for (R_xlen_t j = 0; j < nRows; ++j) {
NumericVector tmp = as<NumericVector>(column[j]);
result[i * nCols + j] = 4 * sin(tmp * M_PI);
}
}
DataFrame df1(result);
return df1;
}
/*** R
df <- data.frame(w= 1:3, x=3:5, y=6:8, z = I(list(1:2, 1:3, 1:4)))
df <- as.data.frame(do.call(cbind, lapply(df[1:3],
function(x) Map("*", df$z, x))))
df_sin(df)
*/
Обратите внимание, что я перешел от исходного кода в качестве строкового аргумента к Rcpp::cppFunction()
в отдельный .cpp
файл. Такой файл может быть легко отредактирован в любом редакторе, который знает о C ++, который включает в себя RStudio. В RStudio вы можете получить исходный файл (Ctrl-Shift-Return или кнопку источника), который скомпилирует и свяжет код. Кроме того, код R в специальном комментарии R в конце будет выполнен. Это удобно, если вам нужен только небольшой код R вместе с кодом C ++. Если код C ++ является частью большей базы кода R, то вы можете вызвать Rcpp::sourceCpp(<cppFile>)
в коде R. Это снова скомпилирует и свяжет код, а также сделает экспортированные функции доступными в R. В этом случае, вероятно, легче удалить специальный комментарий R в конце, так как он выполняется при каждом вызове sourceCpp
,
Других решений пока нет …