У меня есть набор данных с 10 миллиардов образцы (10 ^ 10) с 100 функциями (и да, у меня также есть метки). Я хотел бы обучить случайный лес для классификации.
Можно ли обучить, как 10000 деревьев решений, на случайно выбранных подмножествах (одно за другим) и объединить эти деревья в один лес? Если да, то как?
Задача ещё не решена.