机器学习算法：随机森林 | Python和R代码实现

terry 3年前 (2023-09-27) 阅读数 140 #数据结构与算法

随机森林

随机森林是决策树集合的商标。在随机森林中，我们收集决策树（称为“森林”）。为了根据属性对新对象进行分类，每棵树都会被赋予一个分类，我们将该树称为该类的“投票”。森林选择得票最多的类别（在森林中的所有树木中）。

每棵树的种植和生长过程如下：

如果训练集中有 N 个案例，则随机选择 N 个案例，但进行替换。该示例是种植树木的训练工具。
如果有 M 个输入变量，则设置数量 m>M，以便在每个节点从 M 中随机选择 m 个变量，并使用这些 m 中的最佳分布来分割节点。在森林的生长过程中，M的值保持不变。
每棵树都可以在不砍伐的情况下最大限度地生长。

Python代码

#Import Library
from sklearn.ensemble import RandomForestClassifier
#Assumed you have, X (predictor) and Y (target) for training data set and x_test(predictor) of test_dataset
# Create Random Forest object
model= RandomForestClassifier()
# Train the model using the training sets and check score
model.fit(X, y)
#Predict Output
predicted= model.predict(x_test)

R语言代码

library(randomForest)
x <- cbind(x_train,y_train)
# Fitting model
fit <- randomForest(Species ~ ., x,ntree=500)
summary(fit)
#Predict Output 
predicted= predict(fit,x_test)

版权声明

本文仅代表作者观点，不代表Code前端网立场。
本文系作者Code前端网发表，如需转载，请注明页面地址。

上一篇：机器学习算法：降维算法 | Python 和 R 中的代码实现下一篇：机器学习算法：K-Means（K-means算法）| Python和r代码实现

机器学习算法：随机森林 | Python和R代码实现

随机森林

版权声明

作者文章