随机森林的重要参数、接口及其使用

news/2024/7/9 8:37:59 标签: sklearn
随机森林的重要参数、接口及其使用
from sklearn.tree import DecisionTreeClassifier
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split,cross_val_score
import matplotlib.pyplot as plt


wine = load_wine()
print([*wine])
print(wine.data,wine.target)

# 随机森林与决策树对比
x_train,x_test,y_train,y_test = train_test_split(wine.data,wine.target
                                                 ,test_size=0.3,random_state=42)

rf = RandomForestClassifier(random_state=0)
df = DecisionTreeClassifier(random_state=0
                             )

rf = rf.fit(x_train,y_train)
df = df.fit(x_train,y_train)

print(rf.score(x_test,y_test))
print(df.score(x_test,y_test))


# 参数1 n_estimators 弱评估器(决策树)个数

res = []
for i in range(1,101,2):
    res.append(cross_val_score(RandomForestClassifier(n_estimators=i),x_train
                    ,y_train,cv=10).mean())
    
plt.figure(figsize=(20,5))
plt.plot(range(1,101,2),res)
plt.show()

# 参数2 random_state 确定一片固定的森林,而不是一棵树每一棵树都一样
##(随机体现:随机挑选特征进行分枝)

# 属性1 estimators_ 查看森林中树的状态,返回每一个决策树对象
for i in rf.estimators_:
    print(i)

print(rf.estimators_[0].score(x_test,y_test))
print(rf.estimators_[0].random_state)

# 参数3 bootstrap 控制有放回的随机抽样技术的参数 (默认为True/False)##(随机体现:测试集样本随机)
#        & oob_score(out od bag data)是否使用袋外样本测试数据如果为Ture 使用属性oob_score_查看结果得分

RF = RandomForestClassifier(n_estimators=25,oob_score=True)
RF = RF.fit(wine.data,wine.target)
print(RF.oob_score_)


## 其他重要属性和接口
# 参数:n_estimators,random_state,boostrap,oob_score
# 属性:.estimators_,.oob_score_,.feature_importances_
# 接口:apply,fit,predict,score,predict_proba

print('------------------------------------------------------------')

RF = RandomForestClassifier(n_estimators=25,oob_score=True)
RF = RF.fit(x_train,y_train)
print('特征综合贡献度',RF.feature_importances_)
print('每个样本的特征的叶子索引',RF.apply(x_test))# 目前不知道有什么用
print('每个测试样本被分到一类标签的平均概率',RF.predict_proba(x_test))








    
    





http://www.niftyadmin.cn/n/1509967.html

相关文章

C#学习笔记一:C#开发环境的设置

C#是.NET Framework的一部分,用于编写.NET应用程序。 C#集成开发环境(IDE) 微软提供了以下C#编程开发工具: Visual Studio 2010 (VS) Visual C# 2010 Express (VCE) Visual Web Developer 最后两个是可以免费从微软的…

逻辑回的阈值0.5修改问题

逻辑回归阈值修改 #使用sklearn乳腺癌数据集验证 from sklearn.datasets import load_breast_cancer from sklearn.linear_model import LogisticRegression as LR import numpy as np np.set_printoptions(suppressTrue)data load_breast_cancer()lr LR().fit(data.data,da…

每日最佳睡眠时长

据外媒报道,美国“全国睡眠基金会”(National Sleep Foundations,NSF)根据专家研究成果,日前对各年龄层人群提出新的睡眠时间建议,新生儿每天应睡时间变为14至17小时,成年人为7至9小时,而65岁以上老年人为7…

Swift与Objective-C API的交互

互用性是让 Swift 和 Objective-C 相接合的一种特性,使你能够在一种语言编写的文件中使用另一种语言。当你准备开始把 Swift 融入到你的开发流程中时,你应该懂得如何利用互用性来重新定义并提高你写 Cocoa 应用的方案。 互用性很重要的一点就是允许你在写…

手写简单的BP(反向传播)算法,实现预测

手写简单的BP(反向传播)算法(一个隐藏层),网络结构如下: 输入层shape:(1,2) w1.shape:(2,4) w2.shape:(4,4) 具体代码实现及数据预测结果: import numpy as np import matplotlib.pyplot as plt# 训练集特征2维 X np.array([[…

Redis操作手册

一、概述: 在该系列的前几篇博客中,主要讲述的是与Redis数据类型相关的命令,如String、List、Set、Hashes和Sorted-Set。这些命令都具有一个共同点,即所有的操作都是针对与Key关联的Value的。而该篇博客将主要讲述与Key相关的…

【3,7,83,29,31】把所有质数输出!

【3,7,83,29,31】把所有质数输出&#xff01;TOC a[3,7,83,29,31] i0 j2 while i<len(a): sa[i] while s>j: if a[i]%j0: print(“不是质数”) break j1 else: print(a[i]) i1 欢迎使用Markdown编辑器 你好&#xff01; 这是你第一次使用 Markdown编辑器 所展示的欢迎…

不同算法下校准曲线对比

from sklearn.datasets import make_classification from sklearn.calibration import calibration_curve # 校准曲线 from sklearn.ensemble import RandomForestClassifier from sklearn.naive_bayes import GaussianNB from sklearn.linear_model import LogisticRegressio…