xgb和gbm做回归代码sklearn

news/2024/7/8 12:36:42 标签: 回归, sklearn, 数据挖掘

sklearn_0">xgb和gbm做回归代码sklearn接口

import numpy as np 
import pandas as pd 
import re 
from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.model_selection import train_test_split

from sklearn import datasets
from sklearn.model_selection import train_test_split
from sklearn.metrics import mean_absolute_error, r2_score
import lightgbm as lgb
import xgboost as xgb


df = pd.read_csv('翼型数据集.csv', encoding='gbk')
col_dict = dict(zip(set(df['翼型名称']), [i for i in range(len(set(df['翼型名称'])))]))
df['翼型名称'] = df['翼型名称'].map(col_dict)

print(f"the data shape is : {df.shape}")
print(df.head())
print(df.columns)
train_x, test_x = train_test_split(df, random_state=100, test_size=0.2, stratify=df['攻角 (degrees)'])
train_y, test_y = train_x['攻角 (degrees)'], test_x['攻角 (degrees)']
train_x = train_x.drop('攻角 (degrees)', axis=1)
test_x = test_x.drop('攻角 (degrees)', axis=1)


# 模型训练gbm

model = lgb.LGBMClassifier(
    boosting_type='gbdt',  # 基学习器 gbdt:传统的梯度提升决策树; dart:Dropouts多重加性回归
    n_estimators=100,  # 迭代次数
    learning_rate=0.1,  # 步长
    max_depth=4,  # 树的最大深度
    min_child_weight=1,  # 决定最小叶子节点样本权重和
    # min_split_gain=0.1,  # 在树的叶节点上进行进一步分区所需的最小损失减少
    subsample=1,  # 每个决策树所用的子样本占总样本的比例(作用于样本)
    colsample_bytree=1,  # 建立树时对特征随机采样的比例(作用于特征)典型值:0.5-1
    random_state=27,  # 指定随机种子,为了复现结果
    importance_type='gain',  # 特征重要性的计算方式,split:分隔的总数; gain:总信息增益
    objective='multiclass',
)

model.fit(train_x, train_y, eval_metric="auc_mu", verbose=10, \
                          eval_set=[(train_x, train_y), (test_x, test_y)], \
                         )
print(f"the mae is: ", mean_absolute_error([int(i) for i in model.predict(test_x)], test_y))
print(pd.DataFrame({"predict":[int(i) for i in model.predict(test_x)], 'real':test_y}))


# 模型训练xgb
xgb_Regressor = xgb.XGBClassifier(
        learning_rate=0.01,
        n_estimators=100,
        max_depth=3,
        min_child_weight=1,
        gamma=0,
        objective='multiclass',
        subsample=0.8,
        colsample_bytree=0.8,
        nthread=4,
        scale_pos_weight=1,
        seed=27
    )
xgb_Regressor.fit(train_x, train_y, eval_metric="auc", verbose=10,
                          eval_set=[(train_x, train_y), (test_x, test_y)],
                         )
print(f"the mae is: ", mean_absolute_error(xgb_Regressor.predict(test_x), test_y))




http://www.niftyadmin.cn/n/5449517.html

相关文章

Linux收到一个网络包是怎么处理的?

目录 摘要 ​编辑 1 从网卡开始 2 硬中断,有点短 2.1 Game Over 3 接力——软中断 3.1 NET_RX_SOFTIRQ 软中断的开始 3.2 数据包到了协议栈 3.3 网络层处理 3.4 传输层处理 4 应用层的处理 5 总结 摘要 一个网络包的接收始于网卡,经层层协议栈…

网络安全实训Day11

写在前面 IPSec来喽。有时候把xmind直接粘贴过来会有顺序错位的情况,又被气晕 网络安全实训-网络安全技术 IPSec VPN IPSec 用于保障IP协议安全性的技术 相关概念 工作模式 传输模式:只对数据提供安全保护,不封装公网头部 隧道模式&#…

CentOS DHCP服务器部署指南

title: DHCP 服务器部署以及配置 search: 2024-03-21 tags: “#DHCP 服务器部署以及配置” CentOS DHCP 服务器部署指南 背景 :因上了 Linux 的实验课程,在课程中,老师要求我们自己搭建 DHCP 服务器构建局域网,在构建的时候问题百…

5.3 用PyTorch实现Logistic回归

一、数据准备 Logistic回归常用于解决二分类问题。 为了便于描述,我们分别从两个多元高斯分布 N₁(μ₁,Σ₁ )、N₂(μ₂,Σ₂)中生成数据 x₁ 和 x₂,这两个多元高斯分布分别表示…

数字保护的壁垒:探索 Web3 的网络安全

引言 随着数字化时代的到来,网络安全问题日益突出,而Web3作为新一代互联网的演进形态,其网络安全问题备受关注。本文将深入探讨Web3的网络安全特点、挑战以及应对策略,帮助读者更好地了解数字保护的壁垒与Web3的关系,…

Linux 系统 快速卸载docker

(卸载前一定要做好相关数据的备份) 卸载: 第一种卸载方法 1、查询docker安装过的包: yum list installed | grep docker 2、删除安装包: yum remove docker-ce.x86_64 ddocker-ce-cli.x86_64 -y 3、删除镜像/容器等 rm -rf /var/lib/dock…

javaSwing推箱子游戏

一、简介 策略性游戏可以锻炼人的思维能力还能缓解人的压力,使人们暂时忘却生活当中的烦恼,增强人们的逻辑思维能力,游戏的艺术美也吸引着越来越多的玩家和厂商,寓教于乐,在放松人们心情的同时还可以活跃双手。在人类…

maya打开bvh脚本

目录 maya打开脚本编辑器 运行打开bvh脚本 maya导出bvh脚本 maya打开脚本编辑器 打开Maya软件,点击右下角 “脚本编辑器” 运行打开bvh脚本 https://github.com/jhoolmans/mayaImporterBVH/blob/master/bvh_importer.py import os import re from typing impo…