R²决定系数

news/2024/7/9 8:51:15 标签: 机器学习, 开发语言, sklearn

R 2 R^2 R2(决定系数)是一个用于衡量统计模型拟合数据的指标,通常用于线性回归分析。它表示模型所解释的因变量(目标变量)方差的比例,范围从0到1。

更具体地说, R 2 R^2 R2告诉我们模型能够解释因变量变化的百分比。当 R 2 R^2 R2接近1时,模型能够很好地拟合数据,因为它能够解释大部分因变量的变化。当 R 2 R^2 R2接近0时,模型无法很好地拟合数据,因为它不能解释因变量的变化。

R 2 R^2 R2的公式如下:
R 2 = 1 − S S R S S T R^2 = 1 - \frac{SSR}{SST} R2=1SSTSSR

其中:

  • R 2 R^2 R2:决定系数
  • SSR(Sum of Squares Residual):残差平方和,表示模型预测值与实际观测值之间的差异的总和。
  • SST(Total Sum of Squares):总平方和,表示因变量的总变差,即实际观测值与因变量均值之间的差异的总和。

为了更好地理解 R 2 R^2 R2,让我们通过一个通俗易懂的例子来说明:

假设你是一名销售经理,想要建立一个线性回归模型,来预测每月销售额与广告投入的关系。你收集了12个月的数据,如下:

月份广告投入(万元)销售额(万元)
12.010.1
22.512.5
33.013.0
43.514.3
54.015.2
64.516.0
75.016.8
85.518.1
96.018.5
106.519.6
117.020.5
127.521.2

你建立了一个线性回归模型,拟合出如下的方程:
销售额 = 2.5 ∗ 广告投入 + 5.0 销售额 = 2.5 * 广告投入 + 5.0 销售额=2.5广告投入+5.0

现在,让我们计算 R 2 R^2 R2来评估模型的拟合质量。

首先,计算SST(总平方和):
SST = Σ(销售额 - 销售额均值)²
= (10.1 - 16.675)² + (12.5 - 16.675)² + … + (21.2 - 16.675)²
≈ 121.35

接下来,计算SSR(残差平方和),即模型预测值与实际销售额之间的差异的总和:
SSR = Σ(实际销售额 - 模型预测值)²
= (10.1 - (2.5 * 2.0 + 5.0))² + (12.5 - (2.5 * 2.5 + 5.0))² + … + (21.2 - (2.5 * 7.5 + 5.0))²
≈ 23.05

现在,使用R²的公式计算 R 2 R^2 R2
R 2 = 1 − S S R S S T = 1 − 23.05 121.35 ≈ 0.810 R^2 = 1 - \frac{SSR}{SST} = 1 - \frac{23.05}{121.35} ≈ 0.810 R2=1SSTSSR=1121.3523.050.810

这意味着你的模型能够解释销售额变化的大约81%。这是一个相对较高的 R 2 R^2 R2值,表明你的模型相对准确地拟合了数据,广告投入对销售额有较强的解释能力。


http://www.niftyadmin.cn/n/5072091.html

相关文章

Mysql 8手动终止某个事务并释放其持有的锁

示范数据表 age具有index普通索引 在mysql数据库里的information_schema.INNODB_TRX表中存储有innodb的所有事务,我们可以查看该表来查看正在进行的事务 现在我开启一个事务,执行第1、2行SQL,启动事务并持有id3的行锁 刷新事务表可以看到…

golang pg 数据库不存在 就创建 --chatPGT

问:linkOrCreateDatabase(addr ), 函数执行 连接 pg数据库,若数据库 不存在就创建 gpt: 要在 Go 中连接到 PostgreSQL 数据库并在数据库不存在时创建数据库,你可以使用 github.com/lib/pq 包以及 database/sql 包。以下是一个示例&#xff1…

系统架构设计:3 软件架构建模技术与应用

目录 一 架构“4+1”视图 二 论点 1 架构的本质 2 “4+1”视图 (1)逻辑视图 <

Kfka监控工具--Kafka-eagle安装

1、开启Kafka JMX端口 JMX 是一个为应用程序植入管理功能的框架 在启动Kafka脚本之前&#xff0c;添加&#xff1a; export JMX_PORT9988 nohup bin/kafka-server-start.sh comfig/server.properties 2、安装jdk配置好JAVA_HOME 3、将kafka_eagle 上传并解压 tar -zxvf …

ping使用

使用shell ping一个网段 #!/bin/shfor ib in $(seq 1 254); doip"192.168.1.$ib"(if ping -c3 "$ip" >> 1.txt; thenecho "$ip is alive"fi) &done wait在每次循环的最后&#xff0c;使用 & 将子 shell 放入后台执行&#xff0c…

linux shell程序设计

文章目录 shell变量if分支语句case语句for循环while循环位置参数函数流编辑器sed工具awk工具 应用示例which命令的shell脚本实现 讨论 shell是unix和linux内核的外壳&#xff0c;它构成了命令或者程序的一个执行环境。不同版本的Unix和linux的shell各有特色&#xff0c;但是都提…

访问控制、RBAC和ABAC模型

访问控制、RBAC和ABAC模型 访问控制 访问控制的目的是保护对象&#xff08;数据、服务、可执行应用该程序、网络设备或其他类型的信息技术&#xff09;不受未经授权的操作的影响。操作包括&#xff1a;发现、读取、创建、编辑、删除和执行等。 为实现访问控制&#xff0c; 计…

【微服务】RedisSearch 使用详解

目录 一、RedisJson介绍 1.1 RedisJson是什么 1.2 RedisJson特点 1.3 RedisJson使用场景 1.3.1 数据结构化存储 1.3.2 实时数据分析 1.3.3 事件存储和分析 1.3.4 文档存储和检索 二、当前使用中的问题 2.1 刚性数据库模式限制了敏捷性 2.2 基于磁盘的文档存储导致瓶…