常用的评价方法

news/2024/7/9 10:08:16 标签: sklearn, 机器学习, python, origin

评价方法 (scoring)

CA

  • Orange.evaluation.CA(results=None, **kwargs)[source]

    一个 sklearn.metrics.classification.accuracy_score 的装饰器。以下是它的文档:准确度分类分数。
    在多标签分类中,此函数计算子集精度:为样本预测的标签集必须与y_true中的相应标签集精确匹配。
    请阅读《用户手册》中的更多内容。

Precision

  • Orange.evaluation.Precision(results=None, **kwargs)[source]

    sklearn.metrics._classification.precision_score 的包装器。 以下是它的文档:

    计算精度。

    精度是 tp / (tp + fp) 的比值,其中 tp是真阳性数,fp 是假阳性数。 精度直观地是分类器不将负样本标记为正样本的能力。

    最佳值为 1,最差值为 0。

    请阅读《用户手册》中的更多内容。

Recall

  • Orange.evaluation.Recall(results=None, **kwargs)[source]

    sklearn.metrics._classification.recall_score 的包装器。 以下是它的文档:

    计算召回率。

    召回率是 tp / (tp + fn) 的比率,其中 tp 是真阳性数,fn 是假阴性数。 召回率直观地是分类器找到所有正样本的能力。

    最佳值为 1,最差值为 0。

    在用户指南中信息。

F1

  • Orange.evaluation.F1(results=None, **kwargs)[source]

    sklearn.metrics._classification.f1_score 的包装器。 以下是它的文档:

    计算 F1 分数,也称为平衡 F 分数或 F 度量。

    F1 分数可以解释为准确率和召回率的调和平均值,其中 F1 分数在 1 时达到其最佳值,在 0 时达到最差分数。准确率和召回率对 F1 分数的相对贡献是相等的。 F1分数的公式是:

    python">F1 = 2 * (precision * recall) / (precision + recall)
    

    在多类和多标签的情况下,这是每个类的 F1 分数的平均值,权重取决于平均参数。

    在用户指南中信息。

PrecisionRecallFSupport

  • Orange.evaluation.PrecisionRecallFSupport(results=None, **kwargs)[source]

    sklearn.metrics._classification.precision_recall_fscore_support 的包装器。以下是它的文档:

    计算每个类的精度、召回率、F-measure 和支持。

    精度是比率 tp / (tp + fp),其中 tp 是真阳性数,fp是假阳性数。精度直观地是分类器不将负样本标记为正样本的能力。

    召回率是 tp / (tp + fn) 的比率,其中 tp 是真阳性数,fn 是假阴性数。召回率直观地是分类器找到所有正样本的能力。

    F-beta 分数可以解释为准确率和召回率的加权调和平均值,其中 F-beta 分数在 1 处达到其最佳值,在 0 处达到最差分数。

    F-beta 分数权重的召回率比准确率高 1 倍。 beta == 1.0 意味着召回率和精度同样重要。

    支持度是 y_true 中每个类的出现次数。

    如果 pos_labelNone 并且在二进制分类中,如果平均值是“micro”、“macro”、“weighted”或“samples”之一,则此函数返回平均精度、召回率和 F-measure。

    在用户指南中信息。

AUC

  • Orange.evaluation.AUC(results=None, **kwargs)[source]

    ${sklpar}

    参数

         results (Orange.evaluation.Results) – 模型测试中存储的预测和实际数据。
    
         target (int, optional (default=None)) -- 要报告的类的值。
    

Log Loss

  • Orange.evaluation.LogLoss(results=None, **kwargs)[source]

    ${sklpar}

    参数

         results (Orange.evaluation.Results) – 模型测试中存储的预测和实际数据。
    
         eps (float) – p=0 或 p=1 的对数损失未定义,因此概率被限制为 max(eps, min(1 - eps, p))。
    
         normalize (bool, optional (default=True)) – 如果为真,则返回每个样本的平均损失。 否则,返回每个样本损失的总和。
    
         sample_weight (array-like of shape = [n_samples], optional) – 样本权重。
    

举例

Orange.evaluation.LogLoss(results)
array([ 0.3...])

MSE

  • Orange.evaluation.MSE(results=None, **kwargs)[source]

    sklearn.metrics._regression.mean_squared_error 的包装器。 以下是它的文档:

    均方误差回归损失。

    在用户指南中信息。

MAE

  • Orange.evaluation.MAE(results=None, **kwargs)[source]

    sklearn.metrics._regression.mean_absolute_error 的包装器。 以下是它的文档:

    平均绝对误差回归损失。

    在用户指南中信息。

R2

  • Orange.evaluation.R2(results=None, **kwargs)[source]

    sklearn.metrics._regression.r2_score 的包装器。 以下是它的文档:

    R 2 R^2 R2(确定系数)回归评分函数。

    最好的分数是 1.0,它可以是负数(因为模型可以任意变坏)。 一个始终预测 y 的期望值的常量模型,不考虑输入特征, R 2 R^2 R2将得到0.0 分。

    在用户指南中信息。

CD diagram

  • Orange.evaluation.compute_CD(avranks, n, alpha=‘0.05’, test=‘nemenyi’)[source]

    根据给定的 alpha(alpha=”0.05” 或 alpha=”0.1”)返回 Nemenyi 或 Bonferroni-Dunn 测试的关键差异,用于平均排名和测试数据集 N 的数量。测试可以是 Nemenyi 两尾的“nemenyi” 测试或“bonferroni-dunn”用于 Bonferroni-Dunn 测试。

  • Orange.evaluation.graph_ranks(avranks, names, cd=None, cdmethod=None, lowv=None, highv=None, width=6, textspace=1, reverse=False, filename=None, **kwargs)[source]

    绘制 CD 图,用于显示方法性能的差异。 参见 “Janez Demsar,多个数据集上分类器的统计比较,2006 年 7 月(1 月):1-30”。

    需要 matplotlib 才能工作。

    图像绘制在使用 import matplotlib.pyplot as plt 导入的 plt 上。

    参数

    python">avranks(浮动列表)– 方法的平均排名。
    
    names (list of str) -- 方法的名称。
    
    cd (float) - 用于方法之间差异的统计显着性的关键差异。
    
    cdmethod (int, optional) – 与其他方法比较的方法如果省略,则显示方法的成对比较
    
    lowv (int, optional) – 显示的最低等级
    
    highv (int, optional) – 显示的最高等级
    
    width (int, optional) – 默认宽度(以英寸为单位)(默认值:6)
    
    textspace (int, optional) – 方法名称的图形边上的空间(以英寸为单位)(默认值:1)
    
    reverse (bool, optional) – 如果设置为 True,则最低排名在右侧(默认值:False)
    
    filename (str, optional) – 输出文件名(带扩展名)。 如果没有给出,该函数不会写入文件。
    

    Example

import Orange
import matplotlib.pyplot as plt
names = ["first", "third", "second", "fourth" ]
avranks =  [1.9, 3.2, 2.8, 3.3 ]
cd = Orange.evaluation.compute_CD(avranks, 30) #tested on 30 datasets
Orange.evaluation.graph_ranks(avranks, names, cd=cd, width=6, textspace=1.5)
plt.show()

该代码生成以下图表:
在这里插入图片描述

reference

@online{BibEntry2022Jan,
title = {{Scoring methods (scoring) — Orange Data Mining Library 3 documentation}},
year = {2022},
month = {1},
date = {2022-01-08},
urldate = {2022-01-16},
language = {english},
hyphenation = {english},
note = {[Online; accessed 16. Jan. 2022]},
url = {https://orange3.readthedocs.io/projects/orange-data-mining-library/en/latest/reference/evaluation.cd.html}
}


http://www.niftyadmin.cn/n/1033762.html

相关文章

麦克尼马尔检验(McNemar test)

麦克尼马尔检验(McNemar test) 前言 在统计学中,McNemar 检验是用于配对 名义数据的统计检验。它应用于具有二分特征的2 2列联表,具有匹配的主题对,以确定行和列的边际频率是否相等(即是否存在“边际同质性”)。它以…

如何解决企业各个部门间的“数据孤岛”问题?

这是傅一平的第354篇原创【与数据同行】已开通综合、数据仓库、数据分析、产品经理、数据治理及机器学习六大专业群,加微信号frank61822702 为好友后入群。新开招聘交流群,请关注【与数据同行】公众号,后台回复“招聘”后获得入群方法。正文开…

一文了解参数检验和非参数检验

一文了解参数检验和非参数检验: 前言 假设检验 概念:是一种根据样本数据来推断总体的分布或均值、方差等总体统计参数的方法。 根据样本来推断总体的原因: 总体数据不可能全部收集到。如:质量检测问题收集到总体全部数据要耗…

网易大数据用户画像实践

【与数据同行】已开通综合、数据仓库、数据分析、产品经理、数据治理及机器学习六大专业群,加微信号frank61822701 为好友后入群。新开招聘交流群,请关注【与数据同行】公众号,后台回复“招聘”后获得入群方法。正文开始分享嘉宾:…

国庆荐书 | 2020年3季度我读过的十本好书!

这是傅一平的第355篇原创【与数据同行】已开通综合、数据仓库、数据分析、产品经理、数据治理及机器学习六大专业群,加微信号frank61822702 为好友后入群。新开招聘交流群,请关注【与数据同行】公众号,后台回复“招聘”后获得入群方法。正文开…

win安装SSH

win安装SSH 教程适用于: Windows Server 2022,Windows Server 2019,Windows 10 (build 1809 and later) 安装 使用Windows设置安装 打开设置安装服务, 依次是: 设置 -> 应用 -> 应用和功能 ->可选功能 -> 添加功能 -> openssh 服务器 -> 安装 如下图所示: …

通过python查看GPU信息的工具包: pynvml

通过python查看GPU信息的工具包: pynvml 安装 conda install -c conda-forge pynvml 使用示例 from pynvml import * nvmlInit() print("Driver Version:", nvmlSystemGetDriverVersion())deviceCount nvmlDeviceGetCount() for i in range(deviceCount):handle…

深度学习辅助学习基础技术

深度学习辅助学习基础技术 将网络的架构保存为图片 注意: model.name 需要设置, 也就是图片的名字 from keras.utils.vis_utils import plot_modelplot_model(model, to_filearchitecture_{}.png.format(model.name), show_shapesTrue, show_layer_namesTrue) print("suc…