Sklearn特征提取

news/2024/7/9 10:43:40 标签: 机器学习, sklearn, 特征提取

模块 sklearn.feature_extraction 可用于提取符合机器学习算法支持的特征,比如文本和图片。

注意 特征特征提取与特征选择有很大的不同:前者包括将任意数据(如文本或图像)转换为可用于机器学习的数值特征。后者是将这些特征应用到机器学习中。

>>> measurements = [
...     {'city': 'Dubai', 'temperature': 33.},
...     {'city': 'London', 'temperature': 12.},
...     {'city': 'San Francisco', 'temperature': 18.},
... ]

>>> from sklearn.feature_extraction import DictVectorizer
>>> vec = DictVectorizer()

>>> vec.fit_transform(measurements).toarray()
array([[  1.,   0.,   0.,  33.],
 [  0.,   1.,   0.,  12.],
 [  0.,   0.,   1.,  18.]])

>>> vec.get_feature_names()
['city=Dubai', 'city=London', 'city=San Francisco', 'temperature']

http://www.niftyadmin.cn/n/568879.html

相关文章

TensorFlow模型保存与恢复

TensorFlow模型保存与恢复 一般模型保存后产生四个文件,分别是: |--models | |--checkpoint | |--.meta | |--.data | |--.index .meta保存的是图的结构 checkpoint文件是个文本文件,里面记录了保存的最新的checkpoint文件以及其它checkp…

Sklearn数据预处理

sklearn.preprocessing 包提供了几个常见的实用功能和变换器类型,用来将原始特征向量更改为更适合机器学习模型的形式。 一般来说,机器学习算法受益于数据集的标准化。如果数据集中存在一些离群值,那么稳定的缩放或转换更合适。不同缩放、转…

TensorFlow增加变量显示+tensorboard可视化

TensorFlow增加变量显示tensorboard可视化 #加名空间: with.tf.variable_scope(“name”): a tf.Variable(initial_value50) # 初始化变量 tf.global_variables_initializer().run() #收集变量: tf.summary.scalar(name“”,tensor) #收…

Tensorflow: AUC的错误/问题与修正

Tensorflow: AUC的错误/问题与修正 AUC是评价模型的常用指标,Tensorflow作为著名的机器学习框架,自然有对这一指标的计算API,其官网API文档为AUC。 问题 但是,这一API不是很好用,在此举一个很简单的例子…

Numpy数据类型

NumPy支持比Python更多种类的数字类型(点此查看Python支持的数字类型)。 Numpy 的类型C 的类型描述np.boolbool存储为字节的布尔值(True或False)np.bytesigned char平台定义np.ubyteunsigned char平台定义np.shortshort平台定义n…

小白都能看懂的softmax详解

小白都能看懂的softmax详解 1.softmax初探 在机器学习尤其是深度学习中,softmax是个非常常用而且比较重要的函数,尤其在多分类的场景中使用广泛。他把一些输入映射为0-1之间的实数,并且归一化保证和为1,因此多分类的概率之和也刚…

Spark中rdd的reduce操作的具体过程

rdd的reduce过程 利用二元函数(如lambda x, y: x y)对数据进行规约,首先将rdd的前两个元素应用于该二元函数,得到结果a,然后再将a和rdd的第三个元素应用于该二元函数,得到结果b,以此类推直到用完所有元素。 rdd sc…

三种恢复 HDFS 上删除文件的方法

三种恢复 HDFS 上删除文件的方法 我们每天都可能会操作 HDFS 上的文件,这就很难避免误操作,比如比较严重的误操作就是删除文件。本文针对这个问题提供了三种恢复误删除文件的方法,希望对大家的日常运维有所帮助。 通过垃圾箱恢复 HDFS 为我…