使用sklearn生成TF-IDF词向量

news/2024/7/9 8:41:29 标签: nlp, 词向量, tf-idf, sklearn

写一个使用sklearn生成TF-IDF词向量的模板函数:

from sklearn import feature_extraction # 导入sklearn库, 以获取文本的tf-idf
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.feature_extraction.text import CountVectorizer

def getVector(get_texts):
    mat = CountVectorizer()
    tf = TfidfTransformer()
    tfidf = tf.fit_transform(mat.fit_transform(get_texts))
    word = mat.get_feature_names() # 单词的名称
    weight=tfidf.toarray() # 权重矩阵, 在此示范中矩阵为(1, n)
    return weight

http://www.niftyadmin.cn/n/1686578.html

相关文章

python openCV调用摄像头进行人脸识别

整个过程很简单,因为不是自己训练人脸特征模型,而是使用的官方的Haar分类器(但是这样的话实测识别不是很准确)。 版本信息: python: 3.7 cv2: 4.1.0haar分类器下载 过程可以概括为: 1、调用电脑摄像头&a…

人脸位置定位鼠标并实现眨眼点击

环境: python: 3.7 cv2: 4.1.0 pyautoguihaar分类器下载 受前几天的hackfun第一名(键鼠替代方案)启发,尝试自己做一个简易版。由摄像头检测人脸位置,并由此定位鼠标位置;检测图像中的眼睛位置,…

opencv-python实例系列一-摄像头图片视频操作

文章目录1、加载一张图片,并且在窗口中显示2、BGR转化为灰度图片3、调用摄像头并保存为视频4、调用摄像头并在窗口中显示1、加载一张图片,并且在窗口中显示 import cv2img cv2.imread(北京.jpg) # 导入图片# cv2.namedWindow(Image) # cv2.imshow(Imag…

几个ubuntu使用技巧

1、切换pip安装源 在pip安装命令后面添加下面命令即可 -i https://pypi.tuna.tsinghua.edu.cn/simple 如安装opencv python -m pip install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple 2、haar分类器文件下载 在opencv官方github库里就有了,下面…

opencv-python 图像处理 —— canny边缘检测

canny边缘检测 有个canny函数用起来非常方便简单 import cv2 import numpy as npimg cv2.imread(screenshot.png, 0) cv2.imwrite(canny.jpg, cv2.Canny(img, 200, 300)) cv2.imshow(canny, cv2.imread(canny.jpg)) cv2.waitKey() cv2.destroyAllWindows()cv2.Canny()原型为…

opencv-python 图像处理 —— 轮廓检测

文章目录轮廓检测1、阈值函数 cv2.threshold()2、使用threshold函数的黑白二值反转实例3、轮廓检测,绘制轮廓轮廓检测 1、阈值函数 cv2.threshold() 这个函数有四个参数,第一个原图像,第二个进行分类的阈值,第三个是高于&#x…

opencv-python 图像处理 —— 直线与圆检测

直线检测,使用HoughLines和HoughLinesP函数完成 cv2.HoughLineP()的参数为 代码实例 import cv2 import numpy as npimg cv2.imread(line-cycle.png) gray cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) edges cv2.Canny(gray, 50, 120) minLineLength 20 # 最小直线…

ln 给某一组合命令(sh)添加软链

配置在环境变量里的链接, 能够执行一个命令 之所以要设置这样,是因为我在安装PyCharm的时候疏忽没有添加charm命令,以至于我每次进入pycharm中还得执行 nohup pycharm.sh > tmp.txt & 在后台运行pycharm 所以我把这条命令写入到run-pycharm.sh文…