使用sklearn生成TF-IDF词向量

news/2024/7/9 8:41:29 标签: nlp, 词向量, tf-idf, sklearn

写一个使用sklearn生成TF-IDF词向量的模板函数：

from sklearn import feature_extraction # 导入sklearn库, 以获取文本的tf-idf值
from sklearn.feature_extraction.text import TfidfTransformer
from sklearn.feature_extraction.text import CountVectorizer

def getVector(get_texts):
    mat = CountVectorizer()
    tf = TfidfTransformer()
    tfidf = tf.fit_transform(mat.fit_transform(get_texts))
    word = mat.get_feature_names() # 单词的名称
    weight=tfidf.toarray() # 权重矩阵, 在此示范中矩阵为(1, n)
    return weight

http://www.niftyadmin.cn/n/1686578.html

python openCV调用摄像头进行人脸识别

整个过程很简单，因为不是自己训练人脸特征模型，而是使用的官方的Haar分类器（但是这样的话实测识别不是很准确）。版本信息： python: 3.7 cv2: 4.1.0haar分类器下载过程可以概括为： 1、调用电脑摄像头&a…

人脸位置定位鼠标并实现眨眼点击

环境： python: 3.7 cv2: 4.1.0 pyautoguihaar分类器下载受前几天的hackfun第一名（键鼠替代方案）启发，尝试自己做一个简易版。由摄像头检测人脸位置，并由此定位鼠标位置；检测图像中的眼睛位置，…

opencv-python实例系列一-摄像头图片视频操作

文章目录1、加载一张图片，并且在窗口中显示2、BGR转化为灰度图片3、调用摄像头并保存为视频4、调用摄像头并在窗口中显示1、加载一张图片，并且在窗口中显示 import cv2img cv2.imread(北京.jpg) # 导入图片# cv2.namedWindow(Image) # cv2.imshow(Imag…

1、切换pip安装源在pip安装命令后面添加下面命令即可 -i https://pypi.tuna.tsinghua.edu.cn/simple 如安装opencv python -m pip install opencv-python -i https://pypi.tuna.tsinghua.edu.cn/simple 2、haar分类器文件下载在opencv官方github库里就有了，下面…

opencv-python 图像处理 —— canny边缘检测

canny边缘检测有个canny函数用起来非常方便简单 import cv2 import numpy as npimg cv2.imread(screenshot.png, 0) cv2.imwrite(canny.jpg, cv2.Canny(img, 200, 300)) cv2.imshow(canny, cv2.imread(canny.jpg)) cv2.waitKey() cv2.destroyAllWindows()cv2.Canny()原型为…

opencv-python 图像处理 —— 轮廓检测

文章目录轮廓检测1、阈值函数 cv2.threshold()2、使用threshold函数的黑白二值反转实例3、轮廓检测，绘制轮廓轮廓检测 1、阈值函数 cv2.threshold() 这个函数有四个参数，第一个原图像，第二个进行分类的阈值，第三个是高于&#x…

opencv-python 图像处理 —— 直线与圆检测

直线检测，使用HoughLines和HoughLinesP函数完成 cv2.HoughLineP()的参数为代码实例 import cv2 import numpy as npimg cv2.imread(line-cycle.png) gray cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) edges cv2.Canny(gray, 50, 120) minLineLength 20 # 最小直线…

ln 给某一组合命令(sh)添加软链

配置在环境变量里的链接, 能够执行一个命令之所以要设置这样，是因为我在安装PyCharm的时候疏忽没有添加charm命令，以至于我每次进入pycharm中还得执行 nohup pycharm.sh > tmp.txt & 在后台运行pycharm 所以我把这条命令写入到run-pycharm.sh文…