- 前情回顾之预处理
python">from sklearn.feature_extraction.text import TfidfVectorizer
from sklearn.preprocessing import StandardScaler, Imputer
from sklearn.feature_selection import VarianceThreshold
from sklearn.decomposition import PCA
自带数据集导入
-
load* 和 fetch*返回的数据类型datasets.base.Bunch(字典格式)
-
data:特征数据数组,是 [n_samples * n_features] 的二维
numpy.ndarray 数组<