icenturyw 2019年 3月 20日 2019年 3月 20日 Python / 机器学习 模型的选择与调优 交叉验证 (为了让被评估的模型更加准确可信) 网格搜索 交叉验证过程 将拿到的训练数据,分为训练集和 …
icenturyw 2019年 3月 18日 2019年 3月 18日 Python / 机器学习 机器学习 机器学习算法分类及开发流程 sklearn库的使用 sklearn特征抽取API TF-IDF 数据 …
icenturyw 2019年 3月 18日 2019年 3月 18日 Python / 机器学习 分类算法-k近邻算法(需要做标准化处理) 问题 K取值多大?有什么影响 K取值太大:容易受K值数量(类别)波动 K取值太小:容易受到异常点影响 …
icenturyw 2019年 3月 18日 2019年 3月 18日 Python / 机器学习 转换器与预估器 转换器(transform) fit_transform():输入数据直接转换 fit():输入数据 …
icenturyw 2019年 3月 18日 2019年 3月 18日 Python / 机器学习 数据集 数据集划分 训练数据:用于训练,构建模型 测试数据:在模型检验时使用,用于评估模型是否有效 数据集划 …
icenturyw 2019年 3月 18日 2019年 3月 18日 Python / 机器学习 机器学习算法分类及开发流程 监督学习(英语:Supervised learning) 可以由输入数据中学到或建立一个模型,并依此 …
icenturyw 2019年 3月 18日 2019年 3月 18日 Python / 机器学习 数据降维 特征选择 主成分分析 特征选择 是什么: 特征选择就是单纯的从提取到的所有特征中选择部分特征作为训练 …
icenturyw 2019年 3月 18日 2019年 3月 18日 Python / 机器学习 缺失值 缺失值处理方法 删除 如果每列或者行数据缺失值达到一定的比例,建议放弃整行或整列。 插补 可以通过缺 …
icenturyw 2019年 3月 18日 2019年 3月 18日 Python / 机器学习 数据的特征预处理 特征处理是什么 通过特定的统计方法(数学方法)将数据转换成算法要求的数据 不同数据处理方法 数值型数 …
icenturyw 2019年 3月 18日 2019年 3月 18日 Python / 机器学习 TF-IDF TF_IDF的主要思想是:如果某个词或短语在一篇文章中出现的频率高,并且在其他文章中很少出现,则认为 …