机器学习系统设计 完整版 PDF_人工智能教程

用户投稿

机器学习系统设计 完整版 PDF_人工智能教程

正文

机器学习系统设计 完整版 PDF_人工智能教程,

第1章?Python机器学习入门??1
1.1 ?梦之队:机器学习与Python??1
1.2 ?这本书将教给你什么(以及不会教什么)??2
1.3 ?遇到困难的时候怎么办??3
1.4 ?开始??4
1.4.1 ?NumPy、SciPy和Matplotlib简介??4
1.4.2 ?安装Python??5
1.4.3 ?使用NumPy和SciPy智能高效地处理数据??5
1.4.4 ?学习NumPy??5
1.4.5 ?学习SciPy??9
1.5 ?我们第一个(极小的)机器学习应用??10
1.5.1 ?读取数据??10
1.5.2 ?预处理和清洗数据??11
1.5.3 ?选择正确的模型和学习算法??12
1.6 ?小结??20
第2章?如何对真实样本分类??22
2.1 ?Iris数据集??22
2.1.1 ?第一步是可视化??23
2.1.2 ?构建第一个分类模型??24
2.2 ?构建更复杂的分类器??28
2.3 ?更复杂的数据集和更复杂的分类器??29
2.3.1 ?从Seeds数据集中学习??29
2.3.2 ?特征和特征工程??30
2.3.3 ?最邻近分类??30
2.4 ?二分类和多分类??33
2.5 ?小结??34
第3章?聚类:寻找相关的帖子??35
3.1 ?评估帖子的关联性??35
3.1.1 ?不应该怎样??36
3.1.2 ?应该怎样??36
3.2 ?预处理:用相近的公共词语个数来衡量相似性??37
3.2.1 ?将原始文本转化为词袋??37
3.2.2 ?统计词语??38
3.2.3 ?词语频次向量的归一化??40
3.2.4 ?删除不重要的词语??41
3.2.5 ?词干处理??42
3.2.6 ?停用词兴奋剂??44
3.2.7 ?我们的成果和目标??45
3.3 ?聚类??46
3.3.1 ?K均值??46
3.3.2 ?让测试数据评估我们的想法??49
3.3.3 ?对帖子聚类??50
3.4 ?解决我们最初的难题??51
3.5 ?调整参数??54
3.6 ?小结??54
第4章?主题模型??55
4.1 ?潜在狄利克雷分配(LDA)??55
4.2 ?在主题空间比较相似度??59
4.3 ?选择主题个数??64
4.4 ?小结??65
第5章?分类:检测劣质答案??67
5.1 ?路线图概述??67
5.2 ?学习如何区分出优秀的答案??68
5.2.1 ?调整样本??68
5.2.2 ?调整分类器??68
5.3 ?获取数据??68
5.3.1 ?将数据消减到可处理的程度??69
5.3.2 ?对属性进行预选择和处理??70
5.3.3 ?定义什么是优质答案??71
5.4 ?创建第一个分类器??71
5.4.1 ?从k邻近(kNN)算法开始??71
5.4.2 ?特征工程??72
5.4.3 ?训练分类器??73
5.4.4 ?评估分类器的性能??74
5.4.5 ?设计更多的特征??74
5.5 ?决定怎样提升效果??77
5.5.1 ?偏差?方差及其折中??77

若对本页面资源感兴趣,请点击下方或右方图片,注册登录后

搜索本页相关的【资源名】【软件名】【功能词】或有关的关键词,即可找到您想要的资源

如有其他疑问,请咨询右下角【在线客服】,谢谢支持!

本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 sumchina520@foxmail.com 举报,一经查实,本站将立刻删除。
如若转载,请注明出处:https://www.jukee8.cn/84932.html