
前言
我们现在生活的时代处处都有人工智能的影子,比如在搜索引擎上搜索一段话,按下Enter键之后,搜索引擎就会对这段话进行语义分析,然后返回合适的结果;还可以使用图片搜索功能,只要我们上传一张照片,搜索引擎就可以返回相似的照片,甚至告诉我们这张照片的相关信息。这些技术的实现都依托于机器学习。
“机器学习”这个名称给人一种很“高级”的感觉,这种叫法让人觉得机器好像有了自主的学习能力,其实不然。机器学习背后所应用的数学思想早在很多年前就已经出现了,比如现在很火的名词“深度学习”的理论基础——神经网络,早在1949年就被提出了。其他一些机器学习的数学理论也是如此。但是在那些年代计算机算力跟不上,所以这些理论并不如现在火热。近些年,由于计算机硬件的飞速发展,这些数学理论被高效地实现,因此这些思想又重新流行起来。特别是现在,一台个人计算机都可以用来进行机器学习平台的搭建。所以,可以粗略理解为所谓的“机器学习”就是“计算机”+“数学理论”。本书的任务就是带领读者理解机器学习背后的思想。
本书特色
1.Python语言基础讲解详细,深度和广度并重
为了照顾没有编程基础的读者,本书会先对Python语言及其整个科学计算的生态圈进行讲解。
2.深入浅出地介绍了11个机器学习算法,只要掌握基础的数学知识就能看懂
本书涵盖了11个机器学习算法,对它们背后的数学理论知识做了深入探讨。另外,将11个机器学习算法有机结合,比如将线性回归、逻辑回归以及神经网络这三个经典算法结合起来,读者可以梳理清楚它们之间的关系,清晰地认识到机器学习算法是相互关联的,一些思想是可以通用的。
3.图片、代码和案例相结合
本书有大量的图片作为辅助参考,这些图片将复杂的数学理论形象直观地表达出来,让读者更容易理解抽象的概念。此外,每个知识点都有相应的案例以及实现的代码,让读者可以将所学的知识快速应用起来。
本书内容及体系结构
第1章 介绍了机器学习的基本概念,以及相关开发工具的配置。
第2章 介绍了Python语言的入门知识,其中包含了基本的操作符、容器及流程控制语句。
第3章 讲解了Numpy的使用方法,介绍了数组的概念,以及Numpy内置的数学与统计函数。
第4章 讲解了Pandas的使用方法,介绍了Series和DataFrame的概念,以及相关的操作方法。
第5章 讲解了如何使用Matplotlib库进行基本图形的绘制。
第6章 讲解了Scikit库的用法,并对机器学习的框架进行了系统的讲解。
第7章 介绍了机器学习常用数据集,包括boston、diabetes、digits、iris、wine。
第8章 介绍了线性回归算法的理论知识,及其在糖尿病患者病情预测中的应用。
第9章 介绍了逻辑回归算法的理论知识,及其在二维鸢尾花分类中的应用。
第10章 介绍了神经网络算法的理论知识,分别进行了回归和分类的应用测试。
第11章 介绍了线性判别算法的理论知识,及其在花卉分类中的应用。
第12章 介绍了K最近邻算法的理论知识,及其在手写字体识别中的应用。
第13章 介绍了决策树方法的理论知识,及其在红酒分类中的应用。
第14章 介绍了贝叶斯算法的理论知识,及其在文本分类中的应用。
第15章 介绍了支持向量机的理论知识,及其在鸢尾花分类中的应用。
第16章 介绍了PCA降维算法的理论知识,及其在iris数据集可视化中的应用。
第17章 介绍了SVD奇异值分解的理论知识。
第18章 介绍了聚类算法的理论知识。
第19章 介绍了深度学习框架,包含了TensorFlow、Keras、PyTorch以及Caffe。
本书读者对象
·数据分析入门读者
·机器学习入门读者
·人工智能入门读者
·深度学习入门读者
·数据挖掘入门读者
·Python编程入门读者
·其他对机器学习有兴趣的读者