首页| 行业标准| 论文文档| 电子资料| 图纸模型
购买积分 购买会员 激活码充值

您现在的位置是:团子下载站 > 其他 > Python机器学习基础教程PDF版电子书免费下载

Python机器学习基础教程PDF版电子书免费下载

  • 资源大小:16.85 MB
  • 上传时间:2021-08-07
  • 下载次数:0次
  • 浏览次数:59次
  • 资源积分:1积分
  • 标      签: python 机器学习 人工智能

资 源 简 介

本书是机器学习入门书,以 Python 语言介绍。主要内容包括 :机器学习的基本概念及其应用 ;实践中最常用的机器学习算法以及这些算法的优缺点 ;在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面 ;模型评估和调参的高级方法,重点讲解交叉验证和网格搜索 ;管道的概念 ;如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。   本书适合机器学习从业者或有志成为机器学习从业者的人阅读。   目前,从医疗诊断和治疗到在社交网络上寻找好友,许多商业应用和研究项目都离不开机器学习。许多人以为,只有大公司的大型研究团队才能用到机器学习。在本书中,我们要向你展示,自己动手构建机器学习解决方案是多么容易的一件事,也将介绍如何将这件事做到最好。学完本书中的知识,你可以自己构建系统,研究 Twitter 用户的情感,或者对全球变暖做出预测。机器学习的应用十分广泛,如今的海量数据使得其应用范围更是远超人们的想象。   本书是为机器学习从业者或有志成为机器学习从业者的人准备的,他们在为现实生活中的机器学习问题寻找解决方案。这是一本入门书,不需要读者具备机器学习或人工智能(artificial intelligence,AI)的相关知识。我们主要使用 Python 和 scikit-learn 库,一步一步构建一个有效的机器学习应用。我们介绍的方法适用于科学家和研究人员,也会对开发商业应用的数据科学家有所帮助。如果你对 Python 以及 NumPy 和 matplotlib 库有所了解的话,将能够更好地掌握本书的内容。   我们刻意不将数学作为重点,而是将机器学习算法的实践作为重点。数学(尤其是概率论)是机器学习算法的基石,所以我们不会详细分析算法的细节。如果你对机器学习算法的数学部分感兴趣,我们推荐阅读 Trevor HasTIe、Robert TIbshirani 和 Jerome Friedman 合著的《统计学习基础》(Elements of StaTIsTIcal Learning,Springer 出版社)一书,可以在几位作者的网站上免费阅读这本书(http://statweb.stanford.edu/~tibs/ElemStatLearn/)。我们也不会从头讲解如何编写机器学习算法,而是将重点放在如何应用 scikit-learn 库和其他库中已经实现的海量模型。   本书的结构大致如下。   • 第 1 章介绍机器学习的基本概念及其应用,并给出本书会用到的基本设置。   • 第 2 章和第 3 章介绍实践中最常用的机器学习算法,并讨论这些算法的优缺点。   • 第 4 章介绍在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面。   • 第 5 章介绍模型评估和调参的高级方法,重点讲解交叉验证和网格搜索。   • 第 6 章解释管道的概念。管道用于串联多个模型并封装工作流。   • 第 7 章介绍如何将前面各章讲述的方法应用到文本数据上,还介绍了一些文本特有的处理方法。   • 第 8 章对全书进行总结,还介绍了有关更高级主题的参考资料。   虽然第 2 章和第 3 章给出了实际算法,但对于初学者来说,并不需要理解所有这些算法。如果你想要尽快构建一个机器学习系统,我们建议你首先阅读第 1 章和第 2 章的开始部分,里面介绍了所有的核心概念。然后你可以翻到 2.5 节,里面提到了我们介绍的所有监督学习模型。从中选择最适合你需求的模型,然后翻回到对应小节阅读其详细内容。之后你可以使用第 5 章中的方法对你的模型进行评估和调参。   机器学习(machine learning)是从数据中提取知识。它是统计学、人工智能和计算机科学交叉的研究领域,也被称为预测分析(predictive analytics)或统计学习(statistical learning)。近年来,机器学习方法已经应用到日常生活的方方面面。从自动推荐看什么电影、点什么食物、买什么商品,到个性化的在线电台和从照片中识别好友,许多现代化网站和设备的核心都是机器学习算法。当你访问像 Facebook、Amazon 或 Netflix 这样的复杂网站时,很可能网站的每一部分都包含多种机器学习模型   除了商业应用之外,机器学习也对当前数据驱动的研究方法产生了很大影响。本书中介绍的工具均已应用在各种科学问题上,比如研究恒星、寻找遥远的行星、发现新粒子、分析 DNA 序列,以及提供个性化的癌症治疗方案。   不过,如果想受益于机器学习算法,你的应用无需像上面那些例子那样给世界带来重大改变,数据量也用不着那么大。本章将解释机器学习如此流行的原因,并探讨机器学习可以解决哪些类型的问题。然后将向你展示如何构建第一个机器学习模型,同时介绍一些重要的概念。
VIP VIP