 
  
编者注: 澳大利亚机器学习专家、畅销书作者 Jason Brownlee ,对 机器学习 领域的各类优质书籍进行了盘点,汇总成这份阅读指南。在雷锋网所筛选的学习资源中,这堪称是迄今为止 最全面、最完整、权威性比较高 的一份 ML 书单,涵盖了最值得学习者、从业者、开发者认真研读的精品书目。这份指南适合多样背景的读者:从想要了解机器学习的普通人,到入门新手,再到高阶开发者和学术研究人员。因此,雷锋网对其进行编译整理,特来与大家分享。
友情提醒:该指南只考虑了英文市场的机器学习图书,适合大家作为国际市场高品质 ML 读物的参考。如周志华老师 《机器学习》等国内优秀著作并没有体现,请读者见谅。
Jason Brownlee:
我喜欢书,对于搞到的每一本机器学习书籍,我都要去读。
我认为,有好的参考资源,是对你心中机器学习谜题进行“解惑”的最快方式。阅读多本书,你就有了看待疑难问题的多种角度。
有许多原因促使人们想要机器学习书籍。因此,我采用了三种不同方式对机器学习书籍进行分类、排列,使读者们能按图索骥快速查找。比方说:
依据类别(难易):教材,科普等。
依据话题:Python,深度学习等
依据出版商:Packt,O’Reilly 等
所有书都包括了亚马逊、或京东链接,你可以点击链接了解更多,或是购买。
找到一个你最感兴趣的话题
浏览所选类别的书目
购书、借书、下载
从头读到尾
重复以上过程
把书摆在家里、办公室显眼的地方,跟你读过那本书是两码事。别瞎搞收藏。
这是面向普通大众的机器学习书目。 它们让你体会到机器学习和数据科学的优点和益处,但免去了理论和应用细节。 我还加入了一些个人非常喜欢的、偏“统计思维”的流行科普读物。
The Master Algorithm: How the Quest for the Ultimate Learning Machine Will Remake Our World
译本: 终极算法:机器学习和人工智能如何重塑世界
Predictive Analytics: The Power to Predict Who Will Click, Buy, Lie, or Die
译本: 大数据预测
The Signal and the Noise: Why So Many Predictions Fail–but Some Don't
Naked Statistics: Stripping the Dread from the Data
The Drunkard's Walk: How Randomness Rules Our Lives
该类别的首选是: The Signal and the Noise
  
 
与上述读物的乐观相比,提供了反面观点的是: Weapons of Math Destruction: How Big Data Increases Inequality and Threatens Democracy.
真正面向零基础初学者的机器学习书籍,基本上是一片空白。下面的这些书, 既包含了科普读物(见 1.1)中使用机器学习的益处,也包含了多见于入门书籍(见 1.3)的应用细节 ,当然,只是对这些细节的初步简单介绍。
Data Science for Business: What You Need to Know about Data Mining and Data-Analytic Thinking
Data Smart: Using Data Science to Transform Information into Insight
Data Mining: Practical Machine Learning Tools and Techniques (第四版)
译本: 数据挖掘:实用机器学习工具与技术(第三版)
Doing Data Science: Straight Talk from the Frontline
译本: 数据科学实战
该类别的首选是:Data Mining: Practical Machine Learning Tools and Techniques (数据挖掘:实用机器学习工具与技术)
  
 
下面是菜鸟入门的首选书单。相当于本科生级别的机器学习资源,适合基础学习者以及开发者新手。它们覆盖了广泛的机器学习话题, 倾向于“怎么做”,而非“为什么”或是探讨理论 。
Machine Learning for Hackers: Case Studies and Algorithms to Get You Started
译本: 机器学习:实用案例解析
Machine Learning in Action
译本: 机器学习实战
Programming Collective Intelligence: Building Smart Web 2.0 Applications
译本: 集体智慧编程
An Introduction to Statistical Learning: with Applications in R
译本: 统计学习导论:基于R应用
Applied Predictive Modeling
译本: 应用预测建模
该类别的首选是:An Introduction to Statistical Learning: with Applications in R (统计学习导论:基于R应用)
  
 
下面是机器学习顶尖教材的列表。 这些是研究生课程中会使用到的教科书,覆盖了一系列方法和背后的理论。
The Elements of Statistical Learning: Data Mining, Inference, and Prediction
译本: 统计学习基础:数据挖掘、推理与预测
Pattern Recognition and Machine Learning
Machine Learning: A Probabilistic Perspective
Learning From Data
Machine Learning
Machine Learning: The Art and Science of Algorithms that Make Sense of Data
译本: 机器学习
Foundations of Machine Learning
该类别的首选是: The Elements of Statistical Learning: Data Mining, Inference, and Prediction (统计学习基础:数据挖掘、推理与预测)
  
 
R 语言平台的应用机器学习书目。
R for Data Science: Import, Tidy, Transform, Visualize, and Model Data
Machine Learning with R
Machine Learning With R Cookbook – 110 Recipes for Building Powerful Predictive Models with R
国内名为: R语言机器学习参考手册(英文影印版)
R Machine Learning By Example
R Machine Learning Essentials
Mastering Machine Learning with R
An Introduction to Statistical Learning: with Applications in R
译本: 统计学习导论:基于R应用
Practical Data Science with R
译本: 数据科学:理论、方法与R语言实践
Applied Predictive Modeling
译本: 应用预测建模
R and Data Mining: Examples and Case Studies
译本: 计算机科学丛书:R语言与数据挖掘最佳实践和经典案例
该类别的首选是:Applied Predictive Modeling(应用预测建模)
  
 
使用 Python 或 SciPy 语言平台的应用机器学习书目。
Python Machine Learning
国内名为:Python 语言构建机器学习系统(英文影印版)
Data Science from Scratch: First Principles with Python
译本: 数据科学入门 (图灵程序设计丛书)
Hands-On Machine Learning with Scikit-Learn and TensorFlow: Concepts, Tools, and Techniques for Building Intelligent Systems
Introduction to Machine Learning with Python: A Guide for Data Scientists
Vital Introduction to Machine Learning with Python: Best Practices to Improve and Optimize Machine Learning Systems and Algorithms
Machine Learning in Python: Essential Techniques for Predictive Analysis
译本: Python机器学习:预测分析核心算法
Python Data Science Handbook: Essential Tools for Working with Data
Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
Real-World Machine Learning
该类别的首选是: Python Machine Learning.
  
 
深度学习书目。现在没有几本深度学习的好书,所以我只得用数量弥补质量。其中有许多专门针对 Tesnorflow 的教程。雷锋网注:该类推荐书目“全军覆没”——没有一本书有中文译本。这或许是因为深度学习领域理论框架尚不完善,缺乏影响力巨大的著作。
Deep Learning
Deep Learning: A Practitioner's Approach
Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms
Learning TensorFlow: A guide to building deep learning systems
Machine Learning with TensorFlow
TensorFlow Machine Learning Cookbook
Getting Started with TensorFlow
TensorFlow for Machine Intelligence: A Hands-On Introduction to Learning Algorithms
该类别毫无疑问的首选是:Deep Learning.
  
 
时间序列预测领域最值得一读的书目。在该技术的应用方面,目前 R 语言是霸主。
Time Series Analysis: Forecasting and Control
Practical Time Series Forecasting with R: A Hands-On Guide
Introduction to Time Series and Forecasting
Forecasting: principles and practice
该类别的入门首选是:Forecasting: principles and practice.
  
 
该类别的首选教材是:Time Series Analysis: Forecasting and Control.
  
 
有三个出版商在机器学习领域下了大力气,并且在认真出版图书。
它们是: O'Reilly, Manning 和 Packt。它们的焦点是应用书籍。雷锋网提醒,该榜单上的书籍质量参差不齐:从严谨设计、编排的图书到装订在一起的博文。
在它们的“数据”类别,O'Reilly 有超过 100 本图书,许多与机器学习相关。以下是最畅销的几本:
Programming Collective Intelligence: Building Smart Web 2.0 Applications
译本: 集体智慧编程
Introduction to Machine Learning with Python: A Guide for Data Scientists
Deep Learning: A Practitioner's Approach
Fundamentals of Deep Learning: Designing Next-Generation Machine Intelligence Algorithms
Data Science from Scratch: First Principles with Python
译本: 数据科学入门
Python Data Science Handbook: Essential Tools for Working with Data
这些书中,Programming Collective Intelligence: Building Smart Web 2.0 Applications (集体智慧编程) 或许是开创了 O'Reilly 该目录的书,一直很受欢迎。
  
 
Manning 的书偏实用,并且质量还行,虽然数量没 O’Reilly 和 Packt 那么多。
Machine Learning in Action
译本: 机器学习实战
Real-World Machine Learning
Introducing Data Science: Big Data, Machine Learning, and more, using Python tools
Practical Data Science with R
译本: 数据科学:理论、方法与R语言实践
Manning 目录里较突出的一本是 Machine Learning in Action(机器学习实战),这也许同样是因为,它是该出版社在机器学习和数据科学领域的第一本。
  
 
感觉上 Packt 全面拥抱了数据科学和机器学习领域的图书出版。他们有一大堆针对晦涩难懂机器学习库的书。在流行话题上面,比如 R 和 Python,也有不少书籍出版。雷锋网 (公众号:雷锋网) 注:可惜的是, Packt 似乎不重视汉语市场,旗下主要机器学习图书并没有中文译本。
以下是一些较流行的书目:
Machine Learning with R
Python Machine Learning
Practical Machine Learning
Machine Learning in Java
相关文章:
开发者入门必读:最值得看的十大机器学习公开课
2016十大 AI 演讲盘点,大牛们都发表了什么真知灼见?
雷锋网版权文章,未经授权禁止转载。详情见 转载须知 。
