神译局是36氪旗下编译团队,关注科技、商业、职场、生活等领域,重点介绍国外的新技术、新观点、新风向。
编者按:为方便对数据科学(DATA SCIENCE)感兴趣的爱好者和实操者的学习,本文作者分享了 8 类关于数据科学的书籍,包括统计/概率论类、机器学习类、数据可视化与分析类、深度学习类、自然语言处理(NLP)类、计算机视觉类、人工智能类和工具/语言类。在分享书籍的同时,作者还提出以下忠告:在数据科学领域有多种成功的途径,而我们要选择的途径应该是足够简单,足以帮助我们快速上手的。
我们之所以在选择学习方法上不知所措,往往是因为我们接触的信息量太大了。与其花更多的时间思考如何获得研究数据科学的技能,不如根据实际需要,从分享的书中挑选一本,然后开始学习。关键是要始终如一地采取行动,坚持阅读。阅读的目的是,学习和发现隐藏于书中的真实思想。对数据科学感兴趣的朋友们,如果你还没选好学习材料,就请阅读作者推荐的这些顶级书籍吧。本文来自编译,希望对您有帮助。因篇幅原因,本篇文章分三部分刊出,此为第二部分:
相关阅读:学习数据科学的8类必读书籍(上)
4. 深度学习类书籍
(1)《基于Python的深度学习》(Deep Learning with Python)
作者:弗朗索瓦·乔莱特(Francois Chollet)
弗朗索瓦是 Keras(一个由Python编写的人工神经网络库,可以作为Tensorflow、Microsoft-CNTK 和 Theano 的高阶应用程序接口,进行深度学习模型的设计、调试/评估、应用和可视化)的创造者,还有比他更好的 Python 老师吗?我同时建议大家在 Twitter 上关注 Francois,因为我们可以从他身上学到很多东西。
图19. 《基于Python的深度学习》
(2)《使用Python进行深度学习》(TheDeep LearningWithPython)
这本书从一个实用的方法开始叙述,因此我们可以直接从该书中学习几个有用的技术。书中内容贴近现实,在阅读后你可以立即将其应用于行动。这绝对是一本深度学习的必读书目。
图20. 《使用Python进行深度学习》
(3)《深度强化学习基础——Python的理论与实践》(Foundations of Deep Reinforcement Learning — Theory and Practice in Python)
作者:劳拉·格雷塞尔,华龙径(Laura Graesser and Wah Loon Keng)
这是一本探索深度强化学习的高阶教科书。深度强化学习(Deep Reinforcement Learning),是利用人工智能学习解决顺序决策问题的方法。对于任何一个有机器学习方面的工作知识,并希望使用深度强化学习解决问题的人来说,这是一本写得很好的书。
图21. 《深度强化学习基础——Python的理论与实践》
(4)《深度学习图解——一个视觉的,交互式的人工智能指南》(Deep Learning Illustrated — A Visual, Interactive Guide to Artificial Intelligence)
作者:约翰·克罗恩,格兰特·贝莱维德,艾格拉·巴森斯(John Krohn, Grant Beyleveld, Aglae Bassens)
这是一本实用的参考书,可以帮助我们建立自己对深度学习算法的直觉。在这个可视化的、交互式的指南中,我们不仅能学到理论,还能学到相应的可在 Jupyter notebooks(基于网页的用于交互计算的应用程序。可被应用于全过程计算:开发、文档编写、运行代码和展示结果)上运行的实例。
图22. 《深度学习图解——一个视觉的,交互式的人工智能指南》
(5)《Python机器学习》(Python Machine Learning)
作者:奥雷林·杰隆(Aurelien Geron)
这本书的内容介于机器学习的中级和高级阶段之间。它能满足所有该领域的专家和非专家的个人需求。这本书首先详细地介绍了机器学习和深度学习,然后过渡到更高级的方法。它堪称是一本奇妙的书!
图23. 《Python机器学习》
5.自然语言处理(NLP)类书籍
(1)《使用Python进行自然语言处理》(Natural Language Processing with Python)
图24. 《使用Python进行自然语言处理》
作者:史蒂文·伯德,伊万·克莱因,爱德华·洛珀(Steven Bird,Ewan Klein,Edward Lope)
这又是一本坚持“边学边实践”原则的书。我们需要学习 Python 的相关概念,如果对这些概念一无所知,将无法使用 NLTK 库(Natural Language Toolkit)在 NLP 世界中航行。
(2)《统计自然语言处理基础》(Foundations of Statistical Natural Language Processing)
图25. 《统计自然语言处理基础》
作者:克里斯托弗·曼宁,辛里奇·舒茨(Christopher Manning,Hinrich Schutze)
这是一本内容非常全面的指南,它涵盖了 NLP 中广泛的子主题,比如文本分类、词性标注、概率句法分析等。作者在书中加入了严格的数学和语言学基础内容。这本书写得非常详细,读后能让我们牢记不忘。
(3)《语音和语言处理》(Speech and Language Processing)
图26. 《语音和语言处理》
作者:丹尼尔·朱拉夫斯基,詹姆斯·H·马丁(Daniel Jurafsky和James H. Martin)
这本书论述的重点是对自然语言的实际应用和科学评价。它是朱拉夫斯基和马丁写的一本深入的关于 NLP 和计算语言学的书。也是大师们以自己为素材而著的作品。
6.计算机视觉类书籍
(1)《计算机视觉:算法与应用》(Computer Vision: Algorithms and Applications)
图27. 《计算机视觉:算法与应用》
作者:理查德·塞利斯基(Richard Szeliski)
本书探索了各种常见的计算机视觉技术。这是一本内容全面的书,它采取了科学的方法来解决基本的计算机视觉问题。
(2)《用 Python 编程计算机视觉》(Programming Computer Vision with Python)
图28. 《用Python编程计算机视觉》
作者:扬·埃里克·索莱姆(Jan Erik Solem)
大家在深入阅读这本令人惊叹的书之前,请访问书中链接的网站,下载数据集、代码笔记本,并复制那里提到的 GitHub 存储库。这本书对计算机视觉世界的讲解,是在数据集、代码笔记本和 GitHub 存储库的基础上完成的。
(3)《计算机视觉:模型、学习和推理》(Computer Vision: Models, Learning, and Inference)
图29. 《计算机视觉:模型、学习和推理》
作者:西蒙·J·D·普林斯(Simon J.D. Prince)博士
这本书从零基础开始,向我们介绍了概率的概念。在此基础上,迅速加快进程,介绍了 70 种以上的算法并插入 350 张以上的图片作为补充说明。
7.人工智能类书籍
(1)《人工智能:一种现代方法》(Artificial Intelligence: A Modern Approach)
图30. 《人工智能:一种现代方法》
作者:斯图尔特·拉塞尔,彼得·诺维格(Stuart Russell,Peter Norvig)
是斯图尔特·拉塞尔和彼得·诺维格所写的书!绝对的宝藏书籍。此书是人工智能领域的重要著作。内容包括语音识别、自动驾驶汽车、机器翻译和计算机视觉等人工智能组件,它可以被视为关于人工智能的鼻祖级别的书。
(2)《人类的人工智能》(Artificial Intelligence for Humans)
图31. 《人类的人工智能》
作者:杰夫·希顿(Jeff Heaton)
人工智能背后的基础算法是什么?这本仅仅 222 页的书包含了大量的技术知识。它是关于 AI 背后技术(维度、距离度量、聚类、错误计算、爬山、用于求多元函数局部最小值的 Nelder Mead 算法、线性回归)系列书籍的第 1 卷。此书还附带了一个网站,里面包括了书中引用的例子和一个包含代码的 GitHub 库。
(3)《主算法》(The Master Algorithm)
图32. 《主算法》
作者:佩德罗·多明戈(Pedro Domingos)
如果我们想找一本关于人工智能技术方面的全面书籍,那这本不是我们要找的目标。但我们是否能找到一个单一的算法(或“主算法”),来挖掘出有关数据的所有知识?请阅读此书,加入佩德罗·多明戈斯的探索吧。
相关阅读:学习数据科学的8类必读书籍(下)
译者:甜汤