Datawhale干货
作者:Datawhale开源项目团队
作为机器学习的入门经典教材,周志华老师的《机器学习》,自2016年1月底出版以来,首印5000册一周售罄,并在8个月内重印9次。先后登上了亚马逊,京东,当当网等的计算机类畅销书榜首,身边学习机器学习的小伙伴基本上是人手一本。
当初在学习周志华《机器学习》教材的过程中,遇到了公式推导的难题,苦于没有人答疑解惑,于是发起了Datawhale南瓜书项目,希望再也没有难推的公式,深入理解机器学习。
2020年,Datawhale开源项目“南瓜书”发布,受到全网转发。3年后,“南瓜书”完整版第2版完结撒花,重磅出版。南瓜书是经典“西瓜书”《机器学习》公式完全解析指南,第1版受到了读者的一致好评,并得到了俞勇、王斌、李沐、程明明、陈光(博主@爱可可-爱生活)、徐亦达6位人工智能领域大咖亲笔推荐,截止此时star 数已经突破2万!
相较于第1版,除了篇幅上从168页扩充到308页,《机器学习公式详解(第2版)》呈现出4大亮点:
1. 对“西瓜书”中除了公式以外的重难点内容加以解析;
2. 以过来人的视角给出学习建议;
3. 对比较难理解的公式和重点内容扩充具体的例子说明;
4. 对跳步过大的公式补充具体的推导细节。
一、从开源到出版
从李沐开源的《动手学深度学习》,邱锡鹏的《神经网络与深度学习》,再到Datawhale开源的《南瓜书》出版,知识回归大众,让大众有机会和行业精英一样为社会做出贡献,是南瓜书项目的探索性意义。
南瓜书是Datawhale组织成员以及读者们一起相互支持的结果,从开源到出版,带来的收入其实不高,但让开源贡献者被大众认可是促使开源良性循环的重要一环,会促使国内的开源氛围变好,让更多人受益。
确切地说,这是一本“伴侣书”
类似于咖啡伴侣一样,《机器学习公式详解》系列是周志华教授的“西瓜书”——《机器学习》的伴侣书,它也有一个可爱的名字 ——“南瓜书”。“南瓜书”第1版对“西瓜书”中的公式进行了解析,并补充了必要的推导过程及先验知识。
“南瓜书”第2版是Datawhale成员的自学笔记,更是第1版的升级版。本书扩充了对“西瓜书”解读的覆盖面,对“西瓜书”中320个重难点公式做了详细解析和推导(重难点公式覆盖率达99%,第1版重难点公式数量为250),旨在全面解决机器学习中的数学难题。
这是一本通过开源方式多人协作写成的书
这种多人分工合作、互相校验、开放监督的方式,既保证了书的质量,也保证了写作的效率. 在我看来,这是一种站在读者角度且非常先进的生产方式,容易给读者带来很好的体验.
这是一本完全根据学习经历编著而成的书
也就是说,这本书完全从读者学习的角度出发,分享编著者在学习中遇到的“坑”以及跳过这个“坑”的方法,这对初学者来说是非常宝贵的经验,也特别能够引起他们的共鸣. 其实,每个人在学习一门新的课程时,都会有自己独特的经验和方法. 这种经验和方法的共享非常难能可贵. 在这里,理解公式便是编著者认为了解机器学习原理的最好方法,其实对于这一点我也深表赞同,因为在学习中我就是那种喜欢推导公式的典型代表,只有公式推导成功,才觉得对知识的原理理解得更深刻,否则总是觉得心里不踏实.
二、感谢老师们的鼓励和支持
感谢俞勇、李沐、程明明、爱可可、徐亦达、王斌 6位人工智能领域大咖的亲笔推荐。
这是一本与众不同的书。首先,这是一本“伴侣书”。类似于咖啡伴侣一样,这本书是周志华教授的“西瓜书”——《机器学习》的伴侣书,它也有一个可爱的名字——“南瓜书”。其次,这是一本通过开源方式多人协作写成的书。这种多人分工合作、互相校验、开放监督的方式,既保证了书的质量,也保证了写作的效率。最后,这是一本完全根据学习经历编著而成的书。它完全从读者学习的角度出发,分享编著者在学习中遇到的“坑”以及跳过这个“坑”的方法,这对初学者来说是非常宝贵的经验,也特别能够引起他们的共鸣。
——王斌 小米AI 实验室主任、NLP 首席科学家
面对一本有很多数学难题的教材,初学者最渴望的是有一位“全能助教”,能帮助详细解析,步进推导,以便更好地消化教材。由开源组织Datawhale 发起编写的“南瓜书”集众人的智慧、开源社区的力量,为广大机器学习初学者带来了福音,给周志华教授的畅销书“西瓜书”配了一个“全能助教”。愿这两本书为所有人工智能领域及行业内求学者、从业者启智增慧,创造未来。
——俞勇 上海交通大学特聘教授
上海交通大学ACM 班创始人,伯禹教育创始人
推导一遍所有公式是非常好的学习方法,很高兴看到“南瓜书”能专注于此. 它是学习“西瓜书”不可缺少的辅助材料。
——李沐 AWS 资深首席科学家
《动手学深度学习》作者
“南瓜书”是Datawhale 开源团队产出优质内容的一种全新探索。这本书以开源项目的形式,帮助读者推导重要的公式,并对知识难点进行深入探讨。这种新的学习思路和撰写模式,自打开始那一刻,就紧紧抓住读者的需求和痛点,使得这本书成为非常值得推荐的好书。和这本书同样值得推荐的,还有Datawhale 的开源精神和实践精神。
——程明明 南开大学计算机系主任,开放共享科研记录行动倡议者
这本书是读透“西瓜书”的好“伴侣”。尽管这本书并不适合所有人,但真正需要它的人会觉得它特别有用。它就像一位学霸同桌,可以在你啃“西瓜书”一筹莫展的时候为你“雪中送炭”。对很多人来说,数学公式是一种很可怕的存在,但是学问之美往往就在“最险远处”,披荆斩棘之后方能品出其真滋味。如果想要理解机器学习,而不止步于了解和应用,这本书将是你的好“同桌”——伴你思考,同享“知其所以然”的乐趣。
——陈光 北京邮电大学副教授
知名博主@ 爱可可- 爱生活
对机器学习初学者来讲,“南瓜书”补充且拓展了数学方面的基本知识,是“西瓜书”的佐读良品。
——徐亦达 悉尼科技大学副教授,机器学习开源讲义作者
三、给读者的学习建议
首先,这本“南瓜书”要和“西瓜书”配套阅读
南瓜书的最佳使用方法是以西瓜书为主线,如果在阅读“西瓜书”时对公式疑惑或对概念理解不畅,可以通过“南瓜书”快速定位公式并进行推导,从而深入理解. 从这个意义来说,“南瓜书”可以看成是“西瓜书”的公式字典.超纲的数学知识以附录和参考文献的形式给出;
配套视频:https://b23.tv/jwwRtw6
其次,阅读时克服对公式的排斥或者畏惧心理
公式是通过符号对原理本质的高度概括,是一种精简而美丽的数学语言. 推几个公式之后,相信读者会从中感觉到没有体验过的乐趣.
最后,需要静下心来仔细研读
看上去也有点儿枯燥,阅读时读者还是要事先做好克服困难的准备. 有时,即使编著者给出了推导过程,读者也不一定一眼就能理解,这就需要自己静下心来仔细研读. 只有这样,才有可能成为具有机器学习思维而不只是会用机器学习工具的人.
目前是首批发行,5 折优惠购买地址:
南瓜书(第2版)+西瓜书套装:https://item.jd.com/13750727.html
南瓜书(第2版) 单本:
https://item.jd.com/10027464721549.html