Machine Learning in Practice Crash Course
本文本想取名叫《DolphinDB研发副总监亲授,实用的机器学习课程限时免费!》,或者《今年这个行情,大家还是多做一手准备吧…》,或者《孤身一人,发表顶会paper》,想了想还是没启用这几个标题。另外我知道我的机器学习水平不算多强,只是想分享一些知识,还请大家轻喷。
这门课程是关于什么的?
网络上有大量优秀的机器学习课程。那么为什么要费心去学习这门课程呢?原因是本课程的侧重点与其他课程不同。具体来说,本课程是关于机器学习的基础知识;不同算法的优劣分析与见解;机器学习的最佳实践。另一方面,我们不会太关注机器学习的理论部分;相反,我们为对理论部分感兴趣的读者提供一些资源,例如其他课程或教科书章节的链接。
教科书
感兴趣的读者在每节课后, 可以阅读这几本教科书的相应章节:
-
[PC] Pattern Classification (2nd Edition), by Richard O. Duda, Peter E. Hart, and David G. Stork, Wiley-Interscience, 2000.
-
[PRML] Pattern Recognition and Machine Learning, by Christopher M. Bishop, Springer 2006.
-
[ESLII] The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd ed.), by T. Hastie, R. Tibshirani & J. Friedman, Springer 2009.
-
[MLAPP] Machine Learning: A Probabilistic Perspective, by Kevin Murphy, The MIT Press, 2012.
-
[DM] Data mining: concepts and techniques, by Jiawei Han, Jian Pei, and Micheline Kamber. Elsevier, 2011.
-
[DL]Deep learning, by Goodfellow Ian, Yoshua Bengio, and Aaron Courville. MIT press, 2016.
-
Supplementary readings will be available online.
课程安排
注意前八次课已经上完了,有录像,详细可以到B站上看
今年也会从头开始重新讲一遍课程。
Week | Time | Topic | Video | Reading | Lecturer |
---|---|---|---|---|---|
1 | 6/8 周六. | 课程综述与简介 | 英文 中文 | [PC] 1; [ESL] 1&2; [PRML] 1 | 胡津铭 |
2 | 待定. | 机器学习问题的定义 & 泛化 & 度量 | 英文 | Google Course | 胡津铭 |
3 | 待定. | Bayesian Decision Rule | 中文 | Domingos’s excellent paper; [PC] 2 | 胡津铭 |
4 | 待定. | Naive Bayes & Linear Regression Methods | None | [PC] 3 | 胡津铭 |
5 | 待定. | Bias-Variance & Overfitting | 中文 | [ESL] 4.5.1, 12; [PRML] 4.1.7, 7 | 胡津铭 |
6 | 待定. | Linear Classification Methods | 中文 | [ESL] 4.5.1, 12; [PRML] 4.1.7, 7 | 胡津铭 |
7 | 待定. | kNN & Decision Tree | 中文 | [PC] 5.1~5.5 | 胡津铭 |
8 | 待定. | Ensemble Methods: Bagging & Boosting | 中文 | 胡津铭 | |
9 | 待定 | Ensemble Methods: GBDT & XGBoost | 胡津铭 | ||
10 | 待定 | Neural Networks & Deep Learning | CS231N | 胡津铭 | |
11 | 待定 | Clustering & Dimension Reduction & Visualization | 胡津铭 胡津铭 | ||
12 | 待定 | Frequent Pattern & ML in Practice | 胡津铭 | ||
13 | 待定 | ML in Practice: Tools & Data & Feature Engineering | Google Course ML Advice | 胡津铭 |
之后学啥?
这里我们列了一些相对更进阶的课程。请记住,如果你想学得好,请完成一些作业。
Coursera Machine Learning: 吴恩达的课程. 比较适合从这里开始。
以下三选一:
-
Stanford CS229 Machine Learing: There are videos in Youtube and Bilibili (2018 version).
-
CMU 10-701 Intro to ML:There are videos in Youtube (2016 version).
-
实用机器学习 李沐大佬的课程
由于以上课程基本都没有公开的lab,或者是用matlab来写,所以作业部分,我推荐以前我们在浙大开的课程的作业。具体可以加本课程的qq群获取。
对于深度学习来说,我推荐以下课程:
Stanford CS231n:Deep learning for CV. 深度学习从这里开始.
Stanford CS224n:Deep learning for NLP.
Berkeley CS285:Deep Reinforcement Learning.
Transformer Unit:Transformer专题。
From Zero to Hero:Andrej Karpathy的课程
最后一句
欢迎加入我们的QQ群:973186098 群内会给出每次课程的腾讯会议地址,也可以讨论课程相关的问题和建议。如果你想加群,那么请认真学习课程(听课+完成作业)。当然,请大家友善交流。谢谢大家。