Machine Learning in Practice Crash Course

本文本想取名叫《DolphinDB研发副总监亲授,实用的机器学习课程限时免费!》,或者《今年这个行情,大家还是多做一手准备吧…》,或者《孤身一人,发表顶会paper》,想了想还是没启用这几个标题。另外我知道我的机器学习水平不算多强,只是想分享一些知识,还请大家轻喷。

课程暂时的主页 后面主页会迁移到 晴问算法

这门课程是关于什么的?

网络上有大量优秀的机器学习课程。那么为什么要费心去学习这门课程呢?原因是本课程的侧重点与其他课程不同。具体来说,本课程是关于机器学习的基础知识;不同算法的优劣分析与见解;机器学习的最佳实践。另一方面,我们不会太关注机器学习的理论部分;相反,我们为对理论部分感兴趣的读者提供一些资源,例如其他课程或教科书章节的链接。

教科书

感兴趣的读者在每节课后, 可以阅读这几本教科书的相应章节:

  1. [PC] Pattern Classification (2nd Edition), by Richard O. Duda, Peter E. Hart, and David G. Stork, Wiley-Interscience, 2000.

  2. [PRML] Pattern Recognition and Machine Learning, by Christopher M. Bishop, Springer 2006.

  3. [ESLII] The Elements of Statistical Learning: Data Mining, Inference, and Prediction (2nd ed.), by T. Hastie, R. Tibshirani & J. Friedman, Springer 2009.

  4. [MLAPP] Machine Learning: A Probabilistic Perspective, by Kevin Murphy, The MIT Press, 2012.

  5. [DM] Data mining: concepts and techniques, by Jiawei Han, Jian Pei, and Micheline Kamber. Elsevier, 2011.

  6. [DL]Deep learning, by Goodfellow Ian, Yoshua Bengio, and Aaron Courville. MIT press, 2016.

  7. Supplementary readings will be available online.

课程安排

注意前八次课已经上完了,有录像,详细可以到B站上看

今年也会从头开始重新讲一遍课程。

Week Time Topic Video Reading Lecturer
1 6/8 周六. 课程综述与简介 英文 中文 [PC] 1; [ESL] 1&2; [PRML] 1 胡津铭
2 待定. 机器学习问题的定义 & 泛化 & 度量 英文 Google Course 胡津铭
3 待定. Bayesian Decision Rule 中文 Domingos’s excellent paper; [PC] 2 胡津铭
4 待定. Naive Bayes & Linear Regression Methods None [PC] 3 胡津铭
5 待定. Bias-Variance & Overfitting 中文 [ESL] 4.5.1, 12; [PRML] 4.1.7, 7 胡津铭
6 待定. Linear Classification Methods 中文 [ESL] 4.5.1, 12; [PRML] 4.1.7, 7 胡津铭
7 待定. kNN & Decision Tree 中文 [PC] 5.1~5.5 胡津铭
8 待定. Ensemble Methods: Bagging & Boosting 中文 胡津铭
9 待定 Ensemble Methods: GBDT & XGBoost 胡津铭
10 待定 Neural Networks & Deep Learning CS231N 胡津铭
11 待定 Clustering & Dimension Reduction & Visualization 胡津铭 胡津铭
12 待定 Frequent Pattern & ML in Practice 胡津铭
13 待定 ML in Practice: Tools & Data & Feature Engineering Google Course ML Advice 胡津铭

之后学啥?

这里我们列了一些相对更进阶的课程。请记住,如果你想学得好,请完成一些作业。

Coursera Machine Learning: 吴恩达的课程. 比较适合从这里开始。

以下三选一:

  1. Stanford CS229 Machine Learing: There are videos in Youtube and Bilibili (2018 version).

  2. CMU 10-701 Intro to ML:There are videos in Youtube (2016 version).

  3. 实用机器学习 李沐大佬的课程

由于以上课程基本都没有公开的lab,或者是用matlab来写,所以作业部分,我推荐以前我们在浙大开的课程的作业。具体可以加本课程的qq群获取。

对于深度学习来说,我推荐以下课程:

Stanford CS231n:Deep learning for CV. 深度学习从这里开始.

Stanford CS224n:Deep learning for NLP.

Berkeley CS285:Deep Reinforcement Learning.

Transformer Unit:Transformer专题。

From Zero to Hero:Andrej Karpathy的课程

最后一句

欢迎加入我们的QQ群:973186098 群内会给出每次课程的腾讯会议地址,也可以讨论课程相关的问题和建议。如果你想加群,那么请认真学习课程(听课+完成作业)。当然,请大家友善交流。谢谢大家。

Avatar
Jinming Hu
Software Engineer

My research interests include machine learning, data mining, deep learning, computer vision, operating system, and database.