EDA
Программирование
pandas DataFramesparse matrices
Теория
1) Обзор методов классификации по содержанию этой книжки.
2) Практика Linear classification - смотри topic4 тут.
3) Подробнее про linear и logistic regression тут.
4) Bagging, Random Forest, Feature Importance, Gradient boosting - 3 неделя mlcourse.
Какие бывают распределения, давно хочу расписать, скажем, в виде плаката: тут и тут