学无止境,学海无涯
专注深入的学习技术
机器学习基础
机器学习概念、应用与前沿
- 内容
机器学习技术和应用场景的介绍。常见算法,主流的应用构建方法。主流机器学习框架介绍,针对机器学习场景能够更好的应用相关工具进行分析与处理。 - 项目
- 鸢尾花分类实战
- 分类预测实战
- 回归预测实战
数学基础-数学概念
- 内容
机器学习中用到的数学基础由浅入深进行详细的梳理与讲解。主要涉及矩阵、导数、概率相关内容。
概率论,矩阵和凸优化的介绍,相应算法设计和原理;凸优化理论,流优化手段SGD等优化方法。 - 项目
- 手写识别实战
- 文本降维实战
特征工程 & 可视化
- 内容
Python数据预处理库,原始数据特征构建。特征选择,构建新特征,缺失值填充等特征工程方法学习。 - 项目
- Scikit-learn特征工程,网格搜索,超参数调优。
- 泰坦尼克求生预测
机器学习算法学习
决策树与随机森林算法
- 内容
决策树算法的原理,度量指标和算法变种。掌握和了解GBDT,AdaBoost,随机森林等集成学习模型的原理和集成学习算法。 - 项目
- 鸢尾花分类实战
- 金融反欺诈预测
分类算法
- 内容
- 了解和掌握KNN、SVM及朴素贝叶斯算法原理。
- 熟悉集成学习对于分类算法的优化过程。掌握数据降维方法应用。
- 熟悉分类算法调参关键参数
- 掌握不同分类算法的过拟合、欠拟合情景与调优
- 掌握集成学习调优
- 了解不同算法的共性与个性
- 项目
- 手写图形数据降维与分类
- 文本向量化实战
- 文本分类实战
回归算法
- 内容
- 主流回归模型,线性回归,逻辑回归LR、Softmax及其变种和扩展算法。
- 梯度下降,牛顿法等优化方法,逻辑回归最优化问题的求解,正则化方法。
- 项目
- 波士顿房价预测
- 股票预测回归实战
大数据框架应用
聚类算法
- 内容
无监督学习模型,了解主流的聚类算法。了解不同相似度计算算法。深入了解不同的数据降维方法。掌握文本降维方法(LDA)。- 掌握 Kmeans 以及其衍生算法
- 掌握 modelbased 聚类方法
- 掌握无监督降维方法:PCA、ICA、字典学习
- 掌握监督降维方法:LDA
- 掌握文本降维方法:LDA
- 深入理解聚类算法与分类算法的区别
- 理解聚类算法的优缺点
- 项目
- 新闻分类实战
- 文本降维实战
深度学习框架 TensorFlow
- 内容
通过掌握 Tensorflow 基本概念,计算模型 和原理,能够通过 Tensorflow 进行深度学习和模型构建与训练。学习掌握训练过程优化方法与问题优化。- 学习变量作用域与变量命名
- 搭建多层神经网络并完成优化
- 正则化优化神经网络
- 梯度问题与解决方法
- 项目
- 图片分类实战
- 贷款欺诈预测
大数据
- 内容
大数据主流分析框架为例, Spark 内核架构,计算模型和原理,了解分布式机器学习原理,能够处理和解决大规模数据分析预处理和模型训练。- 了解和掌握 Spark 框架上的机器学习库 MLlib 的算法原理,核心数据抽象,以及应 用 MLlib。
- 项目
- 电影推荐案例