2019-下半年学习计划

Posted by Wenjing Liu on 2019-07-31

学无止境,学海无涯

专注深入的学习技术

机器学习基础

机器学习概念、应用与前沿

  • 内容
    机器学习技术和应用场景的介绍。常见算法,主流的应用构建方法。主流机器学习框架介绍,针对机器学习场景能够更好的应用相关工具进行分析与处理。
  • 项目
    • 鸢尾花分类实战
    • 分类预测实战
    • 回归预测实战

数学基础-数学概念

  • 内容
    机器学习中用到的数学基础由浅入深进行详细的梳理与讲解。主要涉及矩阵、导数、概率相关内容。
    概率论,矩阵和凸优化的介绍,相应算法设计和原理;凸优化理论,流优化手段SGD等优化方法。
  • 项目
    • 手写识别实战
    • 文本降维实战

特征工程 & 可视化

  • 内容
    Python数据预处理库,原始数据特征构建。特征选择,构建新特征,缺失值填充等特征工程方法学习。
  • 项目
    • Scikit-learn特征工程,网格搜索,超参数调优。
    • 泰坦尼克求生预测

机器学习算法学习

决策树与随机森林算法

  • 内容
    决策树算法的原理,度量指标和算法变种。掌握和了解GBDT,AdaBoost,随机森林等集成学习模型的原理和集成学习算法。
  • 项目
    • 鸢尾花分类实战
    • 金融反欺诈预测

分类算法

  • 内容
    • 了解和掌握KNN、SVM及朴素贝叶斯算法原理。
    • 熟悉集成学习对于分类算法的优化过程。掌握数据降维方法应用。
    • 熟悉分类算法调参关键参数
    • 掌握不同分类算法的过拟合、欠拟合情景与调优
    • 掌握集成学习调优
    • 了解不同算法的共性与个性
  • 项目
    • 手写图形数据降维与分类
    • 文本向量化实战
    • 文本分类实战

回归算法

  • 内容
    • 主流回归模型,线性回归,逻辑回归LR、Softmax及其变种和扩展算法。
    • 梯度下降,牛顿法等优化方法,逻辑回归最优化问题的求解,正则化方法。
  • 项目
    • 波士顿房价预测
    • 股票预测回归实战

大数据框架应用

聚类算法

  • 内容
    无监督学习模型,了解主流的聚类算法。了解不同相似度计算算法。深入了解不同的数据降维方法。掌握文本降维方法(LDA)。
    • 掌握 Kmeans 以及其衍生算法
    • 掌握 modelbased 聚类方法
    • 掌握无监督降维方法:PCA、ICA、字典学习
    • 掌握监督降维方法:LDA
    • 掌握文本降维方法:LDA
    • 深入理解聚类算法与分类算法的区别
    • 理解聚类算法的优缺点
  • 项目
    • 新闻分类实战
    • 文本降维实战

深度学习框架 TensorFlow

  • 内容
    通过掌握 Tensorflow 基本概念,计算模型 和原理,能够通过 Tensorflow 进行深度学习和模型构建与训练。学习掌握训练过程优化方法与问题优化。
    • 学习变量作用域与变量命名
    • 搭建多层神经网络并完成优化
    • 正则化优化神经网络
    • 梯度问题与解决方法
  • 项目
    • 图片分类实战
    • 贷款欺诈预测

大数据

  • 内容
    大数据主流分析框架为例, Spark 内核架构,计算模型和原理,了解分布式机器学习原理,能够处理和解决大规模数据分析预处理和模型训练。
    • 了解和掌握 Spark 框架上的机器学习库 MLlib 的算法原理,核心数据抽象,以及应 用 MLlib。
  • 项目
    • 电影推荐案例