Wenjing Liu

Homepage

卷积神经网络

Convolutional Neural Networks

Convolutional Neural Networks Computer vision Edge detection example More edge detection Padding Strided convolutions Convolutions over volumes One layer of a convolutional net A simple convolutio......

序列模型

Sequence Models

Recurrent Neural Networks Why sequence models Notation Recurrent neural network model Backpropagation through time Different types of rnns Language model and sequence generation Sampling novel seq......

机器学习

Machine Learning

中文总结 ...

结构化机器学习项目

Structuring Machine Learning Projects

Introduction to ML strategy Why ML Strategy? Orthogonalization Setting up your goal Single number evaluation metric Satisficing and optimizing metrics Train/dev/test distributions Size of dev an......

改善深层神经网络:超参数调试、正则化以及优化

Improving deep neural networks: hyperparameter tuning, regularization and optimization

Setting up your ML application Train/dev/test sets Bias/Variance Basic “recipe” for machine learning Regularizing your neural network Regularization Why regularization reduces overfitting Dropou......

神经网络和深度学习

Neural Networks and Deep Learning

Introduction to Deep Learning Welcome What is a Neural Network? Supervised Learning with Neural Networks Why is Deep Learning taking off? About this Course Basics of Neural Network Programming B......

自然语言处理,NLP

概念 自然语言处理是计算机处理人类语言的一门技术: 句法语义分析:对于给定的句子,进行分词、词性标记、命名实体识别和链接、句法分析、语义角色识别和多义词消歧。 信息抽取:从给定文本中抽取重要的信息,比如,时间、地点、人物、事件、原因、结果、数字、日期、货币、专有名词等等。通俗说来,就是要了解谁在什么时候、什么原因、对谁、做了什么事、有什么结果。涉及到实体识别、时间抽取、因果关系抽取等关键技......

主成分分析,PCA

概念 多重共线性 multi-collinearity 多重共线性是指线性回归模型中的解释变量之间由于存在精确相关关系或高度相关关系而使模型估计失真或难以估计准确。 PCA 通过线性变换将原始数据变换为一组各维度线性无关的表示,可用于提取数据的主要特征分量 降维 就是找到k个超平面,把原n维空间的数据投影到这k个超平面上,使原n维数据降为k维。 PCA核心思想 降维后的数据尽可能分散 PC......

K均值聚类,K Means Clustering

概念 K均值聚类是一种无监督学习算法,尝试在数据中将类似的群集组合在一起。 典型的聚类问题是什么样的呢? 集群类似文档 基于特征的客户群 市场细分 识别类似的物理组 算法过程 选择集群的个数 ‘K’ 随机将每个点分配给一个集群 直到集群停止改变,重复以下: 对于每个群集,通过获取群集中点的平均向量来计算群集质心 将每个数据点分配最接近的群集质心 K的选择 没有简单的......

支持向量机 SVM

概念 将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面,分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。 基本模型是定义在特征空间上的间隔最大的线性分类器 SVM的的学习算法就是求解凸二次规划的最优化算法。 数学理论 评估指标 ScikitLearn 中的线性回归用法 12......