潜在狄利克雷分配

2021-07-282021-08-21统计学习方法14 分钟读完 (大约2060个字)

1.狄利克雷分布的概率密度函数为\[p ( \theta | \alpha ) = \frac { \Gamma ( \sum _ { i = 1 } ^ { k } \alpha _ { i } ) } { \prod _ { i = 1 } ^ { k } \Gamma ( \alpha _ { i } ) } \prod _ { i = 1 } ^ { k } \theta _ { i } ^ { \alpha _ { i } - 1 }\]

其中 \[\sum _ { i = 1 } ^ { k } \theta _ { i } = 1 , \theta _ { i } \geq 0 , \alpha = ( \alpha _ { 1 } , \alpha _ { 2 } , \cdots , \alpha _ { k } ) , \alpha _ { i } > 0 , i = 1,2 , \cdots , \] 狄利克雷分布是多项分布的共轭先验。

笔记, LDA

马尔可夫链蒙特卡罗法

2021-07-272021-08-21统计学习方法14 分钟读完 (大约2077个字)

蒙特卡罗法是通过基于概率模型的抽样进行数值近似计算的方法，蒙特卡罗法可以用于概率分布的抽样、概率分布数学期望的估计、定积分的近似计算。

笔记, MCMC

概率潜在语义分析

2021-07-262021-08-21统计学习方法15 分钟读完 (大约2250个字)

1.概率潜在语义分析是利用概率生成模型对文本集合进行话题分析的方法。概率潜在语义分析受潜在语义分析的启发提出两者可以通过矩阵分解关联起来。

给定一个文本集合，通过概率潜在语义分析，可以得到各个文本生成话题的条件概率分布，以及各个话题生成单词的条件概率分布。

概率潜在语义分析的模型有生成模型，以及等价的共现模型。其学习策略是观测数据的极大似然估计，其学习算法是EM算法。

笔记, PLSA

潜在语义分析

2021-07-252021-08-21统计学习方法25 分钟读完 (大约3766个字)

1.单词向量空间模型通过单词的向量表示文本的语义内容。以单词-文本矩阵$X$为输入，其中每一行对应一个单词，每一列对应一个文本，每一个元素表示单词在文本中的频数或权值（如TF-IDF） \[X = \left[ \begin{array} { c c c c } { x _ { 11 } } & { x _ { 12 } } & { \cdots } & { x _ { 1 n } } \\ { x _ { 21 } } & { x _ { 22 } } & { \cdots } & { x _ { 2 n } } \\ { \vdots } & { \vdots } & { } & { \vdots } \\ { x _ { m 1 } } & { x _ { m 2 } } & { \cdots } & { x _ { m n } } \end{array} \right]\] 单词向量空间模型认为，这个矩阵的每一列向量是单词向量，表示一个文本，两个单词向量的内积或标准化内积表示文本之间的语义相似度。

笔记, LSA

主成分分析

2021-07-242021-08-21统计学习方法12 分钟读完 (大约1733个字)

1.假设$x$为$m$ 维随机变量，其均值为$\mu$，协方差矩阵为$\Sigma$。

考虑由$m$维随机变量$x$到$m$维随机变量$y$的线性变换 \[y _ { i } = \alpha _ { i } ^ { T } x = \sum _ { k = 1 } ^ { m } \alpha _ { k i } x _ { k } , \quad i = 1,2 , \cdots , m\]

笔记, PCA

奇异值分解

2021-07-232021-08-21统计学习方法11 分钟读完 (大约1661个字)

1.矩阵的奇异值分解是指将$m \times n$实矩阵$A$表示为以下三个实矩阵乘积形式的运算 \[A = U \Sigma V ^ { T }\]

笔记, 奇异值分解

隐马尔可夫模型

2021-07-222021-08-16统计学习方法18 分钟读完 (大约2675个字)

1．隐马尔可夫模型是关于时序的概率模型，描述由一个隐藏的马尔可夫链随机生成不可观测的状态的序列，再由各个状态随机生成一个观测而产生观测的序列的过程。

笔记, HMM算法

条件随机场

2021-07-212021-08-16统计学习方法14 分钟读完 (大约2105个字)

1．概率无向图模型是由无向图表示的联合概率分布。无向图上的结点之间的连接关系表示了联合分布的随机变量集合之间的条件独立性，即马尔可夫性。因此，概率无向图模型也称为马尔可夫随机场。

笔记, CRF算法

EM算法及其推广

2021-07-202021-08-16统计学习方法16 分钟读完 (大约2345个字)

Expectation Maximization algorithm

Maximum likehood function

likehood & maximum likehood

笔记, EM算法

RNN原理

2021-06-172021-06-18自然语言处理33 分钟读完 (大约4908个字)

Recurrent Neural Network，循环神经网络

`SimpleRNN`

SimpleRNN其结构如下图所示：
- 输入为一个向量序列$\{x_0,x_1,x_2...x_n\}$ ；
- 在时间步 $t$，序列的元素 $x_t$ 和上一时间步的输出 $h_{t-1} $一起，经过RNN单元处理，产生输出 $h_t$; \[h_t=ϕ(Wx_t+Uh_{t−1})\] \[y_t=Vh_t\]
- $h_t$ 为隐藏层状态，携带了序列截止时间步 $t$ 的信息；$y_t$ 为时间步 $t$ 的输出；$h_t$ 继续作为下一时间步的输入
- 整个序列被处理完，最终的输出 $y_n$ 即为RNN的输出；根据情况，也可返回所有的输出序列 $\{y_0,y_1,y_2...y_n\}$
- 序列的每个元素是经过同一个RNN处理，因此待学习的参数只有一组：$W,U,V$

笔记, RNN

潜在狄利克雷分配

马尔可夫链蒙特卡罗法

概率潜在语义分析

潜在语义分析

主成分分析

奇异值分解

隐马尔可夫模型

条件随机场

EM算法及其推广

Expectation Maximization algorithm

Maximum likehood function

RNN原理

`SimpleRNN`

广告

分类

最新文章