RNN原理
Recurrent Neural Network
,循环神经网络
SimpleRNN
SimpleRNN
其结构如下图所示:- 输入为一个向量序列\(\{x_0,x_1,x_2...x_n\}\) ;
- 在时间步 \(t\),序列的元素 \(x_t\) 和上一时间步的输出 $h_{t-1} $一起,经过
RNN
单元处理,产生输出 \(h_t\); \[h_t=ϕ(Wx_t+Uh_{t−1})\] \[y_t=Vh_t\] - \(h_t\) 为隐藏层状态,携带了序列截止时间步 \(t\) 的信息;\(y_t\) 为时间步 \(t\) 的输出;\(h_t\) 继续作为下一时间步的输入
- 整个序列被处理完,最终的输出 \(y_n\) 即为
RNN
的输出;根据情况,也可返回所有的输出序列 \(\{y_0,y_1,y_2...y_n\}\) - 序列的每个元素是经过同一个
RNN
处理,因此待学习的参数只有一组:\(W,U,V\)