基于RNN的网络结构(LSTM,gru等)在nlp领域有着广泛应用,但RNN这样的网络结构使其固有长程梯度消失的问题,对于较长的句子,我们很难寄希望于将输入的序列转化为定长的向量(embedding)而保存所有有效的信息。 为了解决这一由长
2020-11-13