LSTM是RNN的一種版本,它的特點是具有時間循環結構,可以很好地刻畫具有時空關聯的序列數據,包括時間序列數據(氣温、車流量、銷量等)、文本、事件(購物清單、個人行為)等等。可以這樣簡單地理解LSTM:它是一種基於神經網絡的自迴歸模型。
在自然語言處理領域,大家經常用LSTM對語言建模,即用LSTM提取文本的語義語法信息,然後和下游模型配合起來做具體的任務,比如分類、序列標註、文本匹配等等。