摘要:文本特征項(xiàng)的選擇是文本挖掘和信息檢索的基礎(chǔ)和重要內(nèi)容。傳統(tǒng)的特征提取方法需要手工制作的特征,而手工設(shè)計(jì)有效的特征是一個(gè)漫長的過程,但針對(duì)新的應(yīng)用深度學(xué)習(xí)能夠快速地從訓(xùn)練數(shù)據(jù)中獲取新的有效特征表示。作為一種新的特征提取方法,深度學(xué)習(xí)在文本挖掘方面取得了一定的成果。深度學(xué)習(xí)與傳統(tǒng)方法的主要區(qū)別在于,深度學(xué)習(xí)能自動(dòng)地從大數(shù)據(jù)中學(xué)習(xí)特征而不是采用手工制作的特征,手工制作的特征主要依賴于設(shè)計(jì)者的先驗(yàn)知識(shí),很難充分利用大數(shù)據(jù);深度學(xué)習(xí)可以自動(dòng)地從大數(shù)據(jù)中學(xué)習(xí)特征表示,并包括數(shù)以萬計(jì)的參數(shù)。文中概述了用于文本特征提取的常用方法,并闡述了在文本特征提取及應(yīng)用中常用的深度學(xué)習(xí)方法,以及深度學(xué)習(xí)在特征提取中的應(yīng)用展望。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社