亚洲成色777777女色窝,777亚洲妇女,色吧亚洲日本,亚洲少妇视频

基于深度學(xué)習(xí)的文本特征提取研究綜述

摘要:文本特征項(xiàng)的選擇是文本挖掘和信息檢索的基礎(chǔ)和重要內(nèi)容。傳統(tǒng)的特征提取方法需要手工制作的特征,而手工設(shè)計(jì)有效的特征是一個(gè)漫長的過程,但針對(duì)新的應(yīng)用深度學(xué)習(xí)能夠快速地從訓(xùn)練數(shù)據(jù)中獲取新的有效特征表示。作為一種新的特征提取方法,深度學(xué)習(xí)在文本挖掘方面取得了一定的成果。深度學(xué)習(xí)與傳統(tǒng)方法的主要區(qū)別在于,深度學(xué)習(xí)能自動(dòng)地從大數(shù)據(jù)中學(xué)習(xí)特征而不是采用手工制作的特征,手工制作的特征主要依賴于設(shè)計(jì)者的先驗(yàn)知識(shí),很難充分利用大數(shù)據(jù);深度學(xué)習(xí)可以自動(dòng)地從大數(shù)據(jù)中學(xué)習(xí)特征表示,并包括數(shù)以萬計(jì)的參數(shù)。文中概述了用于文本特征提取的常用方法,并闡述了在文本特征提取及應(yīng)用中常用的深度學(xué)習(xí)方法,以及深度學(xué)習(xí)在特征提取中的應(yīng)用展望。

關(guān)鍵詞:
  • 深度學(xué)習(xí)  
  • 特征提取  
  • 文本特征  
  • 自然語言處理  
  • 文本挖掘  
作者:
張千; 王慶瑋; 張悅; 紀(jì)校鋒; 張宇翔; 祝赫; 趙昌志
單位:
中國石油大學(xué)(華東)計(jì)算機(jī)與通信工程學(xué)院; 山東青島266580
刊名:
計(jì)算機(jī)技術(shù)與發(fā)展

注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社

計(jì)算機(jī)技術(shù)與發(fā)展雜志緊跟學(xué)術(shù)前沿,緊貼讀者,國內(nèi)刊號(hào)為:61-1450/TP。堅(jiān)持指導(dǎo)性與實(shí)用性相結(jié)合的原則,創(chuàng)辦于1991年,雜志在全國同類期刊中發(fā)行數(shù)量名列前茅。