摘要:隨著大數(shù)據(jù)和網(wǎng)絡(luò)的不斷發(fā)展,網(wǎng)絡(luò)調(diào)查越來越廣泛,大部分網(wǎng)絡(luò)調(diào)查樣本屬于非概率樣本,難以采用傳統(tǒng)的抽樣推斷理論進(jìn)行推斷,如何解決網(wǎng)絡(luò)調(diào)查樣本的推斷問題是大數(shù)據(jù)背景下網(wǎng)絡(luò)調(diào)查發(fā)展的迫切需求。本文首次從建模的角度提出了解決該問題的基本思路:一是入樣概率的建模推斷,可以考慮構(gòu)建基于機(jī)器學(xué)習(xí)與變量選擇的傾向得分模型來估計(jì)入樣概率推斷總體;二是目標(biāo)變量的建模推斷,可以考慮直接對(duì)目標(biāo)變量建立參數(shù)、非參數(shù)或半?yún)?shù)超總體模型進(jìn)行估計(jì);三是入樣概率與目標(biāo)變量的雙重建模推斷,可以考慮進(jìn)行傾向得分模型與超總體模型的加權(quán)估計(jì)與混合推斷。最后,以基于廣義Boosted模型的入樣概率建模推斷為例演示了具體解決方法。
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社