摘要:隨著移動終端設(shè)備的蓬勃發(fā)展,移動應(yīng)用種類的日益增加,移動應(yīng)用類型識別成為網(wǎng)絡(luò)管理、市場營銷以及網(wǎng)絡(luò)攻擊防范等領(lǐng)域中一種具有重要意義的技術(shù)手段。在實(shí)際應(yīng)用中,幾乎所有的移動應(yīng)用程序都采用SSL/TLS(Secure Sockets Layer/Transport Layer Security)協(xié)議進(jìn)行數(shù)據(jù)加密,因此使移動應(yīng)用類型識別工作更具挑戰(zhàn)。提出了一種新穎的加密環(huán)境下Android移動應(yīng)用類型識別技術(shù)。該技術(shù)利用信息熵對DBSCAN(Density-Based Spatial Clustering of Applications with Noise)聚類算法生成的聚類簇進(jìn)行純度分析,通過實(shí)驗(yàn)合理設(shè)置熵閾值對數(shù)據(jù)集中的干擾樣本進(jìn)行過濾,最后利用隨機(jī)森林算法對過濾后的數(shù)據(jù)集進(jìn)行建模,實(shí)現(xiàn)了移動應(yīng)用程序類型的識別。由于僅通過捕捉加密數(shù)據(jù)流傳輸模式實(shí)現(xiàn)應(yīng)用識別,對于加密和非加密流量均有效。實(shí)驗(yàn)表明所述方法緩解了干擾樣本的誤判問題,有效地提高了數(shù)據(jù)集利用率,具有更高的識別準(zhǔn)確率和召回率。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社