摘要:以圖文要素構(gòu)成的word2003版面存儲(chǔ)文檔為研究對(duì)象,提出了一種利用信息熵評(píng)估版面文檔復(fù)雜度的方法.首先,從圖像和文本存儲(chǔ)特點(diǎn)出發(fā),提出一種利用文件字節(jié)流信息熵度量版面全局復(fù)雜度的方案;其次,將文件視為信源,每個(gè)字節(jié)視為信源符號(hào),以二進(jìn)制方式讀取文件,然后根據(jù)字節(jié)相關(guān)性,采用N次擴(kuò)展信源計(jì)算信息熵;最后,通過實(shí)驗(yàn)驗(yàn)證表明,本文方法切實(shí)可行,給出的版面全局復(fù)雜度定量描述不僅能很好地符合人的視覺直觀感受,而且能夠?yàn)榘婷鏀?shù)據(jù)可壓縮性提供依據(jù).
注:因版權(quán)方要求,不能公開全文,如需全文,請(qǐng)咨詢雜志社