時(shí)間:2023-06-26 16:15:47
導(dǎo)語:在信息分類標(biāo)準(zhǔn)的撰寫旅程中,學(xué)習(xí)并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內(nèi)容能夠啟發(fā)您的創(chuàng)作靈感,引領(lǐng)您探索更多的創(chuàng)作可能。
【關(guān)鍵詞】XBRL 通用分類標(biāo)準(zhǔn) 完備性 效率性
一、引言
XBRL自1998年由美國(guó)注冊(cè)會(huì)計(jì)師Hoffman提出思想框架以來,XBRL在國(guó)際上已經(jīng)獲得了迅速發(fā)展,多個(gè)國(guó)家、機(jī)構(gòu)及組織已經(jīng)實(shí)施或正在推行XBRL的應(yīng)用。分類標(biāo)準(zhǔn)的制定對(duì)于 XBRL 財(cái)務(wù)報(bào)告的披露起著規(guī)范與模板的作用,其質(zhì)量直接影響著財(cái)務(wù)報(bào)告信息質(zhì)量。關(guān)于分類標(biāo)準(zhǔn)中標(biāo)準(zhǔn)元素是否能滿足上市公司披露需求和是否能有效率地表達(dá)財(cái)務(wù)信息一直是分類標(biāo)準(zhǔn)制定者、XBRL財(cái)務(wù)報(bào)告報(bào)送主體、信息披露監(jiān)管者、信息披露中介乃至投資者都關(guān)注的問題,同時(shí)也是學(xué)術(shù)界關(guān)注的問題。基于上述的問題,本文主要從完備性和效率性方面對(duì)分類標(biāo)準(zhǔn)進(jìn)行研究。
二、樣本選擇
本文采取了抽樣研究的方法,抽樣的總體是2011年上交所所有的A股上市公司。按照10%的抽樣比例,以10為步長(zhǎng)進(jìn)行系統(tǒng)抽樣。依據(jù)中國(guó)證監(jiān)會(huì)《上市公司行業(yè)分類指引2001》所列的13個(gè)行業(yè)門類,剔除金融類企業(yè),最終得到本文的93個(gè)樣本。本文選取貨幣型財(cái)務(wù)信息,是因?yàn)樨泿判拓?cái)務(wù)信息為財(cái)務(wù)報(bào)告最基本、最核心的信息,規(guī)范易于企業(yè)填報(bào)而較少出現(xiàn)歧義。并且,大多數(shù)企業(yè)按照統(tǒng)一規(guī)范表格填制財(cái)務(wù)報(bào)表正文,對(duì)于正文內(nèi)容研究意義不大,因此本文僅選取財(cái)務(wù)報(bào)表附注中貨幣型財(cái)務(wù)信息作為研究對(duì)象。
通用分類標(biāo)準(zhǔn)采用財(cái)政部2010年的《企業(yè)會(huì)計(jì)準(zhǔn)則通用分類標(biāo)準(zhǔn)》。該標(biāo)準(zhǔn)共計(jì)元素2984個(gè),分為13種元素類型。在XBRL報(bào)表中表達(dá)貨幣型財(cái)務(wù)信息的元素是由貨幣型和Member型元素組成。在1464個(gè)貨幣類型元素和301個(gè)Member型元素中,剔除非報(bào)表附注元素、金融相關(guān)行業(yè)元素及首次執(zhí)行會(huì)計(jì)準(zhǔn)則企業(yè)元素。其余元素中,剔除單獨(dú)列示在財(cái)務(wù)報(bào)表中的元素,得到本文研究對(duì)象元素,即非金融行業(yè)的附注貨幣型元素903個(gè),Member型元素300個(gè)。
三、研究方法
本文采用人工翻閱公司年報(bào),提取貨幣型財(cái)務(wù)信息并與分類標(biāo)準(zhǔn)元素逐一匹配的方法。本文收集了這93家樣本公司2011年財(cái)務(wù)報(bào)告附注中的84個(gè)報(bào)告子項(xiàng)目的披露的貨幣型財(cái)務(wù)信息,根據(jù)財(cái)政部2010年的XBRL通用分類標(biāo)準(zhǔn)對(duì)具體披露內(nèi)容進(jìn)行判斷匹配,匹配成功記為1分值。
四、研究結(jié)果
(一)效率性
分類標(biāo)準(zhǔn)的效率性即制定的元素冗余最小,是指分類標(biāo)準(zhǔn)應(yīng)該在盡量滿足企業(yè)對(duì)于財(cái)務(wù)信息披露需求的前提下,減少分類標(biāo)準(zhǔn)中的低使用率元素和關(guān)系(冗余元素),提高元素使用率。
研究結(jié)果表明,企業(yè)使用通用分類表中元素總數(shù)為1057個(gè),其中Member型元素246個(gè),占分類標(biāo)準(zhǔn)中元素的82%;貨幣型元素811個(gè),占分類標(biāo)準(zhǔn)中的89.81%。通用分類標(biāo)準(zhǔn)元素制定在效率性方面較好,整體使用率為87.86%。
(二)完備性
分類標(biāo)準(zhǔn)的完備性是指標(biāo)準(zhǔn)體系中所含元素應(yīng)盡量全面,能覆蓋企業(yè)對(duì)于財(cái)務(wù)信息披露的所有需求。完備性不足體現(xiàn)在企業(yè)報(bào)表中披露的財(cái)務(wù)信息無法在分類標(biāo)準(zhǔn)中找到對(duì)應(yīng)的元素,即分類標(biāo)準(zhǔn)中制定的元素存在不足。
企業(yè)因?qū)嶋H需要未能在通用分類標(biāo)準(zhǔn)中找到對(duì)應(yīng)元素而進(jìn)行元素?cái)U(kuò)展,共擴(kuò)展標(biāo)準(zhǔn)未定義元素1145個(gè)。整體擴(kuò)展率(擴(kuò)展率=擴(kuò)展元素/總元素集合)為48.76%,其中Member型元素?cái)U(kuò)展率為54.55%,貨幣型元素?cái)U(kuò)展率為46.50%。結(jié)果表明,通用分類標(biāo)準(zhǔn)的完備性方面還有很大的改善空間。
五、結(jié)論
通過實(shí)證研究方法,從通用分類標(biāo)準(zhǔn)元素完備性與效率性兩方面,探究通用分類標(biāo)準(zhǔn)是否能滿足企業(yè)信息披露需求。整體而言,現(xiàn)有通用分類標(biāo)準(zhǔn)元素制定效果在效率性方面較好,但在完備性方面較欠缺,存在本文提到的元素冗余與元素不足的問題。一方面,超過十分之一的元素從未被采用,另一方面,企業(yè)需要外擴(kuò)展更多的通用分類標(biāo)準(zhǔn)未定義元素來滿足自身信息披露的需求。通用分類表中在完善過程中應(yīng)補(bǔ)充不足的元素以提高完備性,同時(shí)應(yīng)剔除冗余元素從而提高效率性,更好地滿足企業(yè)信息披露的需求。
參考文獻(xiàn)
[1]張?zhí)煳?網(wǎng)絡(luò)財(cái)務(wù)報(bào)告:XBRL 標(biāo)準(zhǔn)的理論基礎(chǔ)研究[J].會(huì)計(jì)研究,2006(9):56-63.
[2]Chakraborty, Vasarhelyi. Automating the Process of Taxonomy Creation and Comparison of Taxonomy Structures .Working paper,2010,October .
[關(guān)鍵詞]優(yōu)化 信息分類體系 網(wǎng)站
[分類號(hào)]G257 C931.6
1 引 言
好的網(wǎng)站信息分類體系對(duì)用戶、設(shè)計(jì)者、管理者和維護(hù)者都有利。由于網(wǎng)站信息分類體系往往有不一致、冗余等特點(diǎn),因此需要調(diào)整、優(yōu)化網(wǎng)站信息分類體系。優(yōu)化網(wǎng)站信息分類體系時(shí),方法是關(guān)鍵,但目前對(duì)網(wǎng)站信息分類體系優(yōu)化方法的研究還很少。
網(wǎng)站信息分類體系優(yōu)化是對(duì)網(wǎng)站現(xiàn)有信息分類體系進(jìn)行調(diào)整的過程。優(yōu)化網(wǎng)站信息分類體系時(shí),涉及到聚類標(biāo)準(zhǔn)、大類設(shè)置、分類體系展開層次、類目種類、類目名稱、類目的均衡性和規(guī)律性、交叉關(guān)系的處理、類目排列、類目的注釋和說明、用戶的界面設(shè)計(jì)等內(nèi)容。這些內(nèi)容可以概括為特征、粒度、命名、結(jié)構(gòu)、實(shí)現(xiàn)等要素。
考慮到網(wǎng)站信息分類體系和網(wǎng)站信息構(gòu)建(Infor-mation Architecture,n)、網(wǎng)站開發(fā)關(guān)系密切,本文結(jié)合網(wǎng)站IA和網(wǎng)站開發(fā)方法提出了網(wǎng)站信息分類體系優(yōu)化方法,并應(yīng)用該方法對(duì)國(guó)家林業(yè)局網(wǎng)站進(jìn)行了優(yōu)化分析。
2 網(wǎng)站信息分類體系優(yōu)化方法
網(wǎng)站IA包含了組織、標(biāo)識(shí)、導(dǎo)航和檢索系統(tǒng)。網(wǎng)站信息分類體系是網(wǎng)站組織信息的手段,可以視為網(wǎng)站IA的組成部分。網(wǎng)站IA方法對(duì)網(wǎng)站信息分類體系優(yōu)化方法有借鑒意義。學(xué)者們提出了眾多網(wǎng)站IA方法,雖然這些方法之間存在著差異,但它們均涉及到了分析、設(shè)計(jì)、實(shí)施(即實(shí)現(xiàn))、評(píng)價(jià)等工作。網(wǎng)站開發(fā)也往往涉及到分析、設(shè)計(jì)、實(shí)現(xiàn)、測(cè)試(即評(píng)價(jià))等工作。網(wǎng)站IA和網(wǎng)站開發(fā)方法中的評(píng)價(jià)工作主要是評(píng)價(jià)所實(shí)現(xiàn)的新系統(tǒng),因此評(píng)價(jià)工作被設(shè)定在設(shè)計(jì)、實(shí)現(xiàn)等工作之后。
2.1 優(yōu)化步驟
參照網(wǎng)站IA和網(wǎng)站開發(fā)的一般步驟,本文將網(wǎng)站信息分類體系優(yōu)化工作也分為分析、評(píng)價(jià)、設(shè)計(jì)、實(shí)現(xiàn)等階段。為了提高網(wǎng)站信息分類體系優(yōu)化工作的效率,本文將評(píng)價(jià)工作設(shè)定在設(shè)計(jì)、實(shí)現(xiàn)等工作之前,從而提出一個(gè)在設(shè)計(jì)、實(shí)現(xiàn)等工作之后也可以進(jìn)行評(píng)價(jià)優(yōu)化的信息分類體系。于是,網(wǎng)站信息分類體系優(yōu)化時(shí)可能存在著循環(huán)、反復(fù)。本文所提出的網(wǎng)站信息分類體系優(yōu)化方法流程如圖1所示:
2.2 優(yōu)化階段
優(yōu)化網(wǎng)站信息分類體系時(shí),分析階段從特征、粒度(層次)、命名、結(jié)構(gòu)等要素的正確性、適量性、可理解性、相關(guān)性、一致性等方面完成對(duì)現(xiàn)有信息分類體系的分析;評(píng)價(jià)階段完成對(duì)網(wǎng)站現(xiàn)有信息分類體系質(zhì)量的評(píng)估,并根據(jù)評(píng)價(jià)結(jié)果決定是否需要優(yōu)化網(wǎng)站現(xiàn)有信息分類體系;按照優(yōu)化內(nèi)容的不同,設(shè)計(jì)階段可以分為特征優(yōu)化、粒度優(yōu)化、命名優(yōu)化、結(jié)構(gòu)優(yōu)化等環(huán)節(jié);這些環(huán)節(jié)依次優(yōu)化現(xiàn)有信息分類體系的分類特征、粒度關(guān)系、類別名稱、類別間關(guān)系;實(shí)現(xiàn)階段的任務(wù)是根據(jù)設(shè)計(jì)方案調(diào)整網(wǎng)站現(xiàn)有信息分類體系,并描述、說明優(yōu)化后的體系。
2.3 優(yōu)化方法
網(wǎng)站信息分類體系優(yōu)化時(shí),可以借鑒已有方法來完成網(wǎng)站信息分類體系的分析、評(píng)價(jià)和實(shí)現(xiàn)工作。本文借鑒文獻(xiàn)中網(wǎng)站信息分類體系的質(zhì)量框架來分析現(xiàn)有信息分類體系,用文獻(xiàn)提出的指標(biāo)體系來評(píng)價(jià)網(wǎng)站信息分類體系質(zhì)量,用網(wǎng)站設(shè)計(jì)方法來實(shí)現(xiàn)網(wǎng)站信息分類體系的調(diào)整和描述。于是,本文中網(wǎng)站信息分類體系優(yōu)化工作的關(guān)鍵挑戰(zhàn)是找到設(shè)計(jì)階段征優(yōu)化、粒度優(yōu)化、命名優(yōu)化和結(jié)構(gòu)優(yōu)化等方法。
特征優(yōu)化的任務(wù)是選擇最合適的特征組合,可以采用自頂向下方法優(yōu)化特征。自頂向下特征優(yōu)化方法是在分類模式的基礎(chǔ)上確定候選特征集合,再按照特征覆蓋度大小篩選出所需的特征,并對(duì)特征進(jìn)行細(xì)微調(diào)整得到特征組合;粒度優(yōu)化時(shí),需要判斷粒度粗細(xì)是否合適、不同元素間的粒度是否均衡、粒子內(nèi)部元素之間聚合度高不高,可以使用粗粒度優(yōu)先方法優(yōu)化粒度。粗粒度優(yōu)先的粒度優(yōu)化是指直接使用最粗的粒度關(guān)系或者基于相似度對(duì)較細(xì)的粒度進(jìn)行合并、調(diào)整;為了保證用戶熟悉類別名稱,命名優(yōu)化時(shí)要盡量使用通用的詞語來命名類別,可以采用基于統(tǒng)計(jì)的命名優(yōu)化方法?;诮y(tǒng)計(jì)的命名優(yōu)化是指用統(tǒng)計(jì)方法選擇出現(xiàn)頻率高的現(xiàn)有體系或同類網(wǎng)站中詞語來命名類別。命名優(yōu)化的任務(wù)還包括對(duì)錯(cuò)誤類目名稱的調(diào)整;結(jié)構(gòu)優(yōu)化方面往往采用自底向上逐層結(jié)構(gòu)優(yōu)化方法來優(yōu)化結(jié)構(gòu),即在確定網(wǎng)站信息分類體系的層數(shù)的基礎(chǔ)上,從最細(xì)粒度開始到最粗粒度根據(jù)類別之間的隸屬關(guān)系、類別的重要性確定類別的位置。
3 應(yīng)用上述方法優(yōu)化國(guó)家林業(yè)局網(wǎng)站現(xiàn)有信息分類體系
表1是國(guó)家林業(yè)局網(wǎng)站(forestry.省略)“生態(tài)建設(shè)”部分現(xiàn)有信息分類體系:
分析上述信息分類體系,可以發(fā)現(xiàn)它有以下特點(diǎn):
?類別偏多。國(guó)家林業(yè)局網(wǎng)站現(xiàn)有信息分類體系1層所包含的第4層或第3層(沒有第4層時(shí))的類別總數(shù)為307,而我國(guó)中央政府門戶網(wǎng)站(省略)和國(guó)家農(nóng)業(yè)部網(wǎng)站(agi.省略)1層所包含的類別總量分別只有79和78。
?層數(shù)偏多而且不均衡。國(guó)家林業(yè)局網(wǎng)站現(xiàn)信息分類體系最多有4層,如“生態(tài)建設(shè)”及其子類就有4層。其中,第3層類別總數(shù)為189,有第4層子類的第3層類別占第3層類別總數(shù)不到12.2%。體系中第3層和第4層類別的名字長(zhǎng)度和子類數(shù)量差異比較大,許多類別只有一個(gè)子類且上下級(jí)類別名稱相同(即單一子類)。不同層的類別間還有重名的現(xiàn)象。
?兄弟類別間關(guān)系不強(qiáng)。如聚合度不高,且所依據(jù)的分類特征不相同。
?現(xiàn)有分類體系中一些類別名稱(如“網(wǎng)站地圖”、“聯(lián)系我們”)的含義和通常人們理解的含義不一致,有歧義。
?現(xiàn)有分類體系中很多第4層或第3層類別的信息量比較少。
?現(xiàn)有分類體系中政務(wù)公開相關(guān)的類別偏少,無法體現(xiàn)電子政務(wù)網(wǎng)站的特點(diǎn)。
分析這些特點(diǎn),可以發(fā)現(xiàn):國(guó)家林業(yè)局網(wǎng)站現(xiàn)有信息分類體系存在著類別偏多、粒度偏細(xì)、層次偏多的問題。這使得設(shè)計(jì)現(xiàn)有信息分類體系時(shí)需要大量的分類標(biāo)準(zhǔn),從而增加了網(wǎng)站信息分類體系設(shè)計(jì)工作的難度。進(jìn)而導(dǎo)致了現(xiàn)有體系存在著名稱重復(fù)、兄弟類別之間聚合度不高、大量單一子類等問題。根據(jù)上文對(duì)現(xiàn)有體系的分析和文獻(xiàn)中對(duì)現(xiàn)有體系的質(zhì)量評(píng)價(jià)結(jié)果,可以知道現(xiàn)有體系還需要進(jìn)行優(yōu)化。已有的分析、評(píng)價(jià)為設(shè)計(jì)工作指明了方向:可以采用減少特征、粗化粒度、減少類目數(shù)量、減少層次、減少命名歧義性、提高命名長(zhǎng)度一致性等措施來優(yōu)化國(guó)家林業(yè)局網(wǎng)站現(xiàn)有信息分類體系。
按照自頂向下特征優(yōu)化方法,先確定網(wǎng)站信息分類體系第1層類別的候選特征集合。林業(yè)電子政務(wù)網(wǎng)站有主題、原型、功能、實(shí)現(xiàn)、對(duì)象、地域、時(shí)間、角色等分類模式??紤]到網(wǎng)站側(cè)重于監(jiān)管、林業(yè)信息化建設(shè)相對(duì)薄弱等情況,可以以主題、原型為主要分類模式。應(yīng)用主題分類模式時(shí),從產(chǎn)業(yè)視角可以劃分成木材加工、經(jīng)濟(jì)林果、苗木花卉、生態(tài)旅游、生物質(zhì)能源等類別,從業(yè)務(wù)視角可以劃分成造林綠化、防沙治沙、自然保護(hù)等類別。應(yīng)用原型分類模式時(shí),可以劃分成文件、公告、公示等公文類別。用同樣的分析方法,可以得到業(yè)務(wù)、產(chǎn)業(yè)、市場(chǎng)、公文類別、來源、媒體、語言、技術(shù)、交互方式、可實(shí)現(xiàn)的任務(wù)、相關(guān)機(jī)構(gòu)、相關(guān)人物、時(shí)間、地域等特征組成的候選特征集合。通過對(duì)國(guó)家林業(yè)局網(wǎng)站現(xiàn)有信息進(jìn)行歸類,考慮到特征覆蓋度的大小,可以篩選出業(yè)務(wù)、資源形式、交互目的、產(chǎn)業(yè)等四種分類特征。另外,考慮到網(wǎng)站信息分類體系中有許多鏈接到獨(dú)立網(wǎng)站的類別,可以增加導(dǎo)航特征。因此,優(yōu)化后的信息分類體系有業(yè)務(wù)、資源形式、交互目的、產(chǎn)業(yè)、導(dǎo)航等分類特征。
由于現(xiàn)有信息分類體系粒度偏細(xì),粒度優(yōu)化時(shí)的主要任務(wù)是基于相似度對(duì)現(xiàn)有部分類別進(jìn)行合并??紤]到天然林保護(hù)、退耕還林、防沙治沙、濕地保護(hù)、公安防火等信息和自然保護(hù)有相關(guān)性,可以將它們進(jìn)行歸并成生態(tài)保護(hù);同樣原因,將義務(wù)植樹歸并到造林工作下。對(duì)現(xiàn)有信息分類進(jìn)行命名優(yōu)化時(shí),主要是采用體系中已有詞語來命名類別,調(diào)整了部分類別名稱。對(duì)現(xiàn)有信息分類進(jìn)行結(jié)構(gòu)優(yōu)化時(shí),先確定總層數(shù)為3層,再自底向上根據(jù)類別之間的關(guān)系并兼顧類別的重要性確定類別的位置。優(yōu)化后的信息分類體系邏輯結(jié)構(gòu)如表2所示:
[關(guān)鍵詞] 信息組織分類主題一體化信息服務(wù)行業(yè)號(hào)百信息分類法
隨著社會(huì)信息化進(jìn)程的加快,社會(huì)中存在的各種行業(yè)、產(chǎn)品信息不斷膨脹。這些信息在沒有被有效地組織之前猶如一盤散沙,只有對(duì)其進(jìn)行科學(xué)的組織,才能夠充分發(fā)揮信息的使用價(jià)值,滿足用戶的檢索需求。
近年來信息服務(wù)行業(yè)的蓬勃發(fā)展正適應(yīng)了用戶對(duì)信息組織的需求,該行業(yè)通過對(duì)社會(huì)中的各類行業(yè)、產(chǎn)品、知識(shí)進(jìn)行有效的分類整合,建立相關(guān)索引以方便信息的查詢,從而使用戶或企業(yè)管理人員能夠快速準(zhǔn)確地獲取相關(guān)信息,從而降低社會(huì)信息流的混亂程度,促進(jìn)信息共享和信息有效訪問,提高信息產(chǎn)品的質(zhì)量和價(jià)值??梢姡畔⒎?wù)行業(yè)所采用的信息組織方法是該行業(yè)發(fā)展的關(guān)鍵,對(duì)其業(yè)務(wù)開展及服務(wù)質(zhì)量具有直接性的影響[1]。
1 信息服務(wù)行業(yè)的信息組織方法及問題
最初的信息分類來源于圖書館的文獻(xiàn)分類,隨著互聯(lián)網(wǎng)的迅猛發(fā)展,企業(yè)所接收和提供的信息量迅猛增長(zhǎng),人們對(duì)信息檢索的需求量也越來越大。分類法的應(yīng)用范圍逐漸深入到各類信息服務(wù)行業(yè)中。目前,分類法在信息行業(yè)中主要應(yīng)用于網(wǎng)站管理、搜索引擎服務(wù)、信息查詢服務(wù)等方面。該行業(yè)所采用的信息組織分類方法主要有以下幾種:
1.1 傳統(tǒng)分類法
傳統(tǒng)分類法指用于組織、整理圖書館藏書的分類法。如國(guó)外的《杜威十進(jìn)分類法》、《國(guó)際十進(jìn)分類法》、《美國(guó)國(guó)會(huì)圖書館分類法》等。在我國(guó),最具代表性的傳統(tǒng)分類法是《中國(guó)圖書館分類法》。傳統(tǒng)分類法主要以文獻(xiàn)為主要處理對(duì)象,其分類體系為等級(jí)列舉式結(jié)構(gòu)。
傳統(tǒng)分類法以科學(xué)分類為基礎(chǔ),詞匯選取規(guī)范,具有嚴(yán)密的邏輯性與結(jié)構(gòu)完整性。但同時(shí),傳統(tǒng)分類法的單線型列舉式的“樹狀”結(jié)構(gòu),不能反映現(xiàn)代信息的多元化發(fā)展。并且,傳統(tǒng)分類法在表達(dá)類目、主題之間關(guān)系方面采用參見、組配、注釋等方式,對(duì)于分界模糊、交叉性強(qiáng)的日新月異的行業(yè)產(chǎn)品綜合信息也有很大的不適應(yīng)性。此外,傳統(tǒng)分類法的專業(yè)性對(duì)于信息服務(wù)行業(yè)面對(duì)的最終用戶來說缺少易用性[2]。
1.2黃頁企業(yè)分類法
黃頁企業(yè)分類法是以分類法為核心思想并結(jié)合企業(yè)特征發(fā)展而來的一種信息組織方法,目前已被廣泛應(yīng)用在企業(yè)管理和業(yè)務(wù)模塊等方面。黃頁企業(yè)分類法主要以各種企業(yè)、組織機(jī)構(gòu)為對(duì)象,是將企業(yè)信息根據(jù)產(chǎn)品或服務(wù)的特性進(jìn)行歸類后按一定方法編排的名錄[3]。
黃頁企業(yè)分類法能按專業(yè)集中地、系統(tǒng)地揭示企業(yè)性質(zhì),可使使用者整體清晰地把握企業(yè)特征,并且保證了高度的檢全率。但是,現(xiàn)代企業(yè)從事產(chǎn)品趨于多元化,產(chǎn)品之間互相滲透和綜合,因此,充分地、合乎客觀實(shí)際地反映多維性的企業(yè)性質(zhì)變得越來越復(fù)雜和困難。這使得對(duì)一些企業(yè)的專業(yè)范圍很難界定,黃頁企業(yè)分類法在檢準(zhǔn)率方面面臨著非常大的挑戰(zhàn) 。
1.3 人工分類法
人工分類法是以人工標(biāo)引或自動(dòng)標(biāo)引方式采用自編的分類系統(tǒng)。目前大量網(wǎng)站和搜索引擎都采用人工分類法對(duì)網(wǎng)絡(luò)信息進(jìn)行分類組織。這些自編的分類體系以用戶為中心,充分考慮到了最終用戶的需求特點(diǎn)。
與傳統(tǒng)分類法相比, 人工分類法通常以主題為核心建立分類,并且突出用戶關(guān)注和需求的類目,詞匯選取更加通俗易懂。此分類法最突出的特點(diǎn)是可以動(dòng)態(tài)組織分類體系,根據(jù)需要隨時(shí)調(diào)整或組織相關(guān)資源,具有較強(qiáng)的靈活性和適用性。但由于分類人員缺乏專業(yè)性,且內(nèi)容未經(jīng)嚴(yán)格審核,隨意性較強(qiáng),因此造成類目設(shè)置模糊、交叉嚴(yán)重,知識(shí)領(lǐng)域不全, 缺乏規(guī)范性、規(guī)律性等問題[4]。
1.4 全國(guó)主要產(chǎn)品分類與代碼
《全國(guó)主要產(chǎn)品分類與代碼》是我國(guó)于2002年頒布的產(chǎn)品分類標(biāo)準(zhǔn)。該分類法由可運(yùn)輸產(chǎn)品和不可運(yùn)輸產(chǎn)品兩部分組成,以我國(guó)工農(nóng)業(yè)商品和物資為處理對(duì)象,是產(chǎn)品分類法的代表,對(duì)我國(guó)生產(chǎn)領(lǐng)域產(chǎn)品的產(chǎn)量、產(chǎn)值等各種不同類型的數(shù)據(jù)處理和準(zhǔn)確統(tǒng)計(jì)提供一個(gè)分類依據(jù)。
該分類法在信息日益更新的今天并沒有及時(shí)進(jìn)行動(dòng)態(tài)維護(hù)管理,原標(biāo)準(zhǔn)已難以適應(yīng)和滿足社會(huì)的需求。并且,該分類法僅以產(chǎn)品為主要處理對(duì)象,標(biāo)準(zhǔn)的覆蓋面不夠?qū)挘瑹o法滿足對(duì)多類型的信息進(jìn)行組織的需求。
上述各種信息服務(wù)行業(yè)現(xiàn)存的分類體系分別以文獻(xiàn)信息、行業(yè)信息、產(chǎn)品信息為處理對(duì)象,缺乏對(duì)行業(yè)、產(chǎn)品綜合信息的系統(tǒng)完整的信息組織,并且普遍存在更新不及時(shí)、體系結(jié)構(gòu)不能滿足現(xiàn)代信息的多元性、交叉性的問題。因此,需要從現(xiàn)代信息的特點(diǎn)出發(fā),建立符合大眾需求的、對(duì)行業(yè)產(chǎn)品綜合信息進(jìn)行有效信息組織的新型組織方法,以適應(yīng)用戶的信息需求。
2 信息組織方法在號(hào)百公司中的應(yīng)用
中國(guó)電信集團(tuán)號(hào)百信息服務(wù)有限公司(簡(jiǎn)稱號(hào)百公司)是中國(guó)電信股份有限公司的全資子公司?!疤?hào)碼百事通”是號(hào)百公司的龍頭業(yè)務(wù),是一切基于中國(guó)電信114臺(tái)的增值業(yè)務(wù)的統(tǒng)稱,其目的就是要在充分挖掘和整合用戶號(hào)碼信息的基礎(chǔ)上,延伸和拓展傳統(tǒng)的查號(hào)業(yè)務(wù),滿足用戶現(xiàn)實(shí)和潛在的各類信息查詢需求 。
對(duì)于號(hào)百公司這樣一個(gè)信息查詢服務(wù)行業(yè)的典型代表,良好的信息組織方式是其發(fā)展的核心競(jìng)爭(zhēng)力所在。號(hào)百公司在遵循和借鑒傳統(tǒng)分類法知識(shí)體系和現(xiàn)行的多種行業(yè)和產(chǎn)品分類體系的基礎(chǔ)上,針對(duì)號(hào)百自身的業(yè)務(wù)服務(wù)特色及用戶需求特點(diǎn),設(shè)計(jì)并研制出了符合號(hào)百信息組織需求的信息組織工具――《號(hào)百信息分類法》。
2.1 《號(hào)百信息分類法》概述
號(hào)百公司所采用的信息組織方法是集“行業(yè)―產(chǎn)品―知識(shí)”三者為一體的綜合性、分類主題一體化的《號(hào)碼百事通信息分類法》(以下簡(jiǎn)稱《號(hào)百信息分類法》)。它以服務(wù)機(jī)構(gòu)(行業(yè))為主要出發(fā)點(diǎn),科學(xué)和實(shí)用地展示與組織相關(guān)的服務(wù)產(chǎn)品以及與服務(wù)產(chǎn)品相關(guān)的知識(shí),同時(shí)滿足行業(yè)、產(chǎn)品、知識(shí)的分類組織和主題組織的需要,滿足信息服務(wù)的整序需求。
《號(hào)百信息分類法》采用了“分類―主題一體化”的編制結(jié)構(gòu),將分類法與主體法結(jié)合起來,實(shí)現(xiàn)對(duì)信息的內(nèi)容描述和檢索功能均從分類和主題兩個(gè)角度進(jìn)行,公司可以完成對(duì)行業(yè)信息的分類標(biāo)引和主題標(biāo)引,用戶也可以在統(tǒng)一的檢索系統(tǒng)中進(jìn)行字順主題查詢和系統(tǒng)分類查詢。既能獨(dú)立完成主題標(biāo)引的功能,滿足特性檢索的要求,又可以獨(dú)立完成分類標(biāo)引的功能,滿足族性檢索的要求,從而把信息組織、信息檢索的系統(tǒng)性與直接性結(jié)合起來,同時(shí)建立主題詞與關(guān)鍵詞之間的關(guān)聯(lián)關(guān)系,作為主題語言與自然語言的接口。
2.2《號(hào)百信息分類法》的編制特色
2.2.1類目具有高涵蓋性《號(hào)百信息分類法》的編制遵循“具有高涵蓋能力,包括全行業(yè)和產(chǎn)品信息,將各類信息的行業(yè)屬性、產(chǎn)品屬性與知識(shí)屬性有機(jī)地融合起來”的編制原則。該分類體系的類目最細(xì)為6級(jí),設(shè)置了34個(gè)一級(jí)類目,在一級(jí)類目之下,以行業(yè)為主要聚類依據(jù),劃分出相對(duì)獨(dú)立的、具有市場(chǎng)分割性質(zhì)的二級(jí)類目,形成行業(yè)的基本架構(gòu);三級(jí)類目過渡到行業(yè)、產(chǎn)品、知識(shí)兼顧的立類;四、五、六級(jí)類目是主要以產(chǎn)品、事物、知識(shí)為主的立類 。該分類體系片段如圖1所示:
由上圖可以看出,《號(hào)百信息分類法》將行業(yè)分類、產(chǎn)品分類和知識(shí)信息充分地綜合在一起,以便從多個(gè)角度同時(shí)滿足公司的業(yè)務(wù)開展需求及用戶的信息搜索和服務(wù)需求。此外,公司在進(jìn)行行業(yè)、產(chǎn)品分類時(shí),通過類目的參見及主題詞間的語義關(guān)聯(lián)建立知識(shí)間的聯(lián)系,使得行業(yè)分類與產(chǎn)品分類之間具有更強(qiáng)的緊密性和擴(kuò)展性,便于用戶在檢索中便捷全面地檢索到行業(yè)及產(chǎn)品信息。
2.2.2分類體系的強(qiáng)易用性《號(hào)百信息分類法》致力于整合行業(yè)、產(chǎn)品的信息資源,提高廣大用戶的檢準(zhǔn)率和檢索效率。其面向的檢索用戶并不具備專業(yè)的檢索技能及準(zhǔn)確的分類概念。針對(duì)這一特點(diǎn),《號(hào)百信息分類法》的類目體系增強(qiáng)易用性,相對(duì)弱化科學(xué)性。具體表現(xiàn)在:類目的詳細(xì)程度與檢索的信息量和查詢頻率相匹配,以滿足用戶在日常最關(guān)心的領(lǐng)域的信息檢索需求;注重多重列類,即在同一劃分階段,同時(shí)采用幾個(gè)標(biāo)準(zhǔn)對(duì)上位類概念進(jìn)行劃分,從而獲得幾組并列的同位概念,給用戶提供盡可能多的檢索途徑;類目展開深度控制在6級(jí),避免不具備精準(zhǔn)檢索知識(shí)的普通大眾因類目層級(jí)過深而導(dǎo)致無法準(zhǔn)確高效地找到所需信息情況的發(fā)生。
2.2.3詞匯選取從大眾出發(fā)《號(hào)百信息分類法》在詞匯選取方面充分從方便大眾的角度出發(fā),借用豐富的入口詞提高自然語言的檢索能力,并且大量使用詞組以貼近用戶的檢索習(xí)慣。在選擇入口詞方面,收錄豐富的、對(duì)詞形規(guī)范性要求不甚嚴(yán)格的關(guān)鍵詞,在很大程度上增加了檢索入口,提高自然語言的檢索能力,從而增加了終端用戶檢索的便利性。與此同時(shí),《號(hào)百信息分類法》在使用概念組配的同時(shí),大量收錄了高先組度的詞組以貼近大眾的檢索習(xí)慣,在滿足信息多向成族需要的同時(shí)提高檢全率。
3 《號(hào)百信息分類法》面臨的挑戰(zhàn)及對(duì)策建議
《號(hào)百信息分類法》是信息組織方法在非圖書文獻(xiàn)領(lǐng)域得以應(yīng)用和創(chuàng)新的典型代表。必須意識(shí)到,其蓬勃發(fā)展的同時(shí)仍然面臨著嚴(yán)峻的挑戰(zhàn)。面對(duì)分界模糊、交叉性強(qiáng)、更新速度快的行業(yè)信息以及多用途、交叉領(lǐng)域的產(chǎn)品信息,如何將這些錯(cuò)綜復(fù)雜的數(shù)據(jù)進(jìn)行有效的標(biāo)引以充分揭示各類信息是個(gè)不小的難題。此外,《號(hào)百信息分類法》集“行業(yè)―產(chǎn)品―信息”三者為一體,在增強(qiáng)了分類類目的關(guān)聯(lián)性及擴(kuò)展性的同時(shí),也加大了管理人員對(duì)其維護(hù)和更新的困難性。對(duì)此,筆者試從以下3個(gè)方面提出對(duì)策建議。
3.1建立強(qiáng)大的參照系統(tǒng),揭示知識(shí)空間的立體聯(lián)系
針對(duì)行業(yè)及產(chǎn)品信息錯(cuò)綜交叉的特點(diǎn),采取以參照系統(tǒng)建立的網(wǎng)狀關(guān)系將交叉領(lǐng)域的信息相結(jié)合。因此,不僅要建立交叉關(guān)系和相關(guān)概念的參照,而且需要建立不同的表示方式(如檢索詞和分類號(hào))之間的混合參照;從同一檢索系統(tǒng)內(nèi)的參照到多個(gè)檢索系統(tǒng)間的參照;從單一行業(yè)內(nèi)的參照到多行業(yè)之間的參照;甚至可以在不同系統(tǒng)、不同行業(yè)、不同產(chǎn)品、不同表示方式之間建立強(qiáng)大的參照系統(tǒng),使各類目間形成功能強(qiáng)大的網(wǎng)狀結(jié)構(gòu),從而建立和規(guī)范交叉信息之間的關(guān)系,客觀而充分地揭示知識(shí)空間的立體聯(lián)系,供用戶從不同的角度進(jìn)行檢索[6]。
3.2鼓勵(lì)用戶參與,提供豐富的用戶體驗(yàn)
“用戶中心”是Web2.0的重要理念。鼓勵(lì)用戶參與,提供更豐富的用戶體驗(yàn),讓用戶不止是號(hào)百信息庫(kù)的使用者,還要成為號(hào)百信息庫(kù)的建設(shè)者。針對(duì)行業(yè)及產(chǎn)品信息更新速度快的特點(diǎn),通過與用戶的互動(dòng),充分利用群體智慧來建設(shè)號(hào)百信息數(shù)據(jù)庫(kù)。允許用戶對(duì)行業(yè)或產(chǎn)品記錄進(jìn)行標(biāo)注、評(píng)論或者更正,讓用戶真正參與到號(hào)百信息庫(kù)的建設(shè)中來。
3.3建立多維系統(tǒng),提供多途徑、多類型的檢索
為了適應(yīng)多元性的、交互性的、動(dòng)態(tài)的網(wǎng)絡(luò)信息環(huán)境,可以打破分類法傳統(tǒng)的“線性”資源組織方式,采用分面分析的方法。在類目體系縱向展開上, 使用多維劃分和多元展開的形式為一種信息賦予多個(gè)類號(hào), 并且可以同時(shí)設(shè)置多個(gè)類目體系, 建立多維的系統(tǒng),從而提供多途徑、多類型的檢索,以滿足情報(bào)的多維檢索需要。這種多途徑的檢索方式使更多的主題概念進(jìn)入分類體系, 這使得用戶可以從不同的角度進(jìn)行檢索,在一定程度上大大提高了信息的檢全率和檢準(zhǔn)率[7]。
在互聯(lián)網(wǎng)時(shí)代,幫助用戶高效檢索所需求信息的信息服務(wù)行業(yè),地位不斷攀升。信息組織方法是信息服務(wù)業(yè)生存和發(fā)展的關(guān)鍵技術(shù)。信息服務(wù)業(yè)中的信息組織技術(shù)必須充分吸收傳統(tǒng)信息分類法的成熟理論,在此基礎(chǔ)上,結(jié)合信息服務(wù)的業(yè)務(wù)特色、信息用戶的搜索需求及檢索特點(diǎn),才能夠使其在信息服務(wù)行業(yè)中得以有效地應(yīng)用。信息服務(wù)業(yè)需要加強(qiáng)對(duì)信息組織的重視以提高企業(yè)的競(jìng)爭(zhēng)力,而信息組織的方法本身也需要不斷完善和發(fā)展,以適應(yīng)復(fù)雜多變的用戶搜索要求[8]。
參考文獻(xiàn):
[1] 李衛(wèi)紅,沈保全. 信息組織方法述略.情報(bào)雜志,2004,22(1):67-68.
[2] 鄧均華. 網(wǎng)絡(luò)分類搜索引擎與傳統(tǒng)分類法之比較分析――兼論建立我國(guó)信息組織分類標(biāo)準(zhǔn). 河南圖書館學(xué)刊,2001,21(5):60-61.
[3] 周毅俊. 黃頁檢索語言探索. 中國(guó)索引,2005(2):30-32.
[4] 武利紅,李振紅. 分類法在搜索引擎中的運(yùn)用思考. 圖書館學(xué)研究,2005(6):48-50.
[5] 劉蘇南.信息組織在中國(guó)電信信息服務(wù)中的應(yīng)用. [2010-12-02].省略index.fudan.省略/lwj/2008/liusunan.ppt.
[6] 蘇瑞竹,吳英姿.利用分類法和主題法改善搜索引擎的性能. 情報(bào)科學(xué),2001,19(11):1170-1175.
[7] 馬張華. 分類搜索引擎對(duì)分類法發(fā)展的貢獻(xiàn)及相關(guān)問題討論.中國(guó)索引,2005(3):14-18.
[8] 王衍,丁梅娟. 論企業(yè)信息資源的組織管理與開發(fā)利用. 科技進(jìn)步與對(duì)策,2002(7):115-116.
[作者簡(jiǎn)介]彤,女,1989年生,本科生。
關(guān)鍵詞農(nóng)業(yè)信息分類;存在問題;網(wǎng)狀結(jié)構(gòu);原理;原則;優(yōu)點(diǎn)
中圖分類號(hào)G201文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào) 1007-5739(2011)03-0047-03
AgricultureInformation′sClassificationBasedonReticulateFrame
YU Xin-kai 1LI Bin2MAO Min 1
(1 Guangzhou City Construction College,Guangzhou Guangdong 510925; 2 Guangzhou Agriculture Information Center)
AbstractBased on analysis of the system of agricultural information resources at present,a new measure so-called classification based on reticulate frame was brought forward,which helped to construct a scientific,efficient,lively system for the information resources.
Key wordsagricultural information classification;problems;reticulate frame;theory;principle;advantage
自1994年實(shí)施“金農(nóng)工程”開始至今,農(nóng)業(yè)類信息網(wǎng)站由最初的“中國(guó)農(nóng)業(yè)信息網(wǎng)”(1996年建成)發(fā)展到目前已經(jīng)超過3萬家,2009年前8個(gè)月就增加了逾8 000家,增長(zhǎng)率達(dá)到38%,遠(yuǎn)遠(yuǎn)高于全國(guó)互聯(lián)網(wǎng)站平均增長(zhǎng)速度[1]。
綜合對(duì)比全國(guó)各地的農(nóng)業(yè)類信息網(wǎng)站,雖然我國(guó)各類農(nóng)業(yè)信息系統(tǒng)在數(shù)量上和規(guī)模上一直處在持續(xù)增長(zhǎng)勢(shì)頭,農(nóng)業(yè)信息資源也不斷地充實(shí)擴(kuò)大,但由于農(nóng)業(yè)行業(yè)所涉及的相關(guān)領(lǐng)域十分廣闊,知識(shí)與信息內(nèi)容繁多;加之我國(guó)在農(nóng)業(yè)信息化建設(shè)方面尚未建立統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),使得眾多農(nóng)業(yè)類信息系統(tǒng)在信息采集、內(nèi)容組織與展現(xiàn)、數(shù)據(jù)挖掘方面都各不一致,以致難以實(shí)現(xiàn)信息的高效共享,不利于信息資源的開發(fā)利用。
1農(nóng)業(yè)信息資源的基本涵義
根據(jù)中國(guó)電子信息產(chǎn)業(yè)發(fā)展研究院的定義:農(nóng)業(yè)信息化是指利用現(xiàn)代信息技術(shù)和信息系統(tǒng)為農(nóng)業(yè)產(chǎn)供銷及相關(guān)的管理和服務(wù)提供有效的信息支持,并提高農(nóng)業(yè)的綜合生產(chǎn)力和經(jīng)營(yíng)管理效率的相關(guān)產(chǎn)業(yè)的總稱。具體內(nèi)容包括:農(nóng)民生活消費(fèi)信息化;農(nóng)業(yè)生產(chǎn)管理信息化;農(nóng)業(yè)科學(xué)技術(shù)信息化;農(nóng)業(yè)經(jīng)營(yíng)管理信息化;農(nóng)業(yè)市場(chǎng)流通信息化;農(nóng)業(yè)資源環(huán)境信息化;農(nóng)業(yè)管理決策信息化[2]。
根據(jù)《全國(guó)工農(nóng)業(yè)產(chǎn)品(商品、物資)分類與代碼》(國(guó)家標(biāo)準(zhǔn)GB7635)的分類,農(nóng)業(yè)作為第一產(chǎn)業(yè),其包括農(nóng)業(yè)產(chǎn)品、營(yíng)林產(chǎn)品、人工飼養(yǎng)動(dòng)物與捕獵的野生動(dòng)物及其產(chǎn)品、漁業(yè)產(chǎn)品、觀賞植物和其他農(nóng)、林、牧、漁業(yè)產(chǎn)品等六大類[3]。
據(jù)此,筆者認(rèn)為對(duì)農(nóng)業(yè)信息資源進(jìn)行嚴(yán)格的、層次分明、界限明顯的分類是比較困難的,其不像教育、社會(huì)保障、醫(yī)療衛(wèi)生、交通運(yùn)輸、房地產(chǎn)等領(lǐng)域的信息資源那樣具有較高的內(nèi)聚度和信息受用者的單一性、確定性和穩(wěn)定性。通過對(duì)比很容易看出農(nóng)業(yè)網(wǎng)站的信息內(nèi)容“大而全”的特征面貌。
2對(duì)農(nóng)業(yè)信息資源進(jìn)行分類的必要性
“農(nóng)業(yè)”是一個(gè)范疇非常廣泛的概念,凡是與農(nóng)業(yè)相關(guān)的信息都可以作為農(nóng)業(yè)信息――這幾乎是目前所有涉農(nóng)網(wǎng)站信息內(nèi)容所表現(xiàn)出來的“默認(rèn)”看法或做法,是合乎邏輯、無可非議的。問題是,如果凡是信息皆為“信息”,那么讓信息受用者在這樣海量的信息世界里找答案就像是讓他們?cè)趫D書館里找法律條文一樣難。因此,有必要對(duì)農(nóng)業(yè)信息資源的分類和呈現(xiàn)進(jìn)行系統(tǒng)的技術(shù)分析,建立一個(gè)科學(xué)的、規(guī)范的、精簡(jiǎn)的、高效的、實(shí)用的農(nóng)業(yè)信息資源體系,使農(nóng)業(yè)信息從最初的形成,到加工,再到最終的呈現(xiàn),整個(gè)生存周期都能一直保持“所見即所得”的理想狀態(tài)。即讓信息受用者通過最簡(jiǎn)便的方式,在最短的時(shí)間內(nèi)獲取其認(rèn)為有價(jià)值的信息。
3現(xiàn)階段農(nóng)業(yè)信息的分類狀況
3.1常用的分類方法
按照傳統(tǒng)的分類方法,根據(jù)不同的維度[4]作為標(biāo)志對(duì)農(nóng)業(yè)信息資源進(jìn)行分類,常用的分類方法有以下幾種:一是按信息所涉及的活動(dòng)行為劃分,可分為農(nóng)業(yè)行政管理、生產(chǎn)管理、經(jīng)營(yíng)管理、市場(chǎng)流通、農(nóng)業(yè)科研等信息。二是按信息所涉及的商品對(duì)象劃分,可分為糧油、蔬菜、水果、水產(chǎn)、畜禽、花卉、農(nóng)副產(chǎn)品、生產(chǎn)資料等信息。三是按信息內(nèi)容的表現(xiàn)形式劃分,可分為文本、數(shù)字、圖表、圖片、聲音、演示稿、視頻、地理信息等多媒體信息。四是按信息表達(dá)內(nèi)容所屬的文種劃分,可分為政策法規(guī)、政務(wù)公開、新聞報(bào)道、價(jià)格行情、科普知識(shí)等信息。五是按信息所體現(xiàn)的功能作用劃分,可分為政務(wù)辦理、信息查詢、在線論壇、問卷調(diào)查、上傳下載、電子商務(wù)等。六是按信息發(fā)生的時(shí)間劃分,可分為歷史信息、當(dāng)前信息和預(yù)測(cè)信息。七是按信息的時(shí)效特征劃分,可分為實(shí)時(shí)信息、準(zhǔn)實(shí)時(shí)信息和延時(shí)信息。八是按信息的空間范圍劃分,可分為世界、全國(guó)、各地方的農(nóng)業(yè)信息。九是按信息內(nèi)容變化的頻度劃分,可分為靜態(tài)信息和動(dòng)態(tài)信息。以上各類分類方法在文獻(xiàn)表述上是可行的,根據(jù)研究對(duì)象側(cè)重點(diǎn)的不同而采用不同的維度進(jìn)行分類。但是將包羅萬象的農(nóng)業(yè)信息資源注入到一個(gè)相對(duì)不區(qū)分研究對(duì)象的農(nóng)業(yè)信息系統(tǒng)中去,并同時(shí)保持各類信息之間清晰的界限和層次結(jié)構(gòu),這就不是一件容易的事。
3.2傳統(tǒng)分類方法存在的問題
一般都采用樹形結(jié)構(gòu)對(duì)農(nóng)業(yè)信息資源進(jìn)行分類,這也是目前大多數(shù)農(nóng)業(yè)網(wǎng)站所采用的一種方法。這樣的分類方法就其效果而言是比較直觀、易于理解,便于內(nèi)容的組織與歸納(圖1),但其一方面忽略了各分支節(jié)點(diǎn)的內(nèi)容交叉性;另一方面切割了各分支節(jié)點(diǎn)之間的內(nèi)在客觀聯(lián)系。
一個(gè)典型的例子就是水果農(nóng)產(chǎn)品的分類,按果類品種可分為蘋果、荔枝、龍眼、芒果等,一些農(nóng)業(yè)網(wǎng)站相應(yīng)地分別開設(shè)荔枝信息欄目、龍眼信息欄目等,但若同時(shí)也開設(shè)了“農(nóng)科園地”欄目時(shí),那么關(guān)于荔枝栽培技術(shù)的信息應(yīng)該放在“荔枝專欄”還是“農(nóng)科園地”呢?
對(duì)于分支節(jié)點(diǎn)的內(nèi)容交叉性問題,有人曾提出笛卡爾積的解決辦法,即N1×N2×……×Nm×……×Nn,其中n是維度數(shù),表示有n種分類方法,按每一種分類方法可將農(nóng)業(yè)信息分為Nm類,以此來達(dá)到完整地覆蓋所有分支節(jié)點(diǎn)的目的(圖2)。
舉個(gè)例子,比如某農(nóng)業(yè)網(wǎng)站有3個(gè)信息欄目:一是栽培技術(shù)欄目下開設(shè)了荔枝、龍眼、芒果等子欄目;二是荔枝欄目下開設(shè)了栽培技術(shù)、市場(chǎng)信息、名優(yōu)品種等子欄目;三是市場(chǎng)信息欄目下開設(shè)了畜禽、水果、花卉子欄目,水果子欄目下又開設(shè)了荔枝、龍眼、芒果等子欄目。按照這種設(shè)計(jì)方法,欄目的數(shù)量和其結(jié)構(gòu)的復(fù)雜度將按級(jí)數(shù)遞增,無論是內(nèi)容的管理策劃者還是信息瀏覽者都很容易陷入迷宮陣,既不方便內(nèi)容的管理又不利于信息的傳遞,同時(shí)又造成了大量冗余的信息重復(fù)出現(xiàn)。
本文為全文原貌 未安裝PDF瀏覽器用戶請(qǐng)先下載安裝 原版全文
對(duì)于按樹形結(jié)構(gòu)分類法,則會(huì)隱藏掉事物間的內(nèi)在客觀聯(lián)系規(guī)律。例如將關(guān)于荔枝、龍眼的產(chǎn)量、上市信息分別放置在荔枝專欄和龍眼專欄中,則會(huì)讓人難以發(fā)現(xiàn)這2種水果在產(chǎn)量和銷量方面的聯(lián)系。實(shí)際上,在珠三角地區(qū)能種植荔枝的地方一般也可以種植龍眼,而且是在同一季節(jié)收摘和上市的,同時(shí)面向總銷量比較穩(wěn)定的消費(fèi)市場(chǎng)。因此它們之間的產(chǎn)量和銷量肯定會(huì)存在一定的客觀聯(lián)系,而這些規(guī)律正是數(shù)據(jù)挖掘者所關(guān)心的,因?yàn)檫@些相關(guān)數(shù)據(jù)正是創(chuàng)造信息價(jià)值所依賴的基礎(chǔ),是實(shí)現(xiàn)信息資源二次開發(fā)利用的關(guān)鍵因素。
4網(wǎng)狀結(jié)構(gòu)分類法的實(shí)現(xiàn)
4.1網(wǎng)狀結(jié)構(gòu)分類法的原則
在構(gòu)建網(wǎng)狀結(jié)構(gòu)的農(nóng)業(yè)信息分類體系時(shí),應(yīng)當(dāng)把握好以下原則:一是科學(xué)性原則[5]。所選擇的維度標(biāo)志必須能反映事物的本質(zhì)特征并具有明顯的區(qū)別功能和穩(wěn)定性,以滿足分類的客觀要求。二是系統(tǒng)性原則。每一個(gè)分類維度標(biāo)志的內(nèi)涵都必須是互相獨(dú)立、無重復(fù)的,所有維度標(biāo)志的總和所涵蓋的內(nèi)容能夠構(gòu)成完整的農(nóng)業(yè)信息范疇和領(lǐng)域。三是規(guī)范性原則。分類首先應(yīng)該符合相關(guān)的國(guó)家標(biāo)準(zhǔn)、行業(yè)標(biāo)準(zhǔn)和其他規(guī)范性文件。四是實(shí)用性原則。應(yīng)充分滿足生產(chǎn)、流通及消費(fèi)的需要,同時(shí)要有利于數(shù)據(jù)挖掘和知識(shí)發(fā)現(xiàn)。五是擴(kuò)展性原則。要事先預(yù)見并設(shè)置或預(yù)留足夠的類目,以保證在新事物出現(xiàn)時(shí)不至于打亂已建立的分類體系和結(jié)構(gòu)。六是兼容性原則。即同一個(gè)信息單元出現(xiàn)在不同的類目時(shí),既不會(huì)帶來信息冗余,也不會(huì)產(chǎn)生內(nèi)容上的歧義。
4.2網(wǎng)狀結(jié)構(gòu)分類法的設(shè)計(jì)原理
在數(shù)據(jù)倉(cāng)庫(kù)理論中有一種數(shù)據(jù)組織模型叫做數(shù)據(jù)立方體,是n維笛卡爾積空間的表現(xiàn)為三維的形式。網(wǎng)狀數(shù)據(jù)結(jié)構(gòu)則是結(jié)合上述的樹形數(shù)據(jù)結(jié)構(gòu)和n維笛卡爾積空間結(jié)構(gòu)經(jīng)過改進(jìn)演化而來的(圖3)。
4.3構(gòu)建步驟
一是將農(nóng)業(yè)信息資源按照樹形結(jié)構(gòu)分類,如圖1所示;二是調(diào)整每一個(gè)維度及其分類的位置并旋轉(zhuǎn)一定的角度,形成一個(gè)有邊界的多邊形整體效果,將所有的農(nóng)業(yè)信息單元數(shù)據(jù)對(duì)象放在這個(gè)全集空間中考察;三是對(duì)于實(shí)踐中所生產(chǎn)的每一個(gè)信息單元,先根據(jù)信息的主要功能與價(jià)值確定其直接歸屬的欄目,用實(shí)線連接該信息單元和其宿主欄目;四是考察信息單元與其他欄目的關(guān)聯(lián)性,關(guān)聯(lián)性強(qiáng)的用虛線連接,關(guān)聯(lián)性弱的則不連接;五是當(dāng)所有的維度分類和信息單元都在這個(gè)全集空間中標(biāo)示出來時(shí),再把該模型放到立體空間去觀察,最后得到一個(gè)球形網(wǎng)狀的結(jié)構(gòu)模型[6]。
5基于網(wǎng)狀結(jié)構(gòu)的農(nóng)業(yè)信息分類技術(shù)的優(yōu)點(diǎn)
一是有效地考慮到了不同維度的交叉部分,實(shí)現(xiàn)了各類農(nóng)業(yè)信息的相互兼容性,消除了信息損耗。二是有利于揭示不同信息單元之間的內(nèi)在客觀聯(lián)系,為進(jìn)一步的數(shù)據(jù)挖掘和信息資源開發(fā)利用提供很好的原始數(shù)據(jù)。三是消除了笛卡爾積分類結(jié)構(gòu)帶來的大量多余的、空的、無意義的冗余信息,使整體結(jié)構(gòu)更加清晰,同時(shí)也為物理設(shè)備節(jié)省了大量的存儲(chǔ)空間。四是所有信息單元與其宿主欄目和關(guān)聯(lián)欄目都用連線連接,使得整個(gè)分類系統(tǒng)更加富有組織性、有機(jī)性,為信息的查詢、檢索、匯總統(tǒng)計(jì)提供了豐富的線索。五是使得信息采集、編輯工作更加高效,例如對(duì)于一則標(biāo)題為“荔枝農(nóng)莊新景象,現(xiàn)摘現(xiàn)買又觀光”的信息,同時(shí)兼有新聞、市場(chǎng)行情、休閑觀光等性質(zhì),既可以放在水果欄目又可以放在新聞欄目,按傳統(tǒng)的分類方法,經(jīng)常會(huì)給網(wǎng)站信息工作者帶來煩惱和隨意性。而按網(wǎng)狀結(jié)構(gòu)分類方法,將荔枝專欄作為該則信息的宿主欄目,同時(shí)為其附加上新聞、市場(chǎng)、觀光、圖片等維度的屬性標(biāo)記,再通過一定的信息呈現(xiàn)技術(shù)手段,使得信息瀏覽者在相關(guān)欄目下也能獲取該則信息。
6結(jié)語
農(nóng)業(yè)信息化建設(shè)在全國(guó)范圍內(nèi)取得如此迅速的發(fā)展,在很大的程度上得益于國(guó)家同時(shí)對(duì)農(nóng)業(yè)基礎(chǔ)設(shè)施和IT產(chǎn)業(yè)的大力投入[7-8]。從基礎(chǔ)設(shè)施的建設(shè)規(guī)模來看,確實(shí)取得了長(zhǎng)足的發(fā)展,許多邊遠(yuǎn)山區(qū)都得到了信息服務(wù)的延伸和覆蓋。但基于目前大多數(shù)農(nóng)業(yè)信息系統(tǒng)的發(fā)展現(xiàn)狀,我國(guó)的農(nóng)業(yè)信息服務(wù)水平在功能與效用方面還處在粗放型的階段?;诰W(wǎng)狀結(jié)構(gòu)的信息分類技術(shù)為如何進(jìn)行農(nóng)業(yè)信息資源的深度數(shù)據(jù)挖掘和開發(fā)利用提出了解決思路,在分類技術(shù)上提出了更加適合于我國(guó)農(nóng)業(yè)信息資源體系建設(shè)的解決方案。
7參考文獻(xiàn)
[1] 王法英,孫銳.中國(guó)農(nóng)業(yè)網(wǎng)站基本情況分析報(bào)告[EB/OL].(2009-10-16)[2010-11-03]..
[2] 搭建信息化平臺(tái)推進(jìn)新農(nóng)村建設(shè)[EB/OL].(2010-03-18)[2010-06-20].省略/art/184371201003/8/2015483-1.html.
[3] 國(guó)務(wù)院.GB7635.全國(guó)工農(nóng)業(yè)產(chǎn)品(商品、物資)分類與代碼(國(guó)家標(biāo)準(zhǔn)GB7635-87)[S].北京:中國(guó)標(biāo)準(zhǔn)出版社,1987.
[4] 王健,甘國(guó)輝.多維農(nóng)業(yè)信息分類體系[J].農(nóng)業(yè)工程學(xué)報(bào),2004,20(4):152-155.
[5] 嚴(yán)方.試論互聯(lián)網(wǎng)農(nóng)業(yè)信息分類的原則和方法[J].安徽農(nóng)業(yè)科學(xué),2007.
[6] 羅德一.農(nóng)業(yè)網(wǎng)絡(luò)信息分類體系初探[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2010(8):84-87.
[7] 牛振國(guó),崔偉宏,符海芳.多維網(wǎng)絡(luò)農(nóng)業(yè)信息分類框架的初步研究[J].農(nóng)業(yè)系統(tǒng)科學(xué)與綜合研究,2003,19(4):274-277.
[8] 郭書普.網(wǎng)絡(luò)農(nóng)業(yè)信息分類和編碼的研究[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2003(6):139-141.
【關(guān)鍵詞】集控站;信息;優(yōu)化
1.前言
隨著集控站在全省范圍內(nèi)的逐步推廣和使用,遠(yuǎn)動(dòng)自動(dòng)化信息優(yōu)化意義重大。從集控站和電網(wǎng)調(diào)度關(guān)系的層面來說,變電站事故主要由集控站監(jiān)控人員進(jìn)行決策、判斷和處理,電網(wǎng)調(diào)度負(fù)責(zé)整個(gè)電網(wǎng)運(yùn)行方式執(zhí)行及事故決策和處理。
2.集控站遠(yuǎn)動(dòng)自動(dòng)化信息分層分類范圍和目標(biāo)
本文以沱河集控站為例,進(jìn)行集控站自動(dòng)化系統(tǒng)信息優(yōu)化,實(shí)現(xiàn)遠(yuǎn)動(dòng)自動(dòng)化信息分層分類。
遠(yuǎn)動(dòng)自動(dòng)化信息性質(zhì)層面上的分層分類。根據(jù)電網(wǎng)信息的重要性,集控站自動(dòng)化系統(tǒng)需將電網(wǎng)事故、異常信息按不同類別在告警窗口上分類顯示;編制遠(yuǎn)動(dòng)自動(dòng)化信息分類規(guī)范,為今后變電站自動(dòng)化信息接入范圍提供標(biāo)準(zhǔn)。
集控站用戶界面層面上的信息分類。編制典型的用戶交互界面,為集控站監(jiān)控人員進(jìn)變電站的設(shè)備巡視和事故處理,提供方便、快捷的手段。事故處理時(shí),能依據(jù)事故來源進(jìn)行迅速溯源。通過事故告警,定位變電站一、二次系統(tǒng),通過一二次設(shè)備的關(guān)聯(lián)信息,使運(yùn)行值班人員迅速定位事故發(fā)生地點(diǎn)。
3.遠(yuǎn)動(dòng)自動(dòng)化信息分層分類的主要做法
3.1變電站自動(dòng)化信息分類
將變電站運(yùn)行信息分為四種基本類型:事故信號(hào)、第一類告警、第二類告警及第三類告警。
事故信號(hào):事故信號(hào)事故總,保護(hù)、自動(dòng)裝置動(dòng)作,斷路器跳閘信號(hào)
第一類告警:設(shè)備故障告警,異常運(yùn)行或過負(fù)荷等信號(hào);第二類告警:系統(tǒng)波動(dòng)干擾,參數(shù)越線等信號(hào);第三類告警:正常運(yùn)行信號(hào),操作信息、主變調(diào)節(jié)分接頭,特殊控制等。
將變電站一、二次設(shè)備狀態(tài)、動(dòng)作信號(hào)進(jìn)行分類,在變電站新建、改造時(shí),該分類作為該變電站遠(yuǎn)動(dòng)基本的和必需接入的信息。
事故類:變壓器各種電氣量保護(hù)動(dòng)作、保護(hù)出口信息;變壓器各種非電氣量保護(hù)動(dòng)作及保護(hù)出口信息;變壓器開關(guān)變位信息;開關(guān)各種保護(hù)動(dòng)作、保護(hù)出口信息、開關(guān)變位信息;壓變二次空氣開關(guān)跳、壓變二次回路斷線;所用變低壓總開關(guān)跳及故障;直流系統(tǒng)接地及交流輸入輸出故障
第一類告警:變壓器過負(fù)荷、油位高低、壓力釋放動(dòng)作、保護(hù)裝置告警、閉鎖調(diào)壓、超溫、冷卻裝置故障類的信息、冷卻裝置電源故障;開關(guān)控制回路斷線、彈簧未儲(chǔ)能、氣體壓力低類、氣壓低閉鎖操作類、液 壓機(jī)構(gòu)壓力低、保護(hù)裝置異常告警、液壓機(jī)構(gòu)壓力低、保護(hù)裝置異常告警、保護(hù)閉鎖、機(jī)構(gòu)箱內(nèi)的各種異常告警信息;電壓回路斷線、電流回路斷線、互感器氣壓低、互感器需補(bǔ)氣等信息、計(jì)量用電壓 消失、保護(hù)用電壓消失;交直流回路缺相等、交流系統(tǒng)設(shè)備運(yùn)行故障告警
第二類告警:各級(jí)母線電壓越線
第三類告警:遙控操作信息、正常操作開關(guān)變位信息、主變分接頭調(diào)節(jié)信息、刀閘變位信息、壓變二次并列信息、保護(hù)裝置及遠(yuǎn)動(dòng)裝置上的操作信息、遠(yuǎn)動(dòng)及監(jiān)控系統(tǒng)運(yùn)行信息、開關(guān)把手遠(yuǎn)方就地信息、變壓器冷卻裝置運(yùn)行
3.2集控站用戶界面層面上的信息分類
在集控站自動(dòng)化系統(tǒng)上,通過信號(hào)關(guān)聯(lián)和畫面制作,完成典型用戶交互界面的編制。
變電站正常運(yùn)行時(shí),顯示綠色,發(fā)生事故或告警時(shí),該變電站時(shí)顯示為紅色。分類依據(jù):以每個(gè)變電站分別定義為獨(dú)立的信息對(duì)象個(gè)體,當(dāng)該站任何動(dòng)作事件而沒有復(fù)歸確認(rèn)時(shí),光子牌信號(hào)顯示紅色。點(diǎn)擊某個(gè)變電站則進(jìn)入該站的平面布置圖。
某變電站發(fā)生事故或告警時(shí),顯示該變電站平面圖內(nèi)。變電站平面圖內(nèi)容包括:主控制室、110kV設(shè)備區(qū)、35kV設(shè)備區(qū)、1#主變?cè)O(shè)備區(qū)、2#主變?cè)O(shè)備區(qū)、10kV開關(guān)室等,每個(gè)設(shè)備區(qū)內(nèi)均顯示各間隔的運(yùn)行狀態(tài),異常時(shí),該設(shè)備區(qū)某間隔光子牌顯示為紅色。點(diǎn)擊某個(gè)設(shè)備區(qū),則以彈出式窗體,列出該設(shè)備區(qū)內(nèi)各間隔所有信號(hào)狀態(tài)。其中,為了事故處理時(shí)能及時(shí)掌握現(xiàn)場(chǎng)情況,加入了“微機(jī)保護(hù)動(dòng)作查詢”功能。需要一提的是,所有二次設(shè)備信號(hào)均歸類到相應(yīng)的一次設(shè)備間隔內(nèi),目的是減少監(jiān)控人員操作畫面的次數(shù),以提高事故處理的效率。
3.2.1開關(guān)類
進(jìn)入該區(qū)域后,系統(tǒng)將按照一次開關(guān)等設(shè)備間隔,顯示該開關(guān)及其機(jī)構(gòu)的狀態(tài)信息。
信息分類規(guī)則:按設(shè)備間隔(110kV變電站開關(guān)類間隔信息內(nèi)容)
開關(guān)機(jī)構(gòu)異常類:開關(guān)彈簧未儲(chǔ)能、氣體壓力低類、氣壓低閉鎖操作類、液壓機(jī)構(gòu)壓力低、保護(hù)閉鎖、機(jī)構(gòu)箱內(nèi)的各種異常告警信息、開關(guān)狀態(tài)信息
保護(hù)動(dòng)作類:開關(guān)控制回路斷線、兩側(cè)刀閘狀態(tài)、保護(hù)裝置異常告警、保護(hù)閉鎖、保護(hù)電壓消失、各種保護(hù)動(dòng)作及出口信息、保護(hù)裝置的操作信息、遠(yuǎn)控/就地把手狀態(tài)
互感器類:電壓互感器的低壓空氣開關(guān)跳、互感器氣壓低、互感器需補(bǔ)氣等信息、計(jì)量用電壓消失兩側(cè)刀閘狀態(tài)、壓變二次并列、PT失壓、二次回路斷線等狀態(tài)信息
3.2.2主變?cè)O(shè)備區(qū),按照變壓器本體及保護(hù)兩類按照變壓器間隔合并歸類變壓器本體動(dòng)作類:油位高低、壓力釋放動(dòng)作、閉鎖調(diào)壓、超溫、冷卻裝置故障類的信息、冷卻裝置電源故障、有載調(diào)壓裝置故障類的信息、有載調(diào)壓裝置電源故障、中性點(diǎn)刀閘位置等變壓器保護(hù)動(dòng)作類:過負(fù)荷、各種電氣量保護(hù)動(dòng)作及保護(hù)出口信息、各種非電氣量保護(hù)動(dòng)作及保護(hù)出口信息、變位信息
3.2.3交、直流設(shè)備類型
交流系統(tǒng):所用電電源故障、所用電空氣開關(guān)跳等信號(hào)
直流系統(tǒng):電壓過高、電壓過低、母線接地、充電機(jī)故障、直流系統(tǒng)交流失電等狀態(tài)以及異常信息
4.推廣應(yīng)用
通過集控站遠(yuǎn)動(dòng)自動(dòng)化信息優(yōu)化,提高電網(wǎng)監(jiān)控效、減少電網(wǎng)故障處理時(shí)間,有利于保障電網(wǎng)安全可靠運(yùn)行。在集控站自動(dòng)化系統(tǒng)上,通過信號(hào)關(guān)聯(lián)和畫面制作,完成受控站典型用戶交互界面的編制。
某變電站發(fā)生事故或告警時(shí),顯示該變電站平面圖內(nèi)。變電站平面圖內(nèi)容包括:主控制室、設(shè)備區(qū)、主變?cè)O(shè)備區(qū)、開關(guān)室等,每個(gè)設(shè)備區(qū)內(nèi)均顯示各間隔的運(yùn)行狀態(tài),異常時(shí),該設(shè)備區(qū)某間隔光子牌顯示為紅色。信息分類依據(jù):以每個(gè)設(shè)備區(qū)內(nèi)設(shè)備間隔定義為獨(dú)立的信息對(duì)象個(gè)體,當(dāng)該設(shè)備間隔內(nèi)任何動(dòng)作事件而沒有復(fù)歸確認(rèn)時(shí),光字牌信號(hào)顯示紅色,點(diǎn)擊某個(gè)設(shè)備區(qū),則以彈出式窗體,列出該設(shè)備區(qū)內(nèi)各間隔所有信號(hào)狀態(tài)。其中,為了事故處理時(shí)能及時(shí)掌握現(xiàn)場(chǎng)情況,加入了“微機(jī)保護(hù)動(dòng)作查詢”功能。需要一提的是,所有二次設(shè)備信號(hào)均歸類到相應(yīng)的一次設(shè)備間隔內(nèi),目的是減少監(jiān)控人員操作畫面的次數(shù),以提高事故處理的效率。
由于二次保護(hù)部分已歸類到相應(yīng)的一次設(shè)備間隔中去,主制室設(shè)備區(qū)主要包含交流系統(tǒng)、以及直流系統(tǒng)等類型。分類依據(jù):按交、直流設(shè)備類型。
【關(guān)鍵詞】網(wǎng)頁;分類;www;林產(chǎn)品;TF-IDF;SVM
1.引言
根據(jù)中國(guó)互聯(lián)網(wǎng)信息中心(CNNIC)的最新數(shù)據(jù)顯示,截止到2013年12月底,中國(guó)網(wǎng)民數(shù)量達(dá)到6.18億,國(guó)內(nèi)網(wǎng)站達(dá)到320萬個(gè),伴隨著互聯(lián)網(wǎng)的迅速普及,我國(guó)的林產(chǎn)品貿(mào)易信息類網(wǎng)站也日益成熟,林產(chǎn)品貿(mào)易信息的數(shù)量急劇增加,用戶面對(duì)海量的數(shù)據(jù)信息很容易產(chǎn)生信息迷航,針對(duì)這些問題林產(chǎn)品貿(mào)易信息聚合網(wǎng)站應(yīng)運(yùn)而生。此類網(wǎng)站通過爬蟲程序?qū)⒎稚⒃诨ヂ?lián)網(wǎng)上各個(gè)站點(diǎn)上的林產(chǎn)品貿(mào)易信息進(jìn)行匯總,但是不同林產(chǎn)品貿(mào)易網(wǎng)站之間的分類體系差別巨大[5],如何將匯總的信息按照統(tǒng)一的分類體系進(jìn)行劃分,以便為用戶提供快速的導(dǎo)航式查詢成為林產(chǎn)品貿(mào)易信息服務(wù)中的重要一環(huán)。本文選取了SVM作為分類器。SVM是Vapnik等人在多年研究統(tǒng)計(jì)學(xué)習(xí)理論基礎(chǔ)上對(duì)線性分類器提出的一種機(jī)器學(xué)習(xí)方法。SVM的主要思想可以概括為兩點(diǎn):(1)它是針對(duì)線性可分情況進(jìn)行分析,對(duì)于線性不可分的情況,通過使用非線性映射算法將低維輸入空間線性不可分的樣本轉(zhuǎn)化為高維特征空間使其線性可分,從而使得高維特征空間采用線性算法對(duì)樣本的非線性特征進(jìn)行線性分析成為可能;(2)它基于結(jié)構(gòu)風(fēng)險(xiǎn)最小化理論之上在特征空間中建構(gòu)最優(yōu)分割超平面,使得學(xué)習(xí)器得到全局最優(yōu)化,并且在整個(gè)樣本空間的期望風(fēng)險(xiǎn)以某個(gè)概率滿足一定上界。
2.林產(chǎn)品貿(mào)易信息分類系統(tǒng)設(shè)計(jì)
2.1 林產(chǎn)品貿(mào)易信息分類系統(tǒng)流程
林產(chǎn)品貿(mào)易信息分類過程包含樣本訓(xùn)練和分類兩個(gè)階段,兩個(gè)階段的共同之處是都需要對(duì)HTML頁面進(jìn)行預(yù)處理并對(duì)處理后的文本進(jìn)行分詞。訓(xùn)練時(shí)通過特征選擇,生成特征向量,最后得到分類模型;分類時(shí)先生成特征向量,利用分類模型進(jìn)行分類,最后得到分類結(jié)果[1]。
2.2 HTML解析
HTML文檔中包含大量與林產(chǎn)品貿(mào)易信息無關(guān)的文本,因此在進(jìn)行分類之前先要去掉與網(wǎng)頁分類無關(guān)的html代碼,將網(wǎng)頁文本抽出。HTML文檔中等標(biāo)簽中用來描述網(wǎng)頁的表現(xiàn)形式,與網(wǎng)頁的具體內(nèi)容無關(guān),因此可以直接去除。另外,在林產(chǎn)品貿(mào)易信息頁面中,噪音信息多為導(dǎo)航和廣告連接,通過去除HTML文檔中的鏈接文字可以有效的去除網(wǎng)頁中的噪音信息。
圖1 分類流程設(shè)計(jì)
2.3 訓(xùn)練樣本分詞
分詞的目的是將文檔分割成一個(gè)個(gè)的單詞。一般可以將所有樣本的詞都提取出來作為特征集,默認(rèn)情況下,所有詞的權(quán)重都是等同的。分詞完成之后就要去除"停用詞"了。所謂的"停用詞"是那些沒有意義的詞語,他們對(duì)文本分類沒有貢獻(xiàn),比如說各種標(biāo)點(diǎn)符號(hào),今后、今天、今年這樣的詞語等。去掉這些沒有作用的詞語可以減少文本特征集的元素?cái)?shù),從而減少不必要的運(yùn)算量。本文中使用的分詞工具為ICTCLAS。
2.4 生成特征向量
生成特征向量前首先要進(jìn)行特征選擇。特征選擇是就是依據(jù)某種權(quán)重計(jì)算公式從詞典中選擇一些有代表性的詞。常用的特征選擇的方法有很多種,例如:Chi、Mutual Inform-ation、Information Gain和TF-IDF[2]。
本文利用TF-IDF方法進(jìn)行特征選擇。TF-IDF是一種統(tǒng)計(jì)方法,用以評(píng)估一個(gè)字或一個(gè)詞對(duì)于一個(gè)文件集或一個(gè)語料庫(kù)中的其中一份文件的重要程度。字詞的重要性隨著它在文件中出現(xiàn)的次數(shù)成正比增加,但同時(shí)會(huì)隨著它在語料庫(kù)中出現(xiàn)的頻率成反比下降。特征項(xiàng)在文檔中的權(quán)重可以根據(jù)公式(1)進(jìn)行計(jì)算[4]。
(1)
其中tfi(d)為ti在文檔d中出現(xiàn)的頻率,N為文檔集中的總文檔數(shù),nk為出現(xiàn)特征向量tk的次數(shù)。
2.5 生成分類模型
將文本轉(zhuǎn)換為向量后,后面要做的工作就是利用SVM算法進(jìn)行樣本訓(xùn)練了。SVM算法本質(zhì)是二類分類器,為解決多分類問題目前常采用的方法是one-against-rest[3]。本文使用Libsvm構(gòu)建SVM分類器。Libsvm是一個(gè)簡(jiǎn)單、易于使用和快速有效的SVM分類工具。使用時(shí)直接輸入訓(xùn)練樣本,并配置相應(yīng)參數(shù),即可進(jìn)行模型及預(yù)測(cè)。
3.實(shí)驗(yàn)及結(jié)果分析
本文從采集了10個(gè)類別共5000個(gè)網(wǎng)頁,每個(gè)類別隨機(jī)抽取3/5作為訓(xùn)練樣本,余下的2/5作為測(cè)試集,如表1所示。
表1 實(shí)驗(yàn)數(shù)據(jù)
類別 訓(xùn)練集網(wǎng)頁數(shù) 測(cè)試集網(wǎng)頁數(shù) 網(wǎng)頁總數(shù) 類別 訓(xùn)練集網(wǎng)頁數(shù) 測(cè)試集網(wǎng)頁數(shù) 網(wǎng)頁總數(shù)
樺木 300 200 500 膠合板 300 200 500
松木 300 200 500 防火板 300 200 500
紅木 300 200 500 纖維板 300 200 500
楊木 300 200 500 密度板 300 200 500
榆木 300 200 500 刨花板 300 200 500
本文中用于評(píng)估的兩個(gè)指標(biāo)分別是準(zhǔn)確率(Precision)和召回率(Recall)。其數(shù)學(xué)定義如下:
準(zhǔn)確率:;
召回率:,
其中,Np是分類器預(yù)測(cè)為C類的文檔數(shù),Nc是實(shí)際屬于C類的文檔數(shù),Ncp是正確分類的文檔數(shù)。
圖2 實(shí)驗(yàn)結(jié)果分析
由圖2可見P,R以及F值均較高,說明該方法在應(yīng)用在林產(chǎn)品貿(mào)易Web信息分類時(shí)較為有效。
參考文獻(xiàn)
[1]段軍峰,黃維通,陸玉昌.中文網(wǎng)頁分類研究與系統(tǒng)實(shí)現(xiàn)[J].計(jì)算機(jī)科學(xué),2007,34(6):210-213.
[2]孫建濤,沈抖,陸玉昌,等.網(wǎng)頁分類技術(shù)[J].清華大學(xué)學(xué)報(bào):自然科學(xué)版,2004,44(1):65-68.
[3]許世明,武波,馬翠,等.一種基于預(yù)分類的高效SVM中文網(wǎng)頁分類器[J].計(jì)算機(jī)工程與應(yīng)用,2010(1):125-128.
[4]王美方,劉培玉,朱振方.基于TFIDF的特征選擇方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2008,28(23):5795-5796.
[5]陳劍.林產(chǎn)品貿(mào)易信息推送的文本信息過濾技術(shù)的研究[D].北京林業(yè)大學(xué),2012.
基金項(xiàng)目:中央高?;究蒲袠I(yè)務(wù)費(fèi)專項(xiàng)基金資助項(xiàng)目“多元異構(gòu)林產(chǎn)品信息推送平臺(tái)研究與實(shí)踐”(項(xiàng)目編號(hào):BLYX200928)。
【關(guān)鍵詞】信息;審核;分析;加工;存儲(chǔ)共享
信息采集是信息內(nèi)容和信息應(yīng)用業(yè)務(wù)發(fā)展的基礎(chǔ),通過采集大量真實(shí)、有效的客戶信息、供求信息、交易信息等,可以有效促進(jìn)網(wǎng)絡(luò)商務(wù)的發(fā)展,成功的網(wǎng)絡(luò)商務(wù)交易,同樣可以增強(qiáng)客戶對(duì)信息的渴求,對(duì)網(wǎng)絡(luò)的黏性,提升了信息采集的針對(duì)性、目的性,使采集的信息更準(zhǔn)確、更具市場(chǎng)價(jià)值。因此,實(shí)施信息采集、發(fā)展網(wǎng)絡(luò)商務(wù),開辟并建立起直接面向客戶與市場(chǎng)需求的信息采集渠道,建立健全信息采集、分類、審核、加工、的信息內(nèi)容服務(wù)保障體系和網(wǎng)絡(luò)商務(wù)運(yùn)營(yíng)體系,是企業(yè)價(jià)值極大提升的關(guān)鍵工作。
一、信息采集的組織架構(gòu)
以客戶為中心,利用渠道優(yōu)勢(shì)、客戶資源優(yōu)勢(shì),從省、市、縣三級(jí)設(shè)立專職人員從事省級(jí)信源的規(guī)劃、采集、審核、錄入、加工、分析、、共享等工作。
二、信息采集的渠道
可通過客戶經(jīng)理、營(yíng)業(yè)廳、農(nóng)村信息服務(wù)站、社區(qū)、呼叫中心坐席、互聯(lián)網(wǎng)、合作渠道、經(jīng)紀(jì)人采集信息。
1.采集對(duì)象
所有產(chǎn)業(yè)活動(dòng)的單位、個(gè)體經(jīng)營(yíng)戶、鄉(xiāng)鎮(zhèn)企業(yè),都是信息采集的目標(biāo)客戶,包括所有的在網(wǎng)客戶與異網(wǎng)客戶、所有的企業(yè)客戶與農(nóng)村客戶。從需求上分為客戶需求和市場(chǎng)需求兩種:
客戶需求為:客戶主動(dòng)各類信息(以供求信息為主)達(dá)到宣傳自身或其產(chǎn)品的目的。采集對(duì)象的確定以客戶意愿為準(zhǔn),只要客戶的資質(zhì)及其產(chǎn)品符合要求和規(guī)定,即可確定為采集對(duì)象。
市場(chǎng)需求為:客戶對(duì)此信息有查詢、搜索需求。采集對(duì)象的確定遵循以市場(chǎng)為導(dǎo)向,以客戶為關(guān)注焦點(diǎn)的原則,即:通過分析公眾客戶對(duì)信息的需求程度和客戶數(shù)量,達(dá)到公眾客戶總量的0.5%-1%,即可確定為采集對(duì)象。如公交信息、票務(wù)信息、天氣預(yù)報(bào)、市場(chǎng)行情等。
2.采集內(nèi)容
基本信息:企業(yè)名稱、通信地址、聯(lián)系人、聯(lián)系電話、郵編等客戶基礎(chǔ)信息。
資質(zhì)信息:各類專業(yè)資質(zhì)、工商執(zhí)照、稅務(wù)登記證明等能夠證明客戶合法、合規(guī)和具備相關(guān)行業(yè)的資質(zhì)證明等信息資料。
供求信息:企業(yè)供應(yīng)或需求的各類產(chǎn)品及服務(wù)信息,如產(chǎn)品信息、企業(yè)LOGO、多媒體播放信息等。
3.信息分類標(biāo)準(zhǔn)
可依據(jù)國(guó)家統(tǒng)計(jì)局行業(yè)劃分標(biāo)準(zhǔn)《國(guó)民經(jīng)濟(jì)行業(yè)分類》和相關(guān)編碼規(guī)范,參考業(yè)界行業(yè)分類現(xiàn)狀,結(jié)合通信行業(yè)特點(diǎn),對(duì)比各業(yè)務(wù)平臺(tái)分類情況,將行業(yè)分類標(biāo)準(zhǔn)統(tǒng)一。
4.信息采集標(biāo)準(zhǔn)
必須遵循及時(shí)性、準(zhǔn)確性、有效性、系統(tǒng)性、適用性、完整性等標(biāo)準(zhǔn)。
5.信息標(biāo)準(zhǔn)要求
客戶信息存放到數(shù)據(jù)庫(kù)中,除企業(yè)名稱、通信地址、聯(lián)系人、聯(lián)系電話、郵編等基本信息外,還包各類專業(yè)資質(zhì)、工商執(zhí)照、稅務(wù)登記證明、產(chǎn)品信息、提供服務(wù)等資質(zhì)信息、供求信息,除此之外都要有城市編碼、分類代碼,表明客戶所在城市和行業(yè)分類。
三、信息內(nèi)容的審核
設(shè)置初審和終審兩級(jí)審核機(jī)制,審核信息內(nèi)容的準(zhǔn)確性、安全性、有效性、時(shí)效性、完整性,保證信息內(nèi)容的合法性。
(一)審核規(guī)范
1.根據(jù)相關(guān)法律、法規(guī),退回禁止銷售和涉及侵權(quán)及假冒的信息;
2.審核所填資料的真實(shí)性,如有必要,需提供證明文件,如出現(xiàn)其他公司名稱等情況;
3.審核信息和圖片的相關(guān)性,不允許圖文不符的信息;
4.審核信息是否為信息采集對(duì)象的內(nèi)容;
5.審核信息是否在采集內(nèi)容和信息分類范圍內(nèi),不符合標(biāo)準(zhǔn)的信息應(yīng)不在信息采集庫(kù)中;
6.審核的信息分類是否正確;
7.判斷產(chǎn)品是否含欺詐、偽造成份;
8.審核信息是否符合采集標(biāo)準(zhǔn)及要求。
(二)審核步驟
1.初步審核。由信息采集人員或各采集點(diǎn)專(兼)職審核人員對(duì)采集信息內(nèi)容的權(quán)威性、真實(shí)性、準(zhǔn)確性、時(shí)效性、安全性和信息在前臺(tái)頁面展現(xiàn)形式的合理性進(jìn)行初步的審核。
2.最終審核。由專職信息審核員對(duì)錄入的信息內(nèi)容進(jìn)行甄別、篩選、加工等,確保信息的權(quán)威性、真實(shí)性、準(zhǔn)確性、時(shí)效性、安全性并提交(參照審核規(guī)范)。
3.對(duì)用戶修改的信息進(jìn)行初審和終審,遵循上述兩個(gè)步驟。
(三)審核時(shí)限
信息初審要求0.5個(gè)工作日審核完畢,并在2小時(shí)內(nèi)完成信息的錄入。
信息的終審、環(huán)節(jié)要求及時(shí)審核上傳的信息,信息處理時(shí)限為0.5個(gè)工作日內(nèi)完成信息的終審與。
對(duì)于客戶在網(wǎng)站上自主注冊(cè)錄入的信息,要求當(dāng)日內(nèi)處理且1小時(shí)內(nèi)完成審核及信息。
由管理人員對(duì)通過審核的信息進(jìn)行部分抽查,做到信息審核的精準(zhǔn)性,同時(shí)也對(duì)相關(guān)人員進(jìn)行監(jiān)督檢查。
四、信息內(nèi)容的分析加工
對(duì)收集的信息進(jìn)行梳理、研究并深度加工的過程,包括對(duì)信息整理研究結(jié)果的表達(dá)以及價(jià)值評(píng)價(jià)等,是信息廣泛應(yīng)用的基礎(chǔ)和前提。
按內(nèi)容分析,分析采集項(xiàng)的優(yōu)先級(jí)、必要性、精準(zhǔn)性;分類是否精準(zhǔn)、信息是否可以兼容分類等;對(duì)采集對(duì)象、內(nèi)容等的擴(kuò)展研究分析,分析是否加上某些信息項(xiàng)、是否修改或去掉某些信息項(xiàng)。
按區(qū)域分析信息數(shù)量,區(qū)域內(nèi)某一行業(yè)的信息數(shù)量。
按行業(yè)分析某一行業(yè)不同區(qū)域的信息數(shù)量。
按某信息項(xiàng)分析,如根據(jù)客戶信息內(nèi)容分析基本信息、供求信息等。
五、信息內(nèi)容的存儲(chǔ)、共享
信息的存儲(chǔ):分類、審核的信息加工、處理,歸集到數(shù)據(jù)庫(kù)中,便于各個(gè)業(yè)務(wù)平臺(tái)的信息調(diào)用及應(yīng)用。
信息的傳遞、:準(zhǔn)確地客戶信息,同時(shí)對(duì)重點(diǎn)關(guān)鍵的信息進(jìn)行深挖掘和深加工,提取具有市場(chǎng)價(jià)值的信息,通過共享、互通的方式傳遞給其他系統(tǒng)、渠道和崗位,針對(duì)客戶的需求開展信息的銷售。
六、信息內(nèi)容的應(yīng)用
1.信息應(yīng)用
通過對(duì)采集的數(shù)據(jù)進(jìn)行集中和整合,統(tǒng)一標(biāo)準(zhǔn)和定義,形成數(shù)據(jù)信息資源庫(kù),做好信息安全、保密工作,同時(shí)共享給各平臺(tái)提取所需數(shù)據(jù)。如:為黃頁業(yè)務(wù)發(fā)展提供客戶的基本信息,網(wǎng)絡(luò)商務(wù)應(yīng)用等。
2.信息評(píng)估
一、XBRL簡(jiǎn)介
可擴(kuò)展商業(yè)報(bào)告語言,簡(jiǎn)稱XBRL(ExtensibleBusinessReportingLanguage),是一種編制、公司財(cái)務(wù)報(bào)告和其他信息的標(biāo)準(zhǔn)化方法。實(shí)際上XBRL是一種平臺(tái)式的數(shù)據(jù)描述語言,他通過一種編譯來達(dá)到財(cái)務(wù)信息交流的目的,其實(shí)質(zhì)是會(huì)計(jì)信息的一種讀取方式。XBRL被廣泛應(yīng)用于財(cái)務(wù)報(bào)告、審計(jì)報(bào)告等方面,是現(xiàn)代財(cái)務(wù)信息管理的重要方法。
二、XBRL在會(huì)計(jì)信息標(biāo)準(zhǔn)化中的應(yīng)用
XBRL是會(huì)計(jì)信息標(biāo)準(zhǔn)化的重要推動(dòng)力和催化劑。由于XBRL的介入,會(huì)計(jì)信息標(biāo)準(zhǔn)化的步伐進(jìn)一步加快,財(cái)務(wù)信息處理的速度和效率、質(zhì)量都得到迅速的提高。
1、XBRL推動(dòng)了內(nèi)部控制標(biāo)準(zhǔn)化。會(huì)計(jì)信息標(biāo)準(zhǔn)化中的內(nèi)部控制標(biāo)準(zhǔn)化指的是組織通過制定財(cái)務(wù)相關(guān)的規(guī)章制度以及防控方法及流程,防止和減少會(huì)計(jì)遺漏、營(yíng)私舞弊等帶來的財(cái)務(wù)失真,保證財(cái)務(wù)信息的真實(shí)性和資產(chǎn)的安全、準(zhǔn)確。XBRL利用自身的標(biāo)準(zhǔn)化優(yōu)勢(shì)驅(qū)使組織按照其標(biāo)準(zhǔn)模式進(jìn)行操作,使財(cái)務(wù)會(huì)計(jì)信息控制更加透明化,增加可控制性,減少因人為或主觀因素導(dǎo)致的財(cái)務(wù)信息失真,進(jìn)而控制財(cái)務(wù)信息的內(nèi)部標(biāo)準(zhǔn)化。會(huì)計(jì)信息標(biāo)準(zhǔn)化的首要設(shè)計(jì)目標(biāo)就是內(nèi)部控制的標(biāo)準(zhǔn)化,其意義在于只有內(nèi)部形成統(tǒng)一的控制標(biāo)準(zhǔn)才能真正實(shí)現(xiàn)財(cái)務(wù)信息的可對(duì)比性和對(duì)查閱性。XBRL利用標(biāo)準(zhǔn)化的控制體系要求組織按照其標(biāo)準(zhǔn)執(zhí)行財(cái)務(wù)信息的標(biāo)準(zhǔn)統(tǒng)一控制,這在一定程度上來說使得組織內(nèi)部控制標(biāo)準(zhǔn)化得以實(shí)現(xiàn)。組織實(shí)施XBRL在無形中推動(dòng)了會(huì)計(jì)信息標(biāo)準(zhǔn)化的進(jìn)程。
2、XBRL推動(dòng)了會(huì)計(jì)流程和財(cái)務(wù)信息處理標(biāo)準(zhǔn)化。XBRL是一個(gè)完整的體系,它按照標(biāo)準(zhǔn)的流程來處理問題和實(shí)現(xiàn)財(cái)務(wù)信息的交換。而在會(huì)計(jì)信息標(biāo)準(zhǔn)化過程中,核心實(shí)現(xiàn)的是會(huì)計(jì)流程和財(cái)務(wù)信息處理的標(biāo)準(zhǔn)化。隨著組織的不斷擴(kuò)大和會(huì)計(jì)信息標(biāo)準(zhǔn)化的不斷加深,會(huì)計(jì)流程和財(cái)務(wù)信息處理的標(biāo)準(zhǔn)化逐步被提到議事日程上來,如何利用信息化手段實(shí)現(xiàn)會(huì)計(jì)流程和財(cái)務(wù)信息處理的標(biāo)準(zhǔn)化,有效防范會(huì)計(jì)風(fēng)險(xiǎn)成為一個(gè)重要的課題。XBRL在實(shí)施過程中利用自身標(biāo)準(zhǔn)化的優(yōu)勢(shì),為會(huì)計(jì)流程和財(cái)務(wù)信息處理的標(biāo)準(zhǔn)化提供了便利。
首先,會(huì)計(jì)流程標(biāo)準(zhǔn)化和財(cái)務(wù)信息處理標(biāo)準(zhǔn)化需要完整的標(biāo)準(zhǔn)化數(shù)據(jù)交換作為支撐,XBRL作為一種基于信息化條件下實(shí)現(xiàn)的數(shù)據(jù)交換及解析工具,具備了提供這種支撐的條件。會(huì)計(jì)流程標(biāo)準(zhǔn)化其實(shí)是會(huì)計(jì)流程再造的一種形式,其本質(zhì)在于在現(xiàn)代經(jīng)濟(jì)環(huán)境下實(shí)現(xiàn)會(huì)計(jì)流程的合理化和嚴(yán)謹(jǐn)化,規(guī)避會(huì)計(jì)流程風(fēng)險(xiǎn);財(cái)務(wù)信息處理的標(biāo)準(zhǔn)化是在原有的帳務(wù)處理以及財(cái)務(wù)數(shù)據(jù)及信息交換基礎(chǔ)上,轉(zhuǎn)變非結(jié)構(gòu)化財(cái)務(wù)信息的處理方式,逐步實(shí)現(xiàn)財(cái)務(wù)信息處理的規(guī)范化和標(biāo)準(zhǔn)化。XBRL利用自身規(guī)則要求會(huì)計(jì)流程和財(cái)務(wù)信息處理必須按照固定標(biāo)準(zhǔn)執(zhí)行,這就在根本上約束了會(huì)計(jì)流程和財(cái)務(wù)信息處理的隨意性。
其次,財(cái)務(wù)信息處理日益紛繁復(fù)雜,傳統(tǒng)的信息處理方式已經(jīng)無法滿足各部門對(duì)于財(cái)務(wù)信息的需求。傳統(tǒng)的財(cái)務(wù)信息處理難以實(shí)現(xiàn)共享,其他部門要使用還需要專門人員進(jìn)行翻譯。這就消耗了大量的人力和物力,并且在翻譯的過程中由于種種原因不免產(chǎn)生誤差和錯(cuò)誤,這就造成了財(cái)務(wù)信息的失真。另外,財(cái)務(wù)信息在處理過程中,由于審批、傳遞環(huán)節(jié)往往需要經(jīng)過不同的部門,各部門難以了解財(cái)務(wù)信息的真實(shí)意義,導(dǎo)致審批失效,達(dá)不到預(yù)期效果。因此,XBRL在財(cái)務(wù)信息處理過程中的應(yīng)用也就顯現(xiàn)的更加必要。將XBRL應(yīng)用于財(cái)務(wù)信息處理可以規(guī)范化各類財(cái)務(wù)報(bào)表和財(cái)務(wù)信息,使各部門實(shí)現(xiàn)共享,有效避免在審批和傳遞環(huán)節(jié)出現(xiàn)的失真和脫節(jié)現(xiàn)場(chǎng),實(shí)現(xiàn)財(cái)務(wù)信息的可重復(fù)利用性。
第三,非結(jié)構(gòu)性財(cái)務(wù)信息的處理日益成為會(huì)計(jì)信息標(biāo)準(zhǔn)化的一大障礙,消除這一障礙將有效促進(jìn)財(cái)務(wù)信息處理的標(biāo)準(zhǔn)化。合理利用XBRL,建立一整套的財(cái)務(wù)信息處理標(biāo)準(zhǔn),利用標(biāo)準(zhǔn)化的處理方式來解決非結(jié)構(gòu)性財(cái)務(wù)信息處理問題,將有利于非結(jié)構(gòu)化財(cái)務(wù)信息處理的結(jié)構(gòu)化處理,從而掃除財(cái)務(wù)信息處理標(biāo)準(zhǔn)化進(jìn)程上的一大障礙,保障其順利推進(jìn)。
第四.財(cái)務(wù)信息處理注重提高財(cái)務(wù)信息,尤其是會(huì)計(jì)信息的質(zhì)量,而這一質(zhì)量的提高需要依靠信息化的現(xiàn)代信息技術(shù)。傳統(tǒng)會(huì)計(jì)信息質(zhì)量往往通過投入大量人員進(jìn)行反復(fù)核算來實(shí)現(xiàn),不僅浪費(fèi)大量人力,還有可能造成會(huì)計(jì)信息的失真。XBRL作為信息交流的平臺(tái)類語言,其可以使用統(tǒng)一的標(biāo)準(zhǔn)來約束會(huì)計(jì)行為,從根本上杜絕會(huì)計(jì)信息質(zhì)量的失真。
3、XBRL促進(jìn)財(cái)務(wù)信息分類匯總的標(biāo)準(zhǔn)化。財(cái)務(wù)信息紛繁復(fù)雜,尤其是在現(xiàn)代商業(yè)模式和經(jīng)濟(jì)運(yùn)行水平下,財(cái)務(wù)信息的收集、整理和分析顯得更加重要。財(cái)務(wù)信息的分類匯總使得財(cái)務(wù)信息應(yīng)用更加方便,傳統(tǒng)的匯總手段多采用紙質(zhì)的檔案形式,在現(xiàn)代信息條件下,網(wǎng)絡(luò)和數(shù)據(jù)化存儲(chǔ)成為主流,新的財(cái)務(wù)信息分類匯總方式要求新的標(biāo)準(zhǔn)化流程來操作。XBRL在操作過程中要求財(cái)務(wù)信息分類匯總標(biāo)準(zhǔn)化的出現(xiàn),這在一定程度上促進(jìn)了其標(biāo)準(zhǔn)化的過程。
關(guān)鍵詞:知識(shí)管理 知識(shí)化監(jiān)理 知識(shí)結(jié)構(gòu)
信息工程監(jiān)理是最近幾年興起的保障信息化建設(shè)質(zhì)量的一種約束機(jī)制。它采用“五控兩管一協(xié)調(diào)”的控制模式,對(duì)業(yè)主、承建單位的項(xiàng)目行為實(shí)施監(jiān)督,保障信息化建設(shè)的質(zhì)量,避免“豆腐渣”工程,起著不可或缺的重要作用。
一、信息化建設(shè)與知識(shí)管理
信息化建設(shè)是以知識(shí)管理為核心,信息資源為基礎(chǔ),提高組織核心競(jìng)爭(zhēng)力為目的的全面整合或再造組織業(yè)務(wù)流程的過程。知識(shí)管理是獲取、儲(chǔ)存、學(xué)習(xí)、共享、創(chuàng)新知識(shí)的管理控制過程。在信息化建設(shè)中,企業(yè)、政府等組織通過知識(shí)管理,從現(xiàn)有的業(yè)務(wù)流程和數(shù)據(jù)中,挖掘、獲取并確定各類知識(shí)資源,定位擁有專業(yè)知識(shí)、經(jīng)驗(yàn)的個(gè)體,將個(gè)體的知識(shí)、經(jīng)驗(yàn)、信息提升為組織的知識(shí)資源,有序傳遞、整合、規(guī)劃和有效利用知識(shí)資源,有助于提高組織的整體業(yè)務(wù)、技術(shù)和管理水平。
在承建單位實(shí)施信息化建設(shè)中,知識(shí)管理是通過公司內(nèi)雇員、部門、可能的跨國(guó)公司合作、與業(yè)主的溝通協(xié)調(diào),傳遞、整合、有效利用本單位的知識(shí)資源,運(yùn)用信息技術(shù),通過設(shè)計(jì)最優(yōu)技術(shù)方案、控制施工質(zhì)量,共享和創(chuàng)造知識(shí)價(jià)值。
在信息化建設(shè)中,對(duì)組織內(nèi)各種各類知識(shí)進(jìn)行評(píng)估,挖掘、獲取真正有用的知識(shí)。知識(shí)不僅僅是信息,是顯性知識(shí)和隱性知識(shí)的集合。通過評(píng)估,區(qū)分知識(shí)和信息、知識(shí)管理和信息管理,以實(shí)現(xiàn)資源的充分開發(fā)與應(yīng)用。
整合或再造業(yè)務(wù)流程,是與知識(shí)管理密切相關(guān)的。1990年美國(guó)管理專家Michael Hammer提出了“業(yè)務(wù)流程重組”(Business Process ReengineeringBPR)的概念,它是以用戶需求為導(dǎo)向,信息化、知識(shí)化為基礎(chǔ),對(duì)用戶的業(yè)務(wù)流程進(jìn)行再思考、關(guān)鍵性的重新設(shè)計(jì)和根本的變革,從而獲得在成本、質(zhì)量、服務(wù)和速度等方面業(yè)績(jī)的持續(xù)改善。在業(yè)務(wù)流程重組中,信息(知識(shí))的獲取、分類、存儲(chǔ)、利用,只有與知識(shí)管理結(jié)合,才能夠發(fā)揮更有效的作用。
知識(shí)管理技術(shù)貫穿于信息化建設(shè)始終,它與信息技術(shù)相輔相成。在知識(shí)獲取、學(xué)習(xí)、共享、創(chuàng)新的過程中,整合各種信息技術(shù),構(gòu)建完整的知識(shí)管理體系,是知識(shí)經(jīng)濟(jì)時(shí)代信息技術(shù)的新發(fā)展。
二、信息資源規(guī)劃和整合
信息資源整合(Information Resource Integrating, IRI)的前提是進(jìn)行統(tǒng)一的信息資源規(guī)劃(Information Resource Planning, IRP),消除“信息孤島”,共享信息資源。信息資源的規(guī)劃是實(shí)施信息化工程的基礎(chǔ),IRP的基礎(chǔ)是建立信息資源管理基礎(chǔ)標(biāo)準(zhǔn),IRI的實(shí)質(zhì)是通過信息技術(shù)改造、重建或重構(gòu)數(shù)據(jù)環(huán)境。信息產(chǎn)業(yè)部的《信息系統(tǒng)工程監(jiān)理暫行規(guī)定》中定義信息資源系統(tǒng)為“以信息技術(shù)為主要手段建立的信息資源采集、儲(chǔ)存、處理的資源系統(tǒng)”。
在信息化建設(shè)中,信息資源規(guī)劃是很重要的一環(huán)。在組織的生產(chǎn)、經(jīng)營(yíng)、服務(wù)活動(dòng)中,會(huì)產(chǎn)生大量的數(shù)據(jù)、資料、指標(biāo)、圖紙、報(bào)表及其它顯性資源,也存在各種各類的知識(shí)、擁有專業(yè)知識(shí)和經(jīng)驗(yàn)的個(gè)體等隱性資源。信息資源規(guī)劃是對(duì)實(shí)施信息化后產(chǎn)生、控制、使用這些資源進(jìn)行識(shí)別和分類;評(píng)估、挖掘、獲取、共享各類知識(shí);對(duì)承載信息資源的信息基礎(chǔ)設(shè)施進(jìn)行分析、設(shè)計(jì)和指導(dǎo)。
(一)信息資源規(guī)劃的主要任務(wù)
信息資源規(guī)劃的任務(wù)是對(duì)支撐業(yè)務(wù)流程的邏輯相關(guān)的數(shù)據(jù)進(jìn)行分類,建立具有結(jié)構(gòu)化、標(biāo)準(zhǔn)化、一致性的共享數(shù)據(jù)庫(kù)。分析業(yè)務(wù)流程重組后產(chǎn)生、控制和使用的數(shù)據(jù),了解各種數(shù)據(jù)的內(nèi)容、范圍、可靠性等,理解數(shù)據(jù)的共享要求和應(yīng)用策略以及數(shù)據(jù)使用中的問題,使信息資源規(guī)劃能夠滿足數(shù)據(jù)資源的管理要求。
(二)信息資源管理標(biāo)準(zhǔn)
信息資源管理標(biāo)準(zhǔn)是指決定信息系統(tǒng)質(zhì)量的、進(jìn)行信息資源開發(fā)利用的基本標(biāo)準(zhǔn)。威廉·德雷爾1985年在其《數(shù)據(jù)管理》專著中總結(jié)了信息資源管理的基礎(chǔ)標(biāo)準(zhǔn)———數(shù)據(jù)管理五項(xiàng)標(biāo)準(zhǔn),內(nèi)容如下:
1.數(shù)據(jù)元素標(biāo)準(zhǔn)。數(shù)據(jù)元素(Data Elements)是信息資源中最小的信息單位,是抽象的數(shù)據(jù)對(duì)象。它的質(zhì)量是構(gòu)建穩(wěn)定的數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)的關(guān)鍵。數(shù)據(jù)元素標(biāo)準(zhǔn)包括數(shù)據(jù)元素命名標(biāo)準(zhǔn)、標(biāo)數(shù)據(jù)元素識(shí)標(biāo)準(zhǔn)和數(shù)據(jù)元素一致性標(biāo)準(zhǔn)。
2.信息分類編碼標(biāo)準(zhǔn)。是信息標(biāo)準(zhǔn)中的基礎(chǔ)標(biāo)準(zhǔn)。信息分類編碼(Information Classifying and Coding)的對(duì)象,是一些最重要的數(shù)據(jù)元素,自動(dòng)處理、檢索、存儲(chǔ)和傳輸信息的質(zhì)量及效率與這些元素緊密相關(guān)。信息分類是根據(jù)信息內(nèi)容的屬性或特征,將信息按一定的原則和方法進(jìn)行區(qū)分和歸類,并建立一定的分類系統(tǒng)和排列順序,便于管理和使用信息。信息編碼就是在信息分類的基礎(chǔ)上,將編碼對(duì)象賦予有一定規(guī)律性的、易于計(jì)算機(jī)和人識(shí)別和處理的符號(hào)。信息分類編碼工作要確定每個(gè)編碼對(duì)象的編碼規(guī)則、碼表結(jié)構(gòu)和代碼表。
3.用戶視圖標(biāo)準(zhǔn)。用戶視圖(User View)是一些數(shù)據(jù)元素的集合,表示用戶對(duì)信息需求和數(shù)據(jù)實(shí)體的最終解釋。用戶視圖是數(shù)據(jù)的系統(tǒng)外在表現(xiàn)形式,是系統(tǒng)的輸入、輸出媒介和手段。用戶視圖與外部數(shù)據(jù)流是同一詞,來自某個(gè)數(shù)據(jù)源或流向某個(gè)數(shù)據(jù)接收端的數(shù)據(jù)流。常用的用戶視圖有紙面的,如圖紙、單證、表單、報(bào)表、賬冊(cè)等;有電子的,如屏幕格式等。
4.概念數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)。概念數(shù)據(jù)庫(kù)(Conceptual Database)是用戶對(duì)數(shù)據(jù)存儲(chǔ)的最終解釋。用戶的信息需求,應(yīng)首先界定概念數(shù)據(jù)庫(kù)。概念數(shù)據(jù)庫(kù)是綜合信息資源用戶的數(shù)據(jù)要求構(gòu)成的全局?jǐn)?shù)據(jù)庫(kù),表示數(shù)據(jù)庫(kù)的整體數(shù)據(jù)組織狀況和邏輯結(jié)構(gòu)。
5.邏輯數(shù)據(jù)庫(kù)標(biāo)準(zhǔn)。邏輯數(shù)據(jù)庫(kù)(Logical Database)是系統(tǒng)分析設(shè)計(jì)人員的解釋。在關(guān)系數(shù)據(jù)庫(kù)模型中,邏輯數(shù)據(jù)庫(kù)是一組規(guī)范化的基本表(Base Table),是從概念數(shù)據(jù)庫(kù)中映射出的所需信息。邏輯數(shù)據(jù)庫(kù)表示的是局部數(shù)據(jù)的數(shù)據(jù)庫(kù)邏輯結(jié)構(gòu)。
(三)信息資源規(guī)劃方案
在定義數(shù)據(jù)管理標(biāo)準(zhǔn)的基礎(chǔ)上,制定信息資源規(guī)劃方案,為業(yè)務(wù)流程重組提供依據(jù),為系統(tǒng)設(shè)計(jì)提供基礎(chǔ)。
在信息資源規(guī)劃中,將隱性資源轉(zhuǎn)變?yōu)轱@性資源,有序傳遞、整合、規(guī)劃和有效利用各類知識(shí)資源。因此,信息資源規(guī)劃是資源的知識(shí)管理規(guī)劃。信息技術(shù)的投資,可能不會(huì)給企業(yè)帶來明顯的效益,因?yàn)榛谛畔⒌母?jìng)爭(zhēng)優(yōu)勢(shì)正在逐漸轉(zhuǎn)變?yōu)榛谥R(shí)管理的競(jìng)爭(zhēng)優(yōu)勢(shì),以信息資源規(guī)劃為核心的信息系統(tǒng)規(guī)劃,如果不實(shí)施知識(shí)管理,將不會(huì)產(chǎn)生顯著的信息化效益。
(四)資源整合
資源整合是信息資源規(guī)劃的關(guān)鍵。不僅僅信息整合,也包括各類顯性、隱性知識(shí)的整合。如何在整合各類知識(shí)資源中創(chuàng)新,是信息資源規(guī)劃的主要目的。在資源規(guī)劃中,既要考慮信息化建設(shè)前期的知識(shí)挖掘、分類、整合;也要考慮信息化實(shí)施過程中形成的各類資源的收集、分類、整合,如何有序傳遞、有效利用;
還應(yīng)考慮后信息化應(yīng)用過程中將要形成的分散的、孤立的、相互關(guān)聯(lián)的各類資源的整合。通過資源整合,實(shí)現(xiàn)資源最大可能的高度共享和有效利用,使內(nèi)容和服務(wù)提升到新的高度,消滅大量存在的“信息孤島”或“信息煙囪”,獲得信息價(jià)值的最大化;使信息技術(shù)的投資獲得增量,將潛在價(jià)值轉(zhuǎn)變?yōu)槠髽I(yè)發(fā)展的動(dòng)力。
三、基于知識(shí)管理的信息工程監(jiān)理
在信息化建設(shè)中,采用全面質(zhì)量管理的思想。實(shí)施全面質(zhì)量管理,是信息工程監(jiān)理的控制目標(biāo)。美國(guó)質(zhì)量管理專家費(fèi)根鮑姆(A. V. Fergenbaum)于20世紀(jì)60年代提出的全面質(zhì)量管理思想,是隨著科學(xué)技術(shù)的發(fā)展和經(jīng)營(yíng)管理的需要逐步發(fā)展起來的現(xiàn)代化質(zhì)量管理學(xué)科。其深刻內(nèi)涵已經(jīng)遠(yuǎn)遠(yuǎn)超出一般意義的質(zhì)量管理領(lǐng)域,而成為一種綜合的、全面的經(jīng)營(yíng)管理方式和理念。
如何在信息化建設(shè)中實(shí)行全面質(zhì)量管理,以保障信息系統(tǒng)工程的質(zhì)量,是需要在實(shí)踐中探索和研究的。信息化建設(shè)監(jiān)理機(jī)制是保障信息系統(tǒng)工程質(zhì)量的重要手段,“三控、二管、一協(xié)調(diào)”及知識(shí)產(chǎn)權(quán)保護(hù)和安全控制是監(jiān)理的核心,也是在監(jiān)理過程中實(shí)行全面質(zhì)量管理的核心。
(一)全面質(zhì)量管理的定義
全面質(zhì)量管理在ISO 9000族標(biāo)準(zhǔn)中的定義為:“一個(gè)組織以質(zhì)量為中心,以全員參與為基礎(chǔ),目的在于通過讓顧客滿意和本組織所有成員及社會(huì)受益而達(dá)到長(zhǎng)期成功的管理途徑”。在知識(shí)經(jīng)濟(jì)時(shí)代,這種管理應(yīng)向知識(shí)管理延伸和發(fā)展。建立知識(shí)管理體系,是提高企業(yè)競(jìng)爭(zhēng)力、推動(dòng)企業(yè)發(fā)展的動(dòng)力。實(shí)施全面質(zhì)量管理就是建立質(zhì)量控制的知識(shí)管理體系。
知識(shí)管理貫穿信息化建設(shè)的始終,在全面質(zhì)量管理過程中得到體現(xiàn)。通過知識(shí)管理,幫助企業(yè)從已存在的信息中挖掘、分析、整合有用的知識(shí),發(fā)現(xiàn)和創(chuàng)造新的知識(shí),提升質(zhì)量管理的質(zhì)量。信息化的特征是技術(shù)和服務(wù),在知識(shí)管理中實(shí)現(xiàn)創(chuàng)新是信息化發(fā)展的源動(dòng)力。
(二)信息工程的知識(shí)化監(jiān)理的內(nèi)涵
信息工程的知識(shí)化監(jiān)理,融合個(gè)人知識(shí)(經(jīng)驗(yàn)、專業(yè)、技術(shù)等)積累和企業(yè)知識(shí)(記錄、文檔、文化等)積累,使質(zhì)量管理不僅僅停留在文檔化、參數(shù)化、流程化、制度化的作業(yè)中,而具有質(zhì)的提高,促進(jìn)個(gè)人知識(shí)和企業(yè)知識(shí)的相互轉(zhuǎn)化。
在監(jiān)理過程中,促成業(yè)主與承建方、業(yè)主與監(jiān)理方、業(yè)主與業(yè)主、承建方與監(jiān)理方之間的知識(shí)轉(zhuǎn)移。在信息化建設(shè)中,由于業(yè)主缺乏相應(yīng)的技術(shù)、知識(shí)、經(jīng)驗(yàn)等準(zhǔn)備,監(jiān)理的介入可以幫助業(yè)主與承建方溝通,了解承建方的技術(shù)路線、設(shè)計(jì)思想、公司實(shí)力、技術(shù)服務(wù)和支持等;幫助業(yè)主與已實(shí)施信息化的企業(yè)交流,學(xué)習(xí)經(jīng)驗(yàn)、吸取教訓(xùn)、規(guī)避風(fēng)險(xiǎn);提供對(duì)承建方的評(píng)價(jià)、解決方案的評(píng)價(jià)、項(xiàng)目實(shí)施方法的評(píng)價(jià)、項(xiàng)目階段和完成的評(píng)價(jià)以及技術(shù)服務(wù)和支持的評(píng)價(jià)等;提供風(fēng)險(xiǎn)管理、質(zhì)量管理、進(jìn)度管理、投資管理、安全管理、文檔管理等相應(yīng)知識(shí)。在這個(gè)過程中,完成了多樣性、多方位、多層次的知識(shí)轉(zhuǎn)移。
信息工程監(jiān)理在信息化工程中,通過實(shí)施零缺陷、戴明環(huán)、6σ等全面質(zhì)量管理方法和ISO9000質(zhì)量管理體系標(biāo)準(zhǔn),提高對(duì)質(zhì)量、質(zhì)量管理的認(rèn)識(shí),形成以知識(shí)管理為基礎(chǔ)的質(zhì)量管理作業(yè)流程,保證信息工程的質(zhì)量。實(shí)現(xiàn)信息和知識(shí)資產(chǎn)的積累和保存,促進(jìn)內(nèi)部信息和知識(shí)的流通,達(dá)成組織內(nèi)部知識(shí)的共享。
四、信息工程監(jiān)理的知識(shí)結(jié)構(gòu)
(一)信息工程監(jiān)理的總體架構(gòu)
信息工程監(jiān)理的總體架構(gòu)由5部分構(gòu)成:⑴監(jiān)理目標(biāo)是信息系統(tǒng)工程總體目標(biāo)和任務(wù),包括五個(gè)階段,即項(xiàng)目孵化、規(guī)劃設(shè)計(jì)、項(xiàng)目實(shí)施、驗(yàn)收測(cè)試和運(yùn)行維護(hù);⑵監(jiān)理范圍,即監(jiān)理職能×監(jiān)理內(nèi)容;⑶監(jiān)理實(shí)施;⑷監(jiān)理支撐;⑸系統(tǒng)評(píng)測(cè)。
(二)信息系統(tǒng)工程監(jiān)理的知識(shí)結(jié)構(gòu)
信息系統(tǒng)工程監(jiān)理的知識(shí)結(jié)構(gòu),由5個(gè)維度的知識(shí)空間組成:
1.監(jiān)理范圍。這個(gè)知識(shí)維度是由監(jiān)理職能和監(jiān)理內(nèi)容構(gòu)成的一個(gè)矩陣。監(jiān)理范圍是信息系統(tǒng)工程監(jiān)理知識(shí)結(jié)構(gòu)的核心,其它知識(shí)元素都是以監(jiān)理范圍為中心,輻射信息系統(tǒng)工程整個(gè)生命周期。
信息系統(tǒng)工程監(jiān)理包含7項(xiàng)職能:決策與領(lǐng)導(dǎo)、規(guī)劃與設(shè)計(jì)、組織與人事、協(xié)調(diào)與溝通、控制與監(jiān)督、投資、評(píng)測(cè)與創(chuàng)新。主要內(nèi)容包括:質(zhì)量控制、進(jìn)度控制、投資控制、安全控制、知識(shí)產(chǎn)權(quán)控制、信息管理、合同管理、組織協(xié)調(diào)。
2.監(jiān)理目標(biāo)。與信息系統(tǒng)工程監(jiān)理總體架構(gòu)中監(jiān)理目標(biāo)是對(duì)應(yīng)的。這個(gè)知識(shí)維度主要包含兩個(gè)內(nèi)容:
(1)信息系統(tǒng)工程的總目標(biāo)。這個(gè)總目標(biāo)因項(xiàng)目的不同而存在差異。信息系統(tǒng)工程監(jiān)理根據(jù)不同項(xiàng)目的特點(diǎn),協(xié)助用戶在目標(biāo)選擇、制定中,考慮系統(tǒng)的前瞻性、實(shí)用性、先進(jìn)性、可靠性、安全性、業(yè)務(wù)流程重組或再造等。監(jiān)理的目標(biāo)就是支持和保證這個(gè)總目標(biāo)成功實(shí)現(xiàn)。
(2)信息系統(tǒng)工程的任務(wù)。信息系統(tǒng)工程的主要任務(wù)包括項(xiàng)目孵化、規(guī)劃設(shè)計(jì)、項(xiàng)目實(shí)施、測(cè)試驗(yàn)收、運(yùn)行維護(hù)等。監(jiān)理的目標(biāo)就是保證工程項(xiàng)目各個(gè)階段任務(wù)目標(biāo)、質(zhì)量目標(biāo)、進(jìn)度目標(biāo)、投資目標(biāo)、安全目標(biāo)、知識(shí)產(chǎn)權(quán)目標(biāo)的順利實(shí)現(xiàn)。
3.監(jiān)理實(shí)施。在這個(gè)知識(shí)維度中,根據(jù)工程的特點(diǎn)、用戶的需求、進(jìn)度的安排、資金運(yùn)用及相關(guān)條件等,并參照信息系統(tǒng)工程生命周期內(nèi)的各個(gè)階段劃分監(jiān)理實(shí)施各階段。監(jiān)理的實(shí)施一般分為4個(gè)階段:前期準(zhǔn)備、監(jiān)理規(guī)劃、過程控制、監(jiān)理結(jié)束。但監(jiān)理實(shí)施的階段劃分并不一定與信息系統(tǒng)工程生命周期各階段有對(duì)應(yīng)關(guān)系。
4.系統(tǒng)評(píng)測(cè)。這個(gè)知識(shí)維度強(qiáng)調(diào)信息系統(tǒng)工程生命周期中各個(gè)階段的質(zhì)量評(píng)價(jià)、風(fēng)險(xiǎn)評(píng)估、安全評(píng)測(cè)等。評(píng)測(cè)是在監(jiān)理范圍的知識(shí)維度內(nèi)調(diào)控。
5.監(jiān)理方法論。在監(jiān)理范圍內(nèi),根據(jù)項(xiàng)目特點(diǎn),為實(shí)現(xiàn)監(jiān)理目標(biāo)采用的知識(shí)原理、方法、設(shè)施、工具、法律、法規(guī)、標(biāo)準(zhǔn)、規(guī)范等的集合,是實(shí)施監(jiān)理的依據(jù)和手段。
信息系統(tǒng)工程監(jiān)理知識(shí)結(jié)構(gòu)一般是按照各個(gè)維度的知識(shí)展開,但5個(gè)維度的知識(shí)不是相互孤立的,它們之間相互滲透、相互融合。由此構(gòu)成信息系統(tǒng)工程監(jiān)理知識(shí)空間。
信息工程監(jiān)理,是我國(guó)獨(dú)特的項(xiàng)目管理約束機(jī)制。實(shí)施知識(shí)化監(jiān)理,是項(xiàng)目管理的延伸和發(fā)展。監(jiān)理單位應(yīng)注重信息化過程中,在以信息資源規(guī)劃為核心的信息化規(guī)劃中展現(xiàn)的知識(shí)特點(diǎn)、知識(shí)結(jié)構(gòu)和知識(shí)轉(zhuǎn)移等,注重企業(yè)內(nèi)部外部的知識(shí)積累和共享,用知識(shí)指導(dǎo)監(jiān)理。實(shí)現(xiàn)監(jiān)理過程的知識(shí)管理,極大提高信息工程的質(zhì)量。
[參考文獻(xiàn)]
[1]郎慶斌等.信息系統(tǒng)工程質(zhì)量控制[M].人民出版社, 2005.7.