亚洲成色777777女色窝,777亚洲妇女,色吧亚洲日本,亚洲少妇视频

數(shù)據(jù)挖掘技術(shù)論文

時(shí)間:2023-01-15 11:27:27

導(dǎo)語(yǔ):在數(shù)據(jù)挖掘技術(shù)論文的撰寫(xiě)旅程中,學(xué)習(xí)并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內(nèi)容能夠啟發(fā)您的創(chuàng)作靈感,引領(lǐng)您探索更多的創(chuàng)作可能。

數(shù)據(jù)挖掘技術(shù)論文

第1篇

關(guān)鍵詞:數(shù)據(jù)挖掘電子商務(wù)應(yīng)用

當(dāng)今,國(guó)內(nèi)外電子商務(wù)類(lèi)網(wǎng)站日益興起。許多電子商務(wù)類(lèi)網(wǎng)站都提供了一定程度的個(gè)性化服務(wù),比如提供商品推薦服務(wù)。而構(gòu)成這些個(gè)性化服務(wù)的基礎(chǔ)就是數(shù)據(jù)挖掘技術(shù)。

一、數(shù)據(jù)挖掘分析

1.數(shù)據(jù)挖掘的定義。數(shù)據(jù)挖掘(datamining,DM)是從大量的、不完全的、有噪聲的、模糊的、隨機(jī)的數(shù)據(jù)中提取隱含在其中的、人們事先不知道的但又是潛在有用的信息和知識(shí)的過(guò)程。包括存儲(chǔ)和處理數(shù)據(jù),選擇處理大數(shù)據(jù)集的算法、解釋結(jié)果、使結(jié)果可視化。

2.數(shù)據(jù)挖掘的方法。從商業(yè)的角度來(lái)看,數(shù)據(jù)挖掘是一種新的商業(yè)信息處理技術(shù),其主要特點(diǎn)是對(duì)商業(yè)數(shù)據(jù)庫(kù)中的大量業(yè)務(wù)數(shù)據(jù)進(jìn)行抽取、轉(zhuǎn)換、分析和其他模型化處理,從中提取輔助商業(yè)決策的關(guān)鍵性數(shù)據(jù)。數(shù)據(jù)挖掘的方法大致可以分成4類(lèi):關(guān)聯(lián)分析、概括分析、分類(lèi)分析、聚類(lèi)分析。(1)關(guān)聯(lián)分析:分析表面上不相關(guān)數(shù)據(jù)之間的內(nèi)在聯(lián)系,揭示各事之間的依賴(lài)性和相關(guān)性,分析范圍包括簡(jiǎn)單關(guān)聯(lián)、因果關(guān)聯(lián)等。在電子商務(wù)中,用數(shù)據(jù)挖掘找到隱藏的關(guān)聯(lián)規(guī)則,當(dāng)客戶(hù)瀏覽、搜索關(guān)聯(lián)規(guī)則中的某種商品時(shí),就可以在頁(yè)面中以推薦商品的形式顯示關(guān)聯(lián)規(guī)則中的其它商品。在進(jìn)貨計(jì)劃和促銷(xiāo)計(jì)劃中,也可以將這個(gè)因素考慮進(jìn)去。(2)概括分析:即提取數(shù)據(jù)庫(kù)中指定的數(shù)據(jù)集合的一般特性,找出遍性規(guī)律。(3)分類(lèi)分析:設(shè)置分類(lèi)規(guī)則,把各個(gè)事務(wù)或?qū)嶓w按照性質(zhì)和特征不同進(jìn)行歸類(lèi),把數(shù)據(jù)層次化和規(guī)整化,從而建立數(shù)據(jù)的分類(lèi)模型。(4)聚類(lèi)分析:通過(guò)分析和歸納實(shí)體之間的特征差異,選出具相識(shí)特征的實(shí)體聚合成為一個(gè)類(lèi),并用某種規(guī)則來(lái)描述該類(lèi)的相同屬性,形成一種聚類(lèi)規(guī)則,實(shí)際上,它是與分類(lèi)分析法互逆的過(guò)程。

3.數(shù)據(jù)挖掘的過(guò)程。該過(guò)程從大型數(shù)據(jù)庫(kù)中挖掘先前未知的、有效的、可實(shí)用的信息,并使用這些信息做出決策或豐富知識(shí)。(1)確定業(yè)務(wù)對(duì)象:清晰地定義出業(yè)務(wù)問(wèn)題,認(rèn)清數(shù)據(jù)挖掘的目的是數(shù)據(jù)挖掘的重要一步。挖掘的最后結(jié)構(gòu)是不可預(yù)測(cè)的,但要探索的問(wèn)題應(yīng)是有預(yù)見(jiàn)的,為了數(shù)據(jù)挖掘而數(shù)據(jù)挖掘則帶有盲目性,是不會(huì)成功的。(2)數(shù)據(jù)準(zhǔn)備。數(shù)據(jù)的選擇:搜索所有與業(yè)務(wù)對(duì)象有關(guān)的內(nèi)部和外部數(shù)據(jù)信息,并從中選擇出適用于數(shù)據(jù)挖掘應(yīng)用的數(shù)據(jù)。(3)數(shù)據(jù)挖掘:對(duì)所得到的經(jīng)過(guò)轉(zhuǎn)換的數(shù)據(jù)進(jìn)行挖掘。除了完善從選擇合適的挖掘算法外,其余一切工作都能自動(dòng)地完成。(4)結(jié)果分析:解釋并評(píng)估結(jié)果。其使用的分析方法一般應(yīng)作數(shù)據(jù)挖掘操作而定,通常會(huì)用到可視化技術(shù)。(5)知識(shí)的同化:將分析所得到的知識(shí)集成到業(yè)務(wù)信息系統(tǒng)的組織結(jié)構(gòu)中去。

二、數(shù)據(jù)挖掘與電子商務(wù)的關(guān)系

在電子商務(wù)企業(yè)中,數(shù)據(jù)挖掘運(yùn)用于客戶(hù)行為分析,企業(yè)從中受益體現(xiàn)在以下四個(gè)方面:(1)可以發(fā)現(xiàn)客戶(hù)和訪問(wèn)者的愛(ài)好、生活模式。(2)可以爭(zhēng)取新顧客,怎樣使產(chǎn)品適銷(xiāo)對(duì)路、怎樣給產(chǎn)品定價(jià)、怎樣吸引單個(gè)客戶(hù)、怎樣優(yōu)化Web網(wǎng)站。(3)可以用相應(yīng)的信息確定顧客的消費(fèi)周期,針對(duì)不同的產(chǎn)品制定相應(yīng)的營(yíng)銷(xiāo)策略。(4)可以確定客戶(hù)細(xì)分,為每一個(gè)客戶(hù)的獨(dú)特需求設(shè)計(jì)“量身定制”的產(chǎn)品。三、數(shù)據(jù)挖掘技術(shù)在電子商務(wù)中的應(yīng)用

1.面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)設(shè)計(jì)。本系統(tǒng)電子商務(wù)平臺(tái)采用基于三層體系結(jié)構(gòu)構(gòu)建,服務(wù)器端采用先進(jìn)的J2EE平臺(tái)構(gòu)架,有完整的體系框架組成,具有很好的可擴(kuò)展性、互聯(lián)性和可維護(hù)性。因此面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)由數(shù)據(jù)庫(kù)服務(wù)器、應(yīng)用服務(wù)器和客戶(hù)端三層組成,整個(gè)體系結(jié)構(gòu)是以J2EE企業(yè)級(jí)的構(gòu)建技術(shù)為基礎(chǔ)。對(duì)數(shù)據(jù)挖掘過(guò)程中產(chǎn)生的數(shù)據(jù),采用獨(dú)立的數(shù)據(jù)挖掘庫(kù)表存放,這樣既不影響也不依賴(lài)數(shù)據(jù)挖掘的數(shù)據(jù)源。應(yīng)用服務(wù)器完成所有的數(shù)據(jù)挖掘運(yùn)算,通過(guò)接受客戶(hù)端的設(shè)置,完成所有對(duì)數(shù)據(jù)進(jìn)行探索、轉(zhuǎn)換、挖掘的工作。數(shù)據(jù)挖掘系統(tǒng)的每個(gè)功能模塊都以EJB的形式進(jìn)行封裝,以實(shí)現(xiàn)分布式計(jì)算和負(fù)載平衡等分布式計(jì)算的要求,把具有繁重計(jì)算任務(wù)的模塊和用戶(hù)交互模塊分開(kāi)??蛻?hù)端要負(fù)責(zé)數(shù)據(jù)挖掘流程的創(chuàng)建工作、所有功能模塊參數(shù)的設(shè)定以及各種可視化結(jié)果的顯示。用戶(hù)可以根據(jù)自己的要求任意創(chuàng)建各種形式的挖掘流程,同時(shí)按照需要執(zhí)行某部分流程,獲取相應(yīng)的可視化分析結(jié)果,其系統(tǒng)體系結(jié)構(gòu)如圖所示。

面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)體系結(jié)構(gòu)圖

2.面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)功能設(shè)計(jì)。面向電子商務(wù)的數(shù)據(jù)挖掘系統(tǒng)主要以下幾大功能模塊:(1)用戶(hù)信息分析。運(yùn)用分類(lèi)和聚類(lèi)挖掘方法對(duì)用戶(hù)的信息分析,可以得到用戶(hù)的些特征。對(duì)用戶(hù)分類(lèi)相當(dāng)于對(duì)具有某些公共屬性的用戶(hù)群體建立了概要特征描述,這些特征可以用來(lái)對(duì)新增的用戶(hù)進(jìn)行分類(lèi),可以發(fā)現(xiàn)未來(lái)的潛在用戶(hù)并開(kāi)展有針對(duì)性的商務(wù)活動(dòng),如自動(dòng)給一類(lèi)特定的用戶(hù)發(fā)送銷(xiāo)售郵件,當(dāng)屬于同一類(lèi)的用戶(hù)再次訪問(wèn)站點(diǎn)時(shí)為其動(dòng)態(tài)地改變站點(diǎn)的內(nèi)容等。通過(guò)這些舉措使商務(wù)活動(dòng)能夠在一定程度上滿(mǎn)足用戶(hù)的要求,實(shí)現(xiàn)目標(biāo)營(yíng)銷(xiāo)。(2)商品信息分析。運(yùn)用關(guān)聯(lián)規(guī)則挖掘發(fā)現(xiàn)商品訪問(wèn)中所有關(guān)聯(lián)和相聯(lián)系的規(guī)則,可以從交易事務(wù)數(shù)據(jù)庫(kù)中發(fā)現(xiàn)商品間的相互聯(lián)系。這對(duì)電子商務(wù)公司組織站點(diǎn)網(wǎng)頁(yè)結(jié)構(gòu)、開(kāi)展有效的營(yíng)銷(xiāo)策略非常有幫助。(3)物流信息分析。采用神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)技術(shù),根據(jù)各物流配送點(diǎn)接到的網(wǎng)站用戶(hù)訂單來(lái)預(yù)測(cè)其庫(kù)存數(shù)量。預(yù)測(cè)信息可以給物流配送中心以參考,用來(lái)合理地確定各配送點(diǎn)倉(cāng)庫(kù)的庫(kù)存量,使各配送點(diǎn)的補(bǔ)貨能更加合理有序,降低物流成本,節(jié)約庫(kù)存費(fèi)用。

四、結(jié)束語(yǔ)

數(shù)據(jù)挖掘是一個(gè)新興的領(lǐng)域,具有廣闊應(yīng)用前景,目前,電子商務(wù)在我國(guó)正處于快速發(fā)展和應(yīng)用階段,利用數(shù)據(jù)挖掘技術(shù),能夠強(qiáng)化對(duì)客戶(hù)的服務(wù)、促進(jìn)市場(chǎng)最優(yōu)化、加速資金周轉(zhuǎn)、實(shí)現(xiàn)企業(yè)的創(chuàng)新發(fā)展。電子商務(wù)平臺(tái)上的數(shù)據(jù)挖掘技術(shù)有待人們?nèi)ミM(jìn)行更深入的研究工作,這將不斷的推動(dòng)數(shù)據(jù)挖掘技術(shù)的深入發(fā)展和廣泛應(yīng)用,創(chuàng)造出更多的社會(huì)和經(jīng)濟(jì)價(jià)值。

參考文獻(xiàn):

[1]張?jiān)茲忊?數(shù)據(jù)挖掘原理與技術(shù).北京,電子工業(yè)出版社,2004年1月

[2]方真等:電子商務(wù)教程[M].北京:清華大學(xué)出版社.2004

第2篇

國(guó)外很多大學(xué)都開(kāi)設(shè)了數(shù)據(jù)挖掘類(lèi)課程,波士頓大學(xué)的“數(shù)據(jù)管理與商務(wù)智能”課程主要包括基礎(chǔ)、核心技術(shù)、應(yīng)用三部分。授課方式包括理論內(nèi)容講授、案例教學(xué),以及學(xué)生以團(tuán)隊(duì)合作方式完成項(xiàng)目并進(jìn)行課堂演講。從麻省理工學(xué)院開(kāi)放性課程資料(斯隆管理學(xué)院)中可以看出,在每章講解一種算法之后都盡可能地安排了商務(wù)實(shí)例的分析,并在課程后期安排了客座講座的形式。國(guó)內(nèi)對(duì)于數(shù)據(jù)挖掘的教學(xué)類(lèi)研究成果也很多,主要集中在三類(lèi)問(wèn)題的研究上,較為普遍的是根據(jù)專(zhuān)業(yè)建立大綱的研究,例如針對(duì)電子商務(wù)專(zhuān)業(yè)進(jìn)行大綱設(shè)計(jì);另外也有專(zhuān)注研究某一種或多種適合數(shù)據(jù)挖掘或商務(wù)智能的教學(xué)方法,如專(zhuān)題研討法;還有的討論算法理解與程序設(shè)計(jì)、軟件應(yīng)用的關(guān)系。

2、基于模塊化方法的課程內(nèi)容分析

模塊化教學(xué)模式是按照程序模塊化的構(gòu)想和原則來(lái)設(shè)計(jì)教學(xué)內(nèi)容的一整套教學(xué)體系,它是在既定的培養(yǎng)目標(biāo)指導(dǎo)下,將全部教學(xué)內(nèi)容按照一定標(biāo)準(zhǔn)或規(guī)則進(jìn)行分解,使其成為多個(gè)相對(duì)獨(dú)立的教學(xué)模塊,且各教學(xué)模塊之間可以按照一定的規(guī)則有選擇性的重新組合。該方法在20世紀(jì)70年代,由國(guó)際勞工組織引入教學(xué)之中,開(kāi)發(fā)出以現(xiàn)場(chǎng)教學(xué)為主,以技能培訓(xùn)為核心的模塊化教學(xué)模式,在很多國(guó)家得到廣泛應(yīng)用。由于該教學(xué)法具有針對(duì)性、靈活性、現(xiàn)實(shí)性等特點(diǎn),越來(lái)越受到教育界的關(guān)注。模塊化教學(xué)本質(zhì)上是以知識(shí)點(diǎn)與實(shí)踐的細(xì)化為出發(fā)點(diǎn)研究,本課程的知識(shí)點(diǎn)細(xì)化分為兩個(gè)層次:一是從宏觀角度,參考ACM的SIGKDD的數(shù)據(jù)挖掘課程建設(shè)建議,設(shè)計(jì)課程的基礎(chǔ)內(nèi)容模塊和高級(jí)主題模塊;二是從微觀角度,針對(duì)較為復(fù)雜的算法進(jìn)行的知識(shí)點(diǎn)劃分。課程內(nèi)容的一至五章屬于基礎(chǔ)內(nèi)容模塊,介紹本課程的基礎(chǔ)理論和入門(mén)的數(shù)據(jù)挖掘技術(shù);六至第八章介于基礎(chǔ)內(nèi)容與高級(jí)主題之間,介紹數(shù)據(jù)挖掘的核心算法,可以根據(jù)學(xué)生情況進(jìn)行靈活處理,可強(qiáng)調(diào)應(yīng)用,也可深化算法介紹;第九、十章為高級(jí)主題模塊,可以作為擴(kuò)展材料介紹應(yīng)用,或?yàn)楦信d趣同學(xué)提供算法介紹;課程實(shí)踐模塊包含數(shù)據(jù)倉(cāng)庫(kù)建設(shè)與數(shù)據(jù)挖掘算法的應(yīng)用,難度居中,可以在引導(dǎo)學(xué)生思考的前提下給出實(shí)驗(yàn)步驟,并引導(dǎo)學(xué)生使用類(lèi)似的方法處理不同的數(shù)據(jù)。

3、基于模塊化方法進(jìn)行重要知識(shí)點(diǎn)的模塊化分析

重要知識(shí)點(diǎn)內(nèi)涵較為豐富,一般體現(xiàn)在經(jīng)典數(shù)據(jù)挖掘算法上,通常一大類(lèi)算法下還分有多個(gè)算法,不同算法的在難度上有漸進(jìn)層次,同一種算法也有很大改進(jìn)研究空間,講授彈性比較大。因此,適合使用模塊化方法進(jìn)行處理,并且需要在課程設(shè)計(jì)中明確一定課時(shí)量所要達(dá)到的內(nèi)容和難度?;A(chǔ)部分為必選內(nèi)容,介紹基本概念和基本原理;決策樹(shù)作為數(shù)據(jù)挖掘分類(lèi)算法的最基礎(chǔ)算法也是必選內(nèi)容,決策樹(shù)算法有多種分類(lèi),需要進(jìn)行按照難易程度進(jìn)行選擇;最后要根據(jù)難度選擇其他分類(lèi)算法進(jìn)行介紹。

4、結(jié)論

第3篇

0前言

隨著現(xiàn)代商業(yè)經(jīng)濟(jì)和信息技術(shù)的發(fā)展,商業(yè)信息的增長(zhǎng)速度呈現(xiàn)指數(shù)上升,積累了海量的、以不同形式存儲(chǔ)的商業(yè)數(shù)據(jù)資料,原有的決策支持系統(tǒng)(DSS)和領(lǐng)導(dǎo)執(zhí)行系統(tǒng)(EIS)已不能滿(mǎn)足需要,這時(shí)出現(xiàn)數(shù)據(jù)挖掘技術(shù),它能夠去粗存精、去偽存真,從海量的商業(yè)信息中提取知識(shí)和有用信息的技術(shù)?,F(xiàn)代信息技術(shù)處理商業(yè)信息經(jīng)過(guò)一定的發(fā)展,逐步形成現(xiàn)在的商業(yè)數(shù)據(jù)挖掘技術(shù)。

1.?dāng)?shù)據(jù)挖掘方法在商業(yè)信息中應(yīng)用的規(guī)則

數(shù)據(jù)挖掘技術(shù)在商業(yè)中的應(yīng)用主要基于AI、機(jī)器學(xué)習(xí)、統(tǒng)計(jì)學(xué)等技術(shù),高度自動(dòng)化地分析商業(yè)原始數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,預(yù)測(cè)客戶(hù)的行為,幫助商業(yè)決策者調(diào)整市場(chǎng)策略,減少風(fēng)險(xiǎn),做出正確的決策,體現(xiàn)一種決策支持過(guò)程。

1.1商業(yè)信息泛化、簡(jiǎn)約和特征提取規(guī)則。商業(yè)信息泛化是為了商業(yè)數(shù)據(jù)更好的理解和掌握,將其具體一般的數(shù)據(jù)信息抽象到較高層次的過(guò)程;商業(yè)信息簡(jiǎn)約是為了采用一定的手段對(duì)信息進(jìn)行描述;商業(yè)信息特征是找出這些信息的共同特征,尋找信息的通用性特征式。

1.2商業(yè)信息分類(lèi)技術(shù)規(guī)則。商業(yè)信息分類(lèi)是按照一組商業(yè)信息對(duì)象的特征給出信息對(duì)象劃分的過(guò)程。其目的是學(xué)會(huì)一個(gè)分類(lèi)函數(shù)或分類(lèi)模型,該模型能把數(shù)據(jù)庫(kù)的數(shù)據(jù)信息項(xiàng)映射到給定類(lèi)別中的某一個(gè)。

1.3商業(yè)信息的聚類(lèi)規(guī)則。聚類(lèi)規(guī)則是識(shí)別一組信息對(duì)象的內(nèi)在規(guī)則,從而將對(duì)象分組,構(gòu)成相似的對(duì)象類(lèi),從而找出數(shù)據(jù)信息的分布規(guī)律,并進(jìn)一步去發(fā)現(xiàn)隱含在一組混雜的數(shù)據(jù)信息集里的分類(lèi)規(guī)則。聚類(lèi)是把一組個(gè)體按照相似性歸類(lèi),即"物以類(lèi)聚"。使屬于同一類(lèi)別的個(gè)體之間的距離盡可能小,而不同類(lèi)別的個(gè)體間的距離盡可能大。

1.4商業(yè)信息的關(guān)聯(lián)規(guī)則。關(guān)聯(lián)規(guī)則的商業(yè)數(shù)據(jù)挖掘已經(jīng)從單一概念層次的關(guān)聯(lián)規(guī)則發(fā)展到多概念層次的關(guān)聯(lián)規(guī)則的發(fā)現(xiàn)。關(guān)聯(lián)規(guī)則是如下的一種規(guī)則:"我們?cè)谘芯看笮蜕虉?chǎng)的顧客在購(gòu)買(mǎi)上衣和褲子的時(shí)候,發(fā)現(xiàn)其中在這些顧客中有10%的顧客同時(shí)買(mǎi)了帽子(上衣+褲子+帽子),這就形成簡(jiǎn)單的關(guān)聯(lián)規(guī)則。除了具有上述關(guān)聯(lián)規(guī)律,還有時(shí)間或序列上的規(guī)律,在不同的時(shí)間(春夏秋冬)所購(gòu)的衣服、褲子以及帽子是不相同的,并且不同層次或者不同年齡的人所購(gòu)商品又有一定的規(guī)律性。

2.?dāng)?shù)據(jù)挖掘技術(shù)在商業(yè)信息中的應(yīng)用

數(shù)據(jù)挖掘技術(shù)是目前在商業(yè)信息處理中應(yīng)用的比較多的一項(xiàng)技術(shù),為了在商業(yè)領(lǐng)域中對(duì)海量數(shù)據(jù)庫(kù)和大量復(fù)雜信息中提取有價(jià)值的知識(shí),進(jìn)一步提高信息的利用率,對(duì)公司及時(shí)制定相應(yīng)的對(duì)策有非常重要的意義,在這里,討論幾個(gè)主要商業(yè)行業(yè)中的商業(yè)信息處理。

2.1數(shù)據(jù)挖掘技術(shù)在電子商務(wù)網(wǎng)站數(shù)據(jù)中的應(yīng)用

隨著Web技術(shù)的發(fā)展,電子商務(wù)網(wǎng)站正在成為現(xiàn)在商家的必爭(zhēng)之地。如何讓電子商務(wù)網(wǎng)站有效益要想有效益就必須吸引客戶(hù),增加能帶來(lái)效益的客戶(hù)忠誠(chéng)度。電子商務(wù)網(wǎng)站每天都可能有上百萬(wàn)次的在線交易,生成大量的記錄文件和登記表,如何對(duì)這些數(shù)據(jù)進(jìn)行分析和挖掘,充分了解客戶(hù)的喜好、購(gòu)買(mǎi)模式,甚至是客戶(hù)一時(shí)的沖動(dòng),設(shè)計(jì)出滿(mǎn)足于不同客戶(hù)群體需要的個(gè)性化網(wǎng)站,進(jìn)而增加其競(jìng)爭(zhēng)力,幾乎變得勢(shì)在必行。若想在競(jìng)爭(zhēng)中生存進(jìn)而獲勝,就要比您的競(jìng)爭(zhēng)對(duì)手更了解客戶(hù)。

在對(duì)網(wǎng)站進(jìn)行數(shù)據(jù)挖掘時(shí),所需要的數(shù)據(jù)主要來(lái)自于兩個(gè)方面:一方面是客戶(hù)的背景信息,此部分信息主要來(lái)自于客戶(hù)的登記表;而另外一部分?jǐn)?shù)據(jù)主要來(lái)自瀏覽者的點(diǎn)擊流,此部分?jǐn)?shù)據(jù)主要用于考察客戶(hù)的行為表現(xiàn)。但有的時(shí)候,客戶(hù)對(duì)自己的背景信息十分珍重,不肯把這部分信息填寫(xiě)在登記表上,這就會(huì)給數(shù)據(jù)分析和挖掘帶來(lái)不便。在這種情況之下,就不得不從瀏覽者的表現(xiàn)數(shù)據(jù)中來(lái)推測(cè)客戶(hù)的背景信息,進(jìn)而再加以利用。就分析和建立模型的技術(shù)和算法而言,網(wǎng)站的數(shù)據(jù)挖掘和原來(lái)的數(shù)據(jù)挖掘差別并不是特別大,很多方法和分析思想都可以運(yùn)用。所不同的是網(wǎng)站的數(shù)據(jù)格式有很大一部分來(lái)自于點(diǎn)擊流,和傳統(tǒng)的數(shù)據(jù)庫(kù)格式有區(qū)別。因而對(duì)電子商務(wù)網(wǎng)站進(jìn)行數(shù)據(jù)挖掘所做的主要工作是數(shù)據(jù)準(zhǔn)備。

2.2數(shù)據(jù)挖掘技術(shù)可以用在金融領(lǐng)域的應(yīng)用

金融事務(wù)需要搜集和處理大量數(shù)據(jù),對(duì)這些數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)其數(shù)據(jù)模式及特征,然后可能發(fā)現(xiàn)某個(gè)客戶(hù)、消費(fèi)群體或組織的金融和商業(yè)興趣,并可觀察金融市場(chǎng)的變化趨勢(shì)。

數(shù)據(jù)挖掘在銀行信息中的應(yīng)用。商業(yè)銀行業(yè)務(wù)的利潤(rùn)和風(fēng)險(xiǎn)是共存的。為了保證最大的利潤(rùn)和最小的風(fēng)險(xiǎn),必須對(duì)賬戶(hù)進(jìn)行科學(xué)的分析和歸類(lèi),并進(jìn)行信用評(píng)估,利用數(shù)據(jù)挖掘工具,可以根據(jù)客戶(hù)的消費(fèi)模式預(yù)測(cè)何時(shí)為客戶(hù)提供何種產(chǎn)品。銀行如何讓一家新開(kāi)的銀行網(wǎng)點(diǎn)實(shí)現(xiàn)快速贏利呢?銀行結(jié)合了GPS推理信息系統(tǒng)和商業(yè)智能應(yīng)用系統(tǒng),在銀行的客戶(hù)信息中,詳細(xì)記錄有客戶(hù)的常駐地,并且,當(dāng)銀行客戶(hù)到該銀行網(wǎng)點(diǎn)辦理業(yè)務(wù)時(shí),銀行商業(yè)智能系統(tǒng)將自動(dòng)記錄客戶(hù)的操作信息,以及銀行網(wǎng)點(diǎn)地址信息。經(jīng)過(guò)大量的記錄,客戶(hù)的常駐地到銀行網(wǎng)點(diǎn)的行動(dòng)路線,將被通過(guò)數(shù)據(jù)分析而得出。大量的客戶(hù)路線得出后,我們可能會(huì)發(fā)現(xiàn),某個(gè)地區(qū)進(jìn)行銀行業(yè)務(wù)操作的客戶(hù)特別多,但他們附近沒(méi)有銀行網(wǎng)點(diǎn),而是要到離他們較遠(yuǎn)的地方去辦理,于是銀行就決定在這個(gè)地區(qū)開(kāi)辦一個(gè)銀行網(wǎng)點(diǎn)。

數(shù)據(jù)挖掘在證券信息中的應(yīng)用。上市公司定期公布的財(cái)務(wù)報(bào)告具有很強(qiáng)的信息含量,但是當(dāng)期會(huì)計(jì)盈余數(shù)據(jù)的信息會(huì)在披露前后在股票市價(jià)中迅速得以體現(xiàn)。因此對(duì)于中長(zhǎng)期投資者來(lái)說(shuō),重要的是預(yù)見(jiàn)未來(lái)。質(zhì)地優(yōu)良且未來(lái)具有較高盈利增長(zhǎng)能力的公司是中長(zhǎng)期投資者(包括普通投資者,證券投資基金和券商)普遍關(guān)注的對(duì)象,因?yàn)橹挥羞@類(lèi)公司才能給投資者帶來(lái)持續(xù)的回報(bào)。而財(cái)務(wù)報(bào)告包含了大量描述公司經(jīng)營(yíng)狀況的數(shù)據(jù)。這些數(shù)據(jù)應(yīng)能為投資者提供關(guān)于公司未來(lái)盈利能力的信息。對(duì)于中長(zhǎng)期投資者而言,需要做的就是利用這些信息挖掘出未來(lái)能夠具有較高盈利水平同時(shí)又具有較好的成長(zhǎng)性公司。采用數(shù)據(jù)挖掘技術(shù)來(lái)發(fā)掘這些財(cái)務(wù)報(bào)告中是否包含關(guān)于公司未來(lái)盈利情況的信息,獲得較精確的預(yù)測(cè)效果,選出的投資組合能否獲得超額收益,這對(duì)于投資者來(lái)說(shuō)是非常重要的。

2.3數(shù)據(jù)挖掘技術(shù)在企業(yè)市場(chǎng)營(yíng)銷(xiāo)中的應(yīng)用

數(shù)據(jù)挖掘技術(shù)在企業(yè)市場(chǎng)營(yíng)銷(xiāo)中得到了比較普遍的應(yīng)用,它是以市場(chǎng)營(yíng)銷(xiāo)學(xué)的市場(chǎng)細(xì)分原理為基礎(chǔ),其基本假定是"消費(fèi)者過(guò)去的行為是其今后消費(fèi)傾向的最好說(shuō)明"。通過(guò)收集、加工和處理涉及消費(fèi)者消費(fèi)行為的大量信息,確定特定消費(fèi)群體或個(gè)體的興趣、消費(fèi)習(xí)慣、消費(fèi)傾向和消費(fèi)需求,進(jìn)而推斷出相應(yīng)消費(fèi)群體或個(gè)體下一步的消費(fèi)行為,然后以此為基礎(chǔ),對(duì)所識(shí)別出來(lái)的消費(fèi)群體進(jìn)行特定內(nèi)容的定向營(yíng)銷(xiāo),這與傳統(tǒng)的不區(qū)分消費(fèi)者對(duì)象特征的大規(guī)模營(yíng)銷(xiāo)手段相比,大大節(jié)省了營(yíng)銷(xiāo)成本,提高了營(yíng)銷(xiāo)效果,從而為企業(yè)帶來(lái)更多的利潤(rùn)。這些來(lái)自各種渠道的數(shù)據(jù)信息被組合,應(yīng)用超級(jí)計(jì)算機(jī)、并行處理、神經(jīng)元網(wǎng)絡(luò)、模型化算法和其他信息處理技術(shù)手段進(jìn)行處理,從中得到商家用于向特定消費(fèi)群體或個(gè)體進(jìn)行定向營(yíng)銷(xiāo)的決策信息。4數(shù)據(jù)挖掘技術(shù)在民用通信部門(mén)中的應(yīng)用

我國(guó)各種民用通信用得最多的國(guó)家之一,為了分析出那一類(lèi)收費(fèi)對(duì)應(yīng)那類(lèi)層次的人群,我們就可以利用數(shù)據(jù)挖掘技術(shù),把當(dāng)前電信消費(fèi)者的數(shù)據(jù)進(jìn)行收集、分析、總結(jié),制定出有效的管理辦法,這既有利于公司又有利于客戶(hù)的優(yōu)惠政策,這樣能夠及時(shí)發(fā)現(xiàn)問(wèn)題,減少顧客流失,為通信公司挽回?fù)p失。數(shù)據(jù)挖掘在通信部門(mén)中體現(xiàn)在三個(gè)方面:(1)客戶(hù)挽留解決方案;(2)電信業(yè)客戶(hù)細(xì)分解決方案;(3)電信業(yè)交叉銷(xiāo)售和提升銷(xiāo)售解決方案。這三個(gè)項(xiàng)目的實(shí)施,可以為民用通信部門(mén)解決三個(gè)決策問(wèn)題:第一,預(yù)測(cè)哪些客戶(hù)最具有流失的傾向以及影響客戶(hù)流失的關(guān)鍵因素,通過(guò)預(yù)制的分析模型提供"流失記分"幫助識(shí)別風(fēng)險(xiǎn)客戶(hù),在客戶(hù)流失之前采取針對(duì)性措施來(lái)挽留他們。第二,根據(jù)客戶(hù)可能的行為和潛在的盈利性對(duì)客戶(hù)進(jìn)行分類(lèi),制定更準(zhǔn)確的產(chǎn)品組合、更準(zhǔn)確的產(chǎn)品介紹和產(chǎn)品捆綁服務(wù)。第三,從現(xiàn)有客戶(hù)中識(shí)別出有可能接受交叉銷(xiāo)售和提升銷(xiāo)售的客戶(hù)人選,評(píng)估客戶(hù)過(guò)去的購(gòu)買(mǎi)模式,預(yù)測(cè)客戶(hù)下一步可能購(gòu)買(mǎi)什么。

第4篇

[關(guān)鍵詞]數(shù)據(jù)挖掘技術(shù);軟件工程;數(shù)據(jù)預(yù)處理

[引言]隨著我國(guó)信息技術(shù)的進(jìn)步,數(shù)據(jù)挖掘技術(shù)得到廣泛應(yīng)用,在軟件工程中需要對(duì)數(shù)據(jù)信息進(jìn)行搜集、分類(lèi)與整理,通過(guò)數(shù)據(jù)挖掘技術(shù)的應(yīng)用可以有效提高工作效率,推動(dòng)軟件工程的有序發(fā)展。我國(guó)對(duì)數(shù)據(jù)挖掘技術(shù)的應(yīng)用與研究雖然處于初級(jí)階段,但通過(guò)不斷的經(jīng)驗(yàn)積累也能夠發(fā)揮技術(shù)的更多價(jià)值。

1數(shù)據(jù)挖掘技術(shù)概述

數(shù)據(jù)挖掘技術(shù)指的是在信息技術(shù)發(fā)展背景下,對(duì)信息數(shù)據(jù)展開(kāi)處理的技術(shù)。與過(guò)去的信息處理技術(shù)相比,數(shù)據(jù)挖掘技術(shù)功能更加強(qiáng)大,可以應(yīng)用在各個(gè)領(lǐng)域,無(wú)論是數(shù)據(jù)處理、數(shù)據(jù)轉(zhuǎn)換還是數(shù)據(jù)分析,都能夠完成相互之間的聯(lián)系,并對(duì)數(shù)據(jù)進(jìn)行最終評(píng)估。將數(shù)據(jù)挖掘技術(shù)應(yīng)用在軟件工程中,能夠提高企業(yè)處理信息數(shù)據(jù)的效率,避免操作失誤,保護(hù)企業(yè)數(shù)據(jù)準(zhǔn)確[1]。

2數(shù)據(jù)挖掘技術(shù)在軟件工程中的重要性分析

2.1高效整合多樣化信息數(shù)據(jù)

由于數(shù)據(jù)挖掘技術(shù)的功能比較多,其中包含了傳統(tǒng)處理技術(shù)的功能,實(shí)現(xiàn)多樣化信息的收集與分類(lèi),并將數(shù)據(jù)按照類(lèi)別存儲(chǔ)與整理。數(shù)據(jù)挖掘技術(shù)可以在多樣化數(shù)據(jù)中實(shí)現(xiàn)數(shù)據(jù)的系統(tǒng)化管理,為人們進(jìn)行數(shù)據(jù)查閱工作帶來(lái)方便。在軟件工程中應(yīng)用該技術(shù),方便信息數(shù)據(jù)的高效整合,幫助企業(yè)全方位了解信息與數(shù)據(jù)[2]。

2.2保證信息數(shù)據(jù)的準(zhǔn)確率

數(shù)據(jù)挖掘技術(shù)擁有強(qiáng)大數(shù)據(jù)運(yùn)算功能,以往的數(shù)據(jù)信息系統(tǒng)運(yùn)算數(shù)據(jù)時(shí)需要耗費(fèi)大量時(shí)間與成本。如果信息數(shù)據(jù)體系龐大,系統(tǒng)運(yùn)算時(shí)會(huì)面臨癱瘓問(wèn)題。在軟件工程中,一旦系統(tǒng)發(fā)生癱瘓,系統(tǒng)將無(wú)法正常使用,數(shù)據(jù)也會(huì)受到破壞。應(yīng)用數(shù)據(jù)挖掘技術(shù)之后可以有效解決以上問(wèn)題,實(shí)現(xiàn)系統(tǒng)的優(yōu)化,使系統(tǒng)可以在最短時(shí)間內(nèi)處理數(shù)據(jù),防止信息數(shù)據(jù)發(fā)生丟失現(xiàn)象,提高數(shù)據(jù)處理的時(shí)效性。面對(duì)大量的信息數(shù)據(jù),有的數(shù)據(jù)得不到利用,但長(zhǎng)期處于系統(tǒng)中會(huì)影響系統(tǒng)運(yùn)行效率,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以將無(wú)價(jià)值的數(shù)據(jù)剔除,留下有用的信息數(shù)據(jù),保證系統(tǒng)的運(yùn)行效率和數(shù)據(jù)質(zhì)量。

2.3縮短信息數(shù)據(jù)處理時(shí)間

在軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù)可以分類(lèi)處理雜亂無(wú)章的數(shù)據(jù),實(shí)現(xiàn)數(shù)據(jù)的轉(zhuǎn)換與調(diào)用。對(duì)數(shù)據(jù)進(jìn)行深入挖掘處理時(shí)也可以應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行數(shù)據(jù)的分類(lèi),并對(duì)模糊數(shù)據(jù)及時(shí)清理,提高系統(tǒng)內(nèi)現(xiàn)存數(shù)據(jù)的實(shí)用價(jià)值。人們獲取到的信息數(shù)據(jù)需要進(jìn)行反復(fù)核對(duì),以此保證數(shù)據(jù)真實(shí)性,通過(guò)數(shù)據(jù)挖掘技術(shù)的應(yīng)用減少時(shí)間浪費(fèi),提高數(shù)據(jù)核對(duì)效率。

3數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用分析

3.1系統(tǒng)結(jié)構(gòu)

數(shù)據(jù)挖掘技術(shù)應(yīng)用流程主要分為三個(gè)階段:數(shù)據(jù)預(yù)處理、數(shù)據(jù)挖掘、模式評(píng)估與知識(shí)表示。在數(shù)據(jù)預(yù)處理階段中,高效得到原始數(shù)據(jù)的根本原因在于確定任務(wù)處理對(duì)象,得到符合軟件工程需求的數(shù)據(jù)。通過(guò)數(shù)據(jù)清洗彌補(bǔ)原始數(shù)據(jù)存在的缺陷,確保數(shù)據(jù)的完整性。數(shù)據(jù)抽取需要從數(shù)據(jù)庫(kù)中選擇與軟件工程任務(wù)相符合的信息。數(shù)據(jù)轉(zhuǎn)換需要將數(shù)據(jù)格式加以轉(zhuǎn)化,實(shí)現(xiàn)數(shù)據(jù)的適用性。在數(shù)據(jù)挖掘中需要制定一定的挖掘任務(wù),通過(guò)對(duì)數(shù)據(jù)的分類(lèi)與評(píng)價(jià)總結(jié),合理應(yīng)用運(yùn)算方法進(jìn)行數(shù)據(jù)推敲。在模式評(píng)估與知識(shí)表示中,其實(shí)際用途在于挖掘成功的表達(dá),將興趣度作為衡量標(biāo)準(zhǔn),提高數(shù)據(jù)表達(dá)的識(shí)別能力。

針對(duì)軟件工程中數(shù)據(jù)挖掘技術(shù)的優(yōu)化應(yīng)用,可以從系統(tǒng)結(jié)構(gòu)方面入手,具體如下:(1)檢測(cè)軟件工程中的克隆代碼。以軟件工程為標(biāo)準(zhǔn),將一部分代碼復(fù)制,結(jié)合實(shí)際情況更改一部分代碼,并對(duì)這些代碼進(jìn)行檢測(cè),代碼檢測(cè)與更改可以同時(shí)進(jìn)行,能有效提高檢測(cè)效率,實(shí)現(xiàn)系統(tǒng)的維護(hù)工作。當(dāng)前應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行克隆代碼檢測(cè)的方式一共有四種,具體為比較標(biāo)識(shí)符、對(duì)比文本、檢測(cè)系統(tǒng)程序結(jié)構(gòu)與度量圈。在實(shí)際操作中,要求人們結(jié)合實(shí)際情況選擇相應(yīng)的克隆代碼檢測(cè)方法。(2)數(shù)據(jù)信息挖掘法。這是以橫切關(guān)注點(diǎn)為主的挖掘方法,在軟件工程中應(yīng)用該方法可以改造系統(tǒng),對(duì)數(shù)據(jù)信息達(dá)到良好的處理效果[3]。

3.2軟件管理

為了讓數(shù)據(jù)挖掘技術(shù)更好地應(yīng)用在軟件工程中,需要從軟件管理角度入手,采用以下兩方面舉措。一方面,深入挖掘數(shù)據(jù)的組織關(guān)系,另一方面,挖掘版本控制信息。軟件工程系統(tǒng)比較繁瑣,挖掘組織關(guān)系時(shí)較為困難,人們需要合理調(diào)配各項(xiàng)信息,以此作為挖掘的依據(jù)。如果以軟件工程管理流程作為主題,對(duì)電子郵件與共享文件展開(kāi)組織關(guān)系挖掘,可以有效避免系統(tǒng)流程發(fā)生混亂,保護(hù)軟件管理的秩序。當(dāng)信息數(shù)據(jù)發(fā)生變化時(shí),應(yīng)用數(shù)據(jù)挖掘技術(shù)進(jìn)行軟件管理,將版本控制作為重要依據(jù),將數(shù)據(jù)挖掘技術(shù)與版本控制相聯(lián)系,降低系統(tǒng)運(yùn)行成本,并達(dá)到警示的效果,提高軟件工程的管理水平。

3.3軟件開(kāi)發(fā)

在軟件工程初期階段,人們將數(shù)據(jù)挖掘技術(shù)看成數(shù)據(jù)庫(kù),隨著技術(shù)的發(fā)展,軟件工程發(fā)展到現(xiàn)實(shí)應(yīng)用,系統(tǒng)和現(xiàn)實(shí)共同發(fā)展。軟件工程將各項(xiàng)指標(biāo)與要求緊密結(jié)合,研發(fā)出最新產(chǎn)品,以往的軟件工程中軟件開(kāi)發(fā)十分困難,而如今應(yīng)用數(shù)據(jù)挖掘技術(shù),可以將其與數(shù)據(jù)庫(kù)相融合,發(fā)揮數(shù)據(jù)庫(kù)內(nèi)信息的最大價(jià)值,有效推動(dòng)軟件開(kāi)發(fā)的進(jìn)步。不僅如此,軟件工程可以對(duì)信息進(jìn)行更深層次的挖掘,充分發(fā)揮軟件工程的價(jià)值,利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)數(shù)據(jù)的更新,保證軟件開(kāi)發(fā)質(zhì)量,優(yōu)化軟件操作流程。在技術(shù)的支持下,人們可以合理劃分軟件內(nèi)部,方便及時(shí)發(fā)現(xiàn)問(wèn)題,并展開(kāi)積極有效的問(wèn)題處理。利用數(shù)據(jù)挖掘技術(shù)可以進(jìn)行網(wǎng)站設(shè)計(jì),對(duì)網(wǎng)站內(nèi)容進(jìn)行挖掘,特別是對(duì)文本內(nèi)容的挖掘,隨后整合網(wǎng)站信息,通過(guò)自動(dòng)歸類(lèi)技術(shù)實(shí)現(xiàn)信息的層次性組織。在軟件或網(wǎng)站管理中,應(yīng)用數(shù)據(jù)挖掘技術(shù)可以根據(jù)用戶(hù)對(duì)網(wǎng)站的訪問(wèn)記錄,進(jìn)行記錄信息挖掘,從中了解用戶(hù)對(duì)該網(wǎng)站內(nèi)容的興趣,進(jìn)而對(duì)用戶(hù)提供信息推送服務(wù)和定制服務(wù),以此吸引更多用戶(hù)訪問(wèn)該網(wǎng)站。

在軟件開(kāi)發(fā)階段,可以使用DataAnalytics輕量級(jí)業(yè)務(wù)數(shù)據(jù)可視化分析平臺(tái),這是數(shù)據(jù)挖掘技術(shù)的一項(xiàng)成果。該平臺(tái)能夠?qū)崿F(xiàn)異構(gòu)數(shù)據(jù)源的高效整合,可以兼容各種數(shù)據(jù)源類(lèi)型,支持海量數(shù)據(jù)??山尤隕xcel/CSV等數(shù)據(jù)文件、企業(yè)各種業(yè)務(wù)系統(tǒng)、第三方互聯(lián)網(wǎng)數(shù)據(jù)、公共數(shù)據(jù)服務(wù)平臺(tái)等來(lái)源,輕松整合所有相關(guān)業(yè)務(wù)數(shù)據(jù),幫助企業(yè)消滅數(shù)據(jù)孤島。企業(yè)利用該平臺(tái)可以完成數(shù)據(jù)的深度交互分析,DataAnalytics基于探索式分析,支持智能推薦圖形與圖表,二者可以協(xié)同過(guò)濾,幫助用戶(hù)快速定位,通過(guò)數(shù)據(jù)挖掘找出問(wèn)題,以拖拽式操作方法解決問(wèn)題。

3.4聚類(lèi)

在數(shù)據(jù)挖掘技術(shù)中聚類(lèi)指的是對(duì)各個(gè)環(huán)節(jié)數(shù)據(jù)加以分析,結(jié)合軟件工程的具體要求實(shí)現(xiàn)數(shù)據(jù)細(xì)化,以類(lèi)型細(xì)化作為基礎(chǔ),為原始數(shù)據(jù)類(lèi)型做出保障。通過(guò)聚類(lèi)可以讓同種類(lèi)型數(shù)據(jù)具有相似性特點(diǎn),在存在相似性的同時(shí),也存在一定的差異,突出各自的特點(diǎn)。應(yīng)用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)聚類(lèi)劃分時(shí),面對(duì)的對(duì)象無(wú)法預(yù)測(cè),與其他算法相比,聚類(lèi)擁有更加廣泛的應(yīng)用范圍,進(jìn)行數(shù)據(jù)分析時(shí)更加獨(dú)特,挖掘信息數(shù)據(jù)時(shí)可以確保檢測(cè)結(jié)果的有效性與真實(shí)性。

4結(jié)論

總而言之,隨著信息技術(shù)的深入發(fā)展,人們已經(jīng)步入信息時(shí)代,數(shù)據(jù)挖掘技術(shù)也成為對(duì)信息數(shù)據(jù)展開(kāi)處理和存儲(chǔ)的有效方式。在軟件工程中應(yīng)用數(shù)據(jù)挖掘技術(shù),有利于提高軟件開(kāi)發(fā)效率,提升軟件管理質(zhì)量,加強(qiáng)數(shù)據(jù)挖掘力度,使數(shù)據(jù)挖掘技術(shù)發(fā)揮巨大效果,人們可以應(yīng)用數(shù)據(jù)挖掘技術(shù)完成數(shù)據(jù)的聚類(lèi)和網(wǎng)站設(shè)計(jì),為人們的生活帶來(lái)便利。

[軟件工程碩士論文參考文獻(xiàn)]

[1]張立鑒.數(shù)據(jù)挖掘技術(shù)在軟件工程中的應(yīng)用研究[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2019(6):47-48.

[2]王祥順.數(shù)據(jù)挖掘技術(shù)在軟件工程中的實(shí)踐與探索[J].電腦編程技巧與維護(hù),2019(4):82-83+100.

第5篇

關(guān)鍵詞:數(shù)據(jù)倉(cāng)庫(kù),數(shù)據(jù)挖掘,電子政務(wù)

 

在電子政務(wù)信息建設(shè)中已經(jīng)有了成功的電子政務(wù)業(yè)務(wù)處理和信息管理系統(tǒng),卓有成效的過(guò)程控制指揮系統(tǒng)和辦公自動(dòng)化系統(tǒng)。但從電子政務(wù)全局的高層次和大范圍的分析角度去審視,則感到數(shù)據(jù)分散,難以整合。因此,研究電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘很有必要。

1.電子政務(wù)信息建設(shè)的數(shù)據(jù)倉(cāng)庫(kù)

電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)是電子政務(wù)信息架構(gòu)的新焦點(diǎn),它提供集成化的和歷史化的電子政務(wù)業(yè)務(wù)數(shù)據(jù);它集成種類(lèi)不同的電子政務(wù)應(yīng)用系統(tǒng);電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)從事物發(fā)展和歷史角度來(lái)組織和存儲(chǔ)電子政務(wù)數(shù)據(jù),以供信息化和分析處理之用。它是對(duì)現(xiàn)有電子政務(wù)信息系統(tǒng)深刻認(rèn)識(shí)的結(jié)果,來(lái)自異地、異構(gòu)的電子政務(wù)數(shù)據(jù)源或數(shù)據(jù)庫(kù)的數(shù)據(jù)經(jīng)過(guò)加工后在電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)中存儲(chǔ)、提取和維護(hù)。傳統(tǒng)的電子政務(wù)數(shù)據(jù)庫(kù)主要面向業(yè)務(wù)處理,而電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)面向復(fù)雜數(shù)據(jù)分析、高層決策支持。電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)提供來(lái)自種類(lèi)不同的電子政務(wù)應(yīng)用系統(tǒng)的集成化和歷史化的數(shù)據(jù),為全局范圍的電子政務(wù)戰(zhàn)略決策和社會(huì)治安長(zhǎng)期趨勢(shì)分析提供有效的支持。免費(fèi)論文參考網(wǎng)。目前,經(jīng)過(guò)近20年的建設(shè),全國(guó)電子政務(wù)信息系統(tǒng)建設(shè)已經(jīng)積累了大量數(shù)據(jù),對(duì)于電子政務(wù)工作起了意義深遠(yuǎn)的推動(dòng)作用,電子政務(wù)工作已經(jīng)初步進(jìn)入了數(shù)字化、電子化、信息化,極大地提高了電子政務(wù)工作的效率。以土地管理為例,現(xiàn)在的管理方式是以前不能比擬的。但是,如何將這些數(shù)據(jù)用于全局范圍的戰(zhàn)略決策和長(zhǎng)期趨勢(shì)分析,則是需要進(jìn)一步解決的問(wèn)題。例如,土地問(wèn)題,近年來(lái)始終與住房問(wèn)題、物價(jià)問(wèn)題和就業(yè)問(wèn)題一起,成為全國(guó)人民非常關(guān)心的問(wèn)題,其問(wèn)題有表面的原因,也有深刻的歷史原因和現(xiàn)實(shí)原因。如何花較少的代價(jià),將此問(wèn)題解決得圓滿(mǎn)一些,建設(shè)電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)是一重要手段。免費(fèi)論文參考網(wǎng)。

電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)是一種全新的分布式異構(gòu)數(shù)據(jù)系統(tǒng)的集成方法:把各個(gè)信息源中與決策支持有關(guān)的數(shù)據(jù),預(yù)先經(jīng)過(guò)提取、轉(zhuǎn)換、過(guò)濾,并與相應(yīng)信息源中其它數(shù)據(jù)進(jìn)行合并,按主題存放在一個(gè)中央數(shù)據(jù)庫(kù)中,當(dāng)用戶(hù)需要查詢(xún)時(shí),可以直接訪問(wèn)中央數(shù)據(jù)庫(kù),不必訪問(wèn)其它數(shù)據(jù)源。

電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)包括3個(gè)基本的功能部分。數(shù)據(jù)獲取:從電子政務(wù)一線數(shù)據(jù)源獲取數(shù)據(jù),數(shù)據(jù)被區(qū)分出來(lái),進(jìn)行拷貝或重新定義格式等處理后,準(zhǔn)備載入電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)。數(shù)據(jù)存儲(chǔ)和管理:負(fù)責(zé)電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的內(nèi)部維護(hù)和管理,包括數(shù)據(jù)存儲(chǔ)的組織、數(shù)據(jù)的維護(hù)、數(shù)據(jù)的分發(fā)。信息訪問(wèn):屬于電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的前端,面向用戶(hù)------提取信息、分析數(shù)據(jù)集、實(shí)施決策。進(jìn)行數(shù)據(jù)訪問(wèn)的工具主要是查詢(xún)生成工具、多維分析工具和數(shù)據(jù)挖掘工具等。

電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn):針對(duì)全局電子政務(wù)業(yè)務(wù)戰(zhàn)略分析,非常詳細(xì)的數(shù)據(jù),第三范式數(shù)據(jù)結(jié)構(gòu),高層次和大范圍的分析,詳細(xì)的歷史信息,存儲(chǔ)和管理大量的數(shù)據(jù),整個(gè)數(shù)據(jù)結(jié)構(gòu)統(tǒng)一,索引較少。

因此,原來(lái)對(duì)分布式異構(gòu)數(shù)據(jù)的復(fù)雜訪問(wèn)變成直接在該倉(cāng)庫(kù)上進(jìn)行即席查詢(xún)的簡(jiǎn)單操作:用戶(hù)需要某些指定信息和快速查詢(xún),但不一定要最新信息,在這個(gè)環(huán)境中需要高性能和訪問(wèn)信息源中不能長(zhǎng)期保存的信息。

電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)是一個(gè)比傳統(tǒng)解決方法更為有效的集成技術(shù),即對(duì)感興趣的數(shù)據(jù)及其變化預(yù)先提取并按公共模式集成到一個(gè)中央數(shù)據(jù)庫(kù)中,由于分布和異構(gòu)問(wèn)題被提前解決,用戶(hù)可以在中央數(shù)據(jù)倉(cāng)庫(kù)上進(jìn)行高效的查詢(xún)或分析。

由于電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu),必須照顧電子政務(wù)已有的信息系統(tǒng)的體系結(jié)構(gòu),以及相關(guān)的基礎(chǔ)設(shè)施,因此,確定電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu),必須兼顧用戶(hù)需求的多變性、基礎(chǔ)設(shè)施的復(fù)雜性、技術(shù)更新的步伐。數(shù)據(jù)倉(cāng)庫(kù)本身可以使用通用的或者特別要求的數(shù)據(jù)庫(kù)管理系統(tǒng)來(lái)實(shí)現(xiàn)。盡管在圖中表示的是一個(gè)單獨(dú)的、中央化的數(shù)據(jù)倉(cāng)庫(kù),實(shí)際上,為了達(dá)到理想的性能,分布式和并行性往往是必然的選擇。

電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)中一些比較重要的問(wèn)題是:數(shù)據(jù)倉(cāng)庫(kù)管理,數(shù)據(jù)源和數(shù)據(jù)倉(cāng)庫(kù)的演化,復(fù)制帶來(lái)的不一致,過(guò)期數(shù)據(jù)處理等。電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)管理涉及電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)的各個(gè)階段,與之相關(guān)的問(wèn)題涉及電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)、數(shù)據(jù)裝載、元數(shù)據(jù)管理等。數(shù)據(jù)源和數(shù)據(jù)倉(cāng)庫(kù)演化,則是研究電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)體系結(jié)構(gòu)如何順利處理信息源的變化問(wèn)題,如模式變化、新信息源加入,舊信息源刪除等。復(fù)制不一致,是指從各個(gè)信息源拷貝來(lái)的同一信息或者相關(guān)信息出現(xiàn)的不一致,一般用集成器對(duì)這些數(shù)據(jù)進(jìn)行清理。對(duì)于電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù),可能會(huì)保存很多年,但是一般不會(huì)永遠(yuǎn)保留下去,這就要求研究比較可靠的技術(shù)以保證過(guò)期的數(shù)據(jù),可以自動(dòng)而有效地從電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)中被清除出去。

2.電子政務(wù)數(shù)據(jù)挖掘一般方法

電子政務(wù)部門(mén)在過(guò)去若干年的時(shí)間里都積累了海量的、以不同形式存貯的數(shù)據(jù)資料,例如戶(hù)籍資料、土地資料和規(guī)劃管理資料等。此外,電子政務(wù)工作所涉及到的數(shù)據(jù)類(lèi)型是相當(dāng)復(fù)雜的,例如:用地指數(shù),其特征抽取相當(dāng)復(fù)雜;土地配置規(guī)律特點(diǎn),其數(shù)據(jù)聯(lián)系是非平面的,也是非標(biāo)準(zhǔn)立體的。由于這些資料十分繁雜,要從中發(fā)現(xiàn)有價(jià)值的信息或者知識(shí),達(dá)到為決策服務(wù)的目的,成為非常艱巨的任務(wù)。電子政務(wù)數(shù)據(jù)挖掘一般方法的提出,讓用戶(hù)有能力最終認(rèn)識(shí)數(shù)據(jù)的真正價(jià)值,即蘊(yùn)藏在數(shù)據(jù)中的信息和知識(shí)。

電子政務(wù)數(shù)據(jù)挖掘是按照既定的電子政務(wù)業(yè)務(wù)目標(biāo),對(duì)大量的數(shù)據(jù)進(jìn)行探索、揭示隱藏其中的規(guī)律性并進(jìn)一步將其模型化的先進(jìn)、有效的方法。數(shù)據(jù)是按照電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的概念重組過(guò)的,在電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)、信息才能最有效的支持電子政務(wù)數(shù)據(jù)挖掘。因此,首先從正在運(yùn)行的電子政務(wù)計(jì)算機(jī)系統(tǒng)中完整地將數(shù)據(jù)取出;其次各個(gè)環(huán)節(jié)的數(shù)據(jù)要按一定的規(guī)則有機(jī)、準(zhǔn)確地銜接起來(lái),以極易取用的數(shù)據(jù)結(jié)構(gòu)方式,全面地描述該業(yè)務(wù)目標(biāo)。

電子政務(wù)數(shù)據(jù)挖掘就是從大量的、不完全的、模糊的、有噪聲的、隨機(jī)的數(shù)據(jù)中,提取隱含在其中的、事前不知道的、但是潛在有用的信息和知識(shí)的過(guò)程。電子政務(wù)數(shù)據(jù)挖掘技術(shù)是面向應(yīng)用的,不僅面向特定數(shù)據(jù)庫(kù)的簡(jiǎn)單檢索和查詢(xún)調(diào)用,而且要對(duì)這些數(shù)據(jù)進(jìn)行微觀和宏觀的分析、統(tǒng)計(jì)、綜合和推理,從中發(fā)現(xiàn)事件間的相互關(guān)系,對(duì)未來(lái)的活動(dòng)進(jìn)行預(yù)測(cè)。

3.基于電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘

基于電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘的方法,是以電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)為中心,各信息源由原始數(shù)據(jù)庫(kù),經(jīng)過(guò)打包和集成到電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù);基于電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘,是通過(guò)模型庫(kù)和方法庫(kù)的協(xié)助,對(duì)電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行數(shù)據(jù)挖掘,從而獲得分析預(yù)測(cè)結(jié)果和決策支持的。

基于電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)挖掘的特點(diǎn):1、規(guī)模: 電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)中集成和存儲(chǔ)著來(lái)自若干分布、異質(zhì)的信息源的數(shù)據(jù)。免費(fèi)論文參考網(wǎng)。這些信息源本身就可能是一個(gè)規(guī)模龐大的電子政務(wù)數(shù)據(jù)庫(kù),可以想象數(shù)據(jù)倉(cāng)庫(kù)會(huì)有比一般數(shù)據(jù)庫(kù)系統(tǒng)更大的數(shù)據(jù)規(guī)模。如何從如此巨量的數(shù)據(jù)中有效的提取有用信息,需要各方面技術(shù)的進(jìn)步。從當(dāng)前發(fā)展來(lái)看,支持并行處理的分布式DBMS、具有大規(guī)模并行處理(MPP)能力的計(jì)算機(jī)、超大規(guī)模的存儲(chǔ)機(jī)構(gòu)等技術(shù)的發(fā)展和協(xié)同將使電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)走向?qū)嵱谩?、歷史數(shù)據(jù):傳統(tǒng)的電子政務(wù)數(shù)據(jù)庫(kù)系統(tǒng)為了獲得最大的執(zhí)行效率,往往存儲(chǔ)盡可能少的數(shù)據(jù)量。因?yàn)?,擁有的?shù)據(jù)越多,數(shù)據(jù)組織、重構(gòu)、瀏覽、索引和監(jiān)控的難度越大。傳統(tǒng)電子政務(wù)數(shù)據(jù)庫(kù)系統(tǒng)在“時(shí)間”方向的長(zhǎng)度很有限。比較而言,電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的根本特征之一就是進(jìn)行長(zhǎng)時(shí)間的歷史數(shù)據(jù)存儲(chǔ),這使得可以進(jìn)行數(shù)據(jù)長(zhǎng)期趨勢(shì)的分析。電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)為長(zhǎng)期決策行為提供了獨(dú)一無(wú)二的支持,電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)在時(shí)間方向上具有大的縱深性。3、數(shù)據(jù)集成和綜合性:從全局的角度看,數(shù)據(jù)倉(cāng)庫(kù)集成了電子政務(wù)內(nèi)各部門(mén)的全面的、綜合的數(shù)據(jù)。電子政務(wù)數(shù)據(jù)挖掘面對(duì)的是關(guān)系更加復(fù)雜的全局模式的知識(shí)發(fā)現(xiàn),能更好地滿(mǎn)足高層戰(zhàn)略決策的要求。在電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)中,數(shù)據(jù)已經(jīng)被充分收集起來(lái)了,進(jìn)行了整理、合并,有些還進(jìn)行了初步的分析處理。另外,電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)中對(duì)數(shù)據(jù)不同粒度的集成和綜合,更有效地支持了多層次、多種知識(shí)的挖掘。4、查詢(xún)支持 電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)面向決策支持,電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)的體系結(jié)構(gòu)努力保證查詢(xún)(Query)和分析的實(shí)時(shí)性。電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)成只讀方式,用戶(hù)可以直接訪問(wèn)電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù),挖掘過(guò)程可以做到實(shí)時(shí)交互,使決策者的思維保持連續(xù),挖掘出更深入、更有價(jià)值的知識(shí)。

電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘是將來(lái)電子政務(wù)智能化的基礎(chǔ),可以幫助用戶(hù)得到他們想知道的信息,有些數(shù)據(jù)也許隱藏人們意想不到的信息,數(shù)據(jù)挖掘就是讓用戶(hù)發(fā)現(xiàn)這些隱藏信息的工具。電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘研究和應(yīng)用所面臨的主要問(wèn)題:挖掘的對(duì)象:更大型的數(shù)據(jù)庫(kù)、更高的維數(shù)和屬性之間的復(fù)雜關(guān)系;多種形式的輸入數(shù)據(jù);用戶(hù)參與和領(lǐng)域知識(shí)的融合;證實(shí)(Validation)技術(shù);知識(shí)的表達(dá)和解釋機(jī)制;知識(shí)的更新和維護(hù);多平臺(tái)支持、與其他系統(tǒng)的集成。

近年來(lái),電子政務(wù)利用信息技術(shù)的能力大幅度提高,大量數(shù)據(jù)庫(kù)被用于土地管理和城市規(guī)劃。為了利用這一巨大的信息資源,從中及時(shí)發(fā)現(xiàn)有用的知識(shí),提高信息的價(jià)值,使數(shù)據(jù)真正成為電子政務(wù)的有力武器,為電子政務(wù)自身的業(yè)務(wù)決策和戰(zhàn)略發(fā)展服務(wù),電子政務(wù)數(shù)據(jù)倉(cāng)庫(kù)和數(shù)據(jù)挖掘是現(xiàn)在和將來(lái)的一個(gè)重要發(fā)展方向。

第6篇

論文摘要:隨著數(shù)據(jù)庫(kù)技術(shù)和人工智能技術(shù)的不斷進(jìn)步,數(shù)據(jù)挖掘技術(shù)逐步發(fā)展起來(lái),作為當(dāng)前計(jì)算機(jī)信息技術(shù)中的一項(xiàng)較為新興的技術(shù),綜合運(yùn)用了數(shù)理統(tǒng)計(jì)、模式識(shí)別、計(jì)算智能、人工智能等多項(xiàng)先進(jìn)技術(shù),主要是從大量的數(shù)據(jù)中來(lái)發(fā)現(xiàn)和挖掘一些隱含的有價(jià)值的知識(shí),從大型的數(shù)據(jù)庫(kù)數(shù)據(jù)中挖掘一些人們比較感興趣的知識(shí),本文主要講了數(shù)據(jù)挖掘技術(shù)的概念、數(shù)據(jù)挖掘技術(shù)在保護(hù)設(shè)備故障信息中的實(shí)現(xiàn)方法以及數(shù)據(jù)挖掘技術(shù)保護(hù)設(shè)備故障信息管理的基本功能等問(wèn)題。

數(shù)據(jù)挖掘技術(shù)作為當(dāng)前計(jì)算機(jī)信息技術(shù)中的一項(xiàng)較為新興的技術(shù),綜合運(yùn)用了數(shù)理統(tǒng)計(jì)、模式識(shí)別、計(jì)算智能、人工智能等多項(xiàng)先進(jìn)技術(shù),主要是從大量的數(shù)據(jù)中來(lái)發(fā)現(xiàn)和挖掘一些隱含的有價(jià)值的知識(shí),也就是從大型的數(shù)據(jù)庫(kù)數(shù)據(jù)中挖掘一些人們比較感興趣的知識(shí),這些被提取的知識(shí)通常會(huì)表現(xiàn)為模式、規(guī)律、規(guī)則和概念,將數(shù)據(jù)挖掘的所有對(duì)象定義成數(shù)據(jù)庫(kù)或者是文件系統(tǒng)以及其他的一些組織在一起的數(shù)據(jù)集合,數(shù)據(jù)挖掘技術(shù)也是現(xiàn)在智能理論系統(tǒng)的重要研究?jī)?nèi)容,已經(jīng)開(kāi)始被應(yīng)用于行政管理、醫(yī)學(xué)、金融、商業(yè)、工業(yè)等不同的領(lǐng)域當(dāng)中,在保護(hù)設(shè)備故障信息管理方面發(fā)揮出了積極的作用。

一、數(shù)據(jù)挖掘技術(shù)的概念

隨著數(shù)據(jù)庫(kù)技術(shù)和人工智能技術(shù)的不斷進(jìn)步,數(shù)據(jù)挖掘技術(shù)逐步發(fā)展起來(lái),主要是指從大量的數(shù)據(jù)中發(fā)現(xiàn)和挖掘一些隱含的有價(jià)值的有用信息和知識(shí),這些被提取的知識(shí)通常會(huì)表現(xiàn)為模式、規(guī)律、規(guī)則和概念,將數(shù)據(jù)挖掘的所有對(duì)象定義成數(shù)據(jù)庫(kù)或者是文件系統(tǒng)以及其他的一些組織在一起的數(shù)據(jù)集合,當(dāng)前數(shù)據(jù)挖掘技術(shù)已經(jīng)逐漸被應(yīng)用于了醫(yī)藥業(yè)、保險(xiǎn)業(yè)、制造業(yè)、電信業(yè)、銀行業(yè)、市場(chǎng)營(yíng)銷(xiāo)等不同的領(lǐng)域,隨著計(jì)算技術(shù)、網(wǎng)絡(luò)技術(shù)以及信息技術(shù)的不斷進(jìn)步,在故障診斷過(guò)程中所采集到的數(shù)據(jù)可以被廣泛地存儲(chǔ)在不同的數(shù)據(jù)庫(kù)當(dāng)中,如果依然采用傳統(tǒng)的數(shù)據(jù)處理方法來(lái)對(duì)這些海量的信息數(shù)據(jù)進(jìn)行分析處理,不僅會(huì)浪費(fèi)大量的實(shí)踐而且也很難挖掘到有效的信息數(shù)據(jù),同時(shí),盡管智能診斷以及專(zhuān)家系統(tǒng)等方式在故障的診斷過(guò)程中已經(jīng)被得到了廣泛的應(yīng)用,但是這些方法卻仍然存在著很多推理困難、知識(shí)瓶頸等一些尚未完全被解決的問(wèn)題,采用數(shù)據(jù)挖掘技術(shù)就可以比較有效地來(lái)解決這些難題,在故障診斷的過(guò)程中發(fā)揮其獨(dú)特的優(yōu)勢(shì)。wWW.133229.Com從不同的角度進(jìn)行分析,數(shù)據(jù)挖掘技術(shù)可以分為不同的方法,就目前的發(fā)展現(xiàn)狀來(lái)看,常用的數(shù)據(jù)挖掘技術(shù)方法主要有遺傳算法、粗集方法、神經(jīng)網(wǎng)絡(luò)方法以及決策樹(shù)方法等。

二、數(shù)據(jù)挖掘技術(shù)在保護(hù)設(shè)備故障信息中的實(shí)現(xiàn)方法

1.基本原理。在設(shè)備出現(xiàn)故障時(shí)采用數(shù)據(jù)挖掘技術(shù)對(duì)設(shè)備進(jìn)行一系列的故障診斷,也就是說(shuō)根據(jù)這一設(shè)備的運(yùn)行記錄,對(duì)其運(yùn)行的趨勢(shì)進(jìn)行預(yù)測(cè),并對(duì)其可能存在的運(yùn)行狀態(tài)進(jìn)行分類(lèi),故障診斷的實(shí)質(zhì)就是一種模式識(shí)別方式,對(duì)機(jī)器設(shè)備的故障進(jìn)行診斷的過(guò)程也就是該模式匹配和獲取的過(guò)程。

2.對(duì)故障診斷的數(shù)據(jù)挖掘方法建模。針對(duì)機(jī)械故障的診斷來(lái)說(shuō),首先就應(yīng)當(dāng)獲取一些關(guān)于本機(jī)組的一些運(yùn)行參數(shù),既要包括機(jī)器在正常運(yùn)行以及平穩(wěn)工作時(shí)的信息數(shù)據(jù),也應(yīng)當(dāng)包括機(jī)器在出現(xiàn)故障時(shí)的一些信息數(shù)據(jù),在現(xiàn)場(chǎng)的監(jiān)控系統(tǒng)中往往就會(huì)存在著相應(yīng)的正常工作狀態(tài)下以及出現(xiàn)故障時(shí)的不同運(yùn)行參數(shù),而數(shù)據(jù)挖掘的任務(wù)就是從這些雜亂無(wú)章的信息樣本庫(kù)中找出其中所隱藏著的內(nèi)在規(guī)律,并且從中提取各自故障的不同特征,在對(duì)故障的模式進(jìn)行劃分時(shí),我們通??梢越柚怕式y(tǒng)計(jì)的方式,在對(duì)故障模式進(jìn)行識(shí)別時(shí)可以采用較為成熟的關(guān)聯(lián)規(guī)則理論,實(shí)現(xiàn)變量之間的關(guān)聯(lián)關(guān)系,并最終得到分類(lèi)所需要用到的一些規(guī)則,從而最終達(dá)到分類(lèi)的目的,依據(jù)這些規(guī)則,就可以對(duì)一些新來(lái)的數(shù)據(jù)進(jìn)行判斷,而且可以準(zhǔn)確地對(duì)故障進(jìn)行分類(lèi),找出故障所產(chǎn)生的原因和解決故障的正確方法。

三、數(shù)據(jù)挖掘技術(shù)保護(hù)設(shè)備故障信息管理的基本功能

1.數(shù)據(jù)傳輸功能。數(shù)據(jù)挖掘技術(shù)保護(hù)設(shè)備故障信息管理與分析系統(tǒng)的主要數(shù)據(jù)來(lái)源就是故障信息的分站系統(tǒng),而分站系統(tǒng)中的數(shù)據(jù)是各個(gè)子站的一個(gè)數(shù)據(jù)匯總,而保護(hù)設(shè)備故障信息管理與分析系統(tǒng)所采用的獲取數(shù)據(jù)的主要方式就是一些專(zhuān)門(mén)的通信程序構(gòu)建起系統(tǒng)與分站之間的聯(lián)系,將分站上的一些匯總數(shù)據(jù)傳輸?shù)焦收闲畔⑾到y(tǒng)的數(shù)據(jù)庫(kù)中,分析系統(tǒng)所具有的數(shù)據(jù)傳輸功能,在進(jìn)行數(shù)據(jù)的處理時(shí)又能做到不影響原先分站數(shù)據(jù)庫(kù)的正常運(yùn)行,并且具備抗干擾能力強(qiáng)、計(jì)算效率高的優(yōu)點(diǎn)。

2.數(shù)據(jù)的分析功能。系統(tǒng)在正常運(yùn)行時(shí),會(huì)從故障信息子站或者是分站采集相關(guān)的數(shù)據(jù)并且對(duì)這些采集到的數(shù)據(jù)進(jìn)行分析整理,最終得到有用的數(shù)據(jù)信息,利用數(shù)據(jù)挖掘技術(shù)對(duì)龐大的故障數(shù)據(jù)進(jìn)行分析、分類(lèi)以及整理,能夠有效地找出有用的信息,歸并一些冗余的信息,對(duì)信息進(jìn)行有效地存儲(chǔ)和分類(lèi)。另外,數(shù)據(jù)挖掘技術(shù)還具有信息查詢(xún)的功能,可以進(jìn)行不同條件下的查詢(xún),例如按時(shí)間段、報(bào)告類(lèi)型、設(shè)備型號(hào)以及單位等進(jìn)行查詢(xún),實(shí)現(xiàn)查詢(xún)后的備份轉(zhuǎn)存等,根據(jù)故障信息系統(tǒng)所提供高的數(shù)據(jù)信息以及本系統(tǒng)庫(kù)中所保存的一些整定阻抗值,可以通過(guò)邏輯判斷生產(chǎn)繼電保護(hù)動(dòng)作的分析報(bào)告,主要包括對(duì)故障過(guò)程的簡(jiǎn)述、故障切除情況以及保護(hù)動(dòng)作情況等,可以便于繼電保護(hù)人員直觀的對(duì)保護(hù)裝置的動(dòng)作情況進(jìn)行分析。

四、結(jié)語(yǔ)

隨著企業(yè)自動(dòng)化程度的不斷提高以及數(shù)據(jù)庫(kù)技術(shù)的迅速發(fā)展,很多企業(yè)在一些重要的設(shè)備方面都安裝了監(jiān)測(cè)系統(tǒng),對(duì)設(shè)備運(yùn)行過(guò)程中的一些重要參數(shù)和數(shù)據(jù)進(jìn)行采集,采用數(shù)據(jù)挖掘技術(shù)可以有效地解決設(shè)備故障診斷中的一些知識(shí)獲取瓶頸,將數(shù)據(jù)挖掘系統(tǒng)充分應(yīng)用到監(jiān)控系統(tǒng)中,有效解決故障診斷中的一些困難,事實(shí)證明,將數(shù)據(jù)挖掘技術(shù)應(yīng)用到故障診斷中是非常有效的,也是值得研究和學(xué)習(xí)的新型技術(shù)手段。

參考文獻(xiàn):

[1]李勛,龔慶武,楊群瑛,羅思需,李社勇.基于數(shù)據(jù)挖掘技術(shù)的保護(hù)設(shè)備故障信息管理與分析系統(tǒng)[j].電力自動(dòng)化設(shè)備,2011,9

[2]李建業(yè),劉志遠(yuǎn),蔡乾,趙洪波.基于web的故障信息系統(tǒng)[j].電力信息化,2007,s1

第7篇

【關(guān)鍵詞】 計(jì)算機(jī) 數(shù)據(jù)挖掘技術(shù) 開(kāi)發(fā)

引言:計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)是基于計(jì)算機(jī)原有的功能基礎(chǔ)之上,融入了一些統(tǒng)計(jì)學(xué)理論,使人們可以利用數(shù)據(jù)挖掘技術(shù)在眾多的計(jì)算機(jī)系統(tǒng)內(nèi)部的信息中抓取自己需要的信息和數(shù)據(jù)。計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的出現(xiàn)極大的促進(jìn)了社會(huì)整體的進(jìn)步,引領(lǐng)了社會(huì)各個(gè)領(lǐng)域內(nèi)的數(shù)據(jù)量潮流,人們要想在無(wú)限的數(shù)據(jù)中采集有用信息,就必須深入計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)研究。

一、計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)流程

1.1明確數(shù)據(jù)挖掘目的

由于數(shù)據(jù)挖掘技術(shù)的功能是多種多樣的,所以在開(kāi)發(fā)具體的計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)過(guò)程中需要根據(jù)自身需要明確數(shù)據(jù)挖掘目的,進(jìn)而選擇對(duì)應(yīng)數(shù)據(jù)庫(kù)。因?yàn)樵陂_(kāi)發(fā)過(guò)程中,不同的數(shù)據(jù)挖掘目標(biāo)需要依靠不同的挖掘技術(shù)數(shù)據(jù)算法,如果目的不明很容易造成最終開(kāi)發(fā)結(jié)果的偏差[1]。

1.2數(shù)據(jù)選擇和預(yù)處理

明確數(shù)據(jù)挖掘目標(biāo)、數(shù)據(jù)庫(kù)后還要對(duì)所持有的數(shù)據(jù)進(jìn)行選擇和預(yù)處理,數(shù)據(jù)選擇是要將數(shù)據(jù)中的部分信息納入數(shù)據(jù)挖掘研究范圍內(nèi),預(yù)處理是將這些數(shù)據(jù)中的錯(cuò)誤信息進(jìn)行刪除和修正,確保列下有用信息。

1.3數(shù)據(jù)挖掘

數(shù)據(jù)挖掘過(guò)程中要有兩個(gè)步驟,其一是根據(jù)挖掘目標(biāo)確定接下來(lái)要利用的開(kāi)發(fā)技術(shù)和采用的算法,其二是在確定了挖掘技術(shù)和數(shù)據(jù)算法后構(gòu)建出數(shù)學(xué)模型,以此來(lái)推動(dòng)挖掘技術(shù)的開(kāi)發(fā)。

1.4評(píng)估結(jié)果

評(píng)估結(jié)果的最大作用就是對(duì)開(kāi)發(fā)出的數(shù)據(jù)挖掘結(jié)果進(jìn)行科學(xué)評(píng)估,對(duì)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)成果進(jìn)行檢測(cè)和驗(yàn)證。如果數(shù)據(jù)挖掘結(jié)果不能夠達(dá)到數(shù)據(jù)挖掘開(kāi)發(fā)目的要求,就要及時(shí)進(jìn)行修正,如果數(shù)據(jù)開(kāi)發(fā)結(jié)果符合數(shù)據(jù)開(kāi)發(fā)目的要求,那么就可以將其投入到實(shí)踐應(yīng)用之中[2]。

二、計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)

1、可視化技術(shù)開(kāi)發(fā)。要想得到有效的信息,就需要從計(jì)算機(jī)系統(tǒng)中獲得的信息入手,但是當(dāng)前的網(wǎng)絡(luò)信息中存在不少的隱性信息,這些信息的獲得就要依靠計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)。采用計(jì)算機(jī)挖掘技術(shù)可以有效的抓取隱性信息的某些特征,當(dāng)利用散點(diǎn)圖的方式將這些隱性信息表現(xiàn)出來(lái)。所以可視化技術(shù)是計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)開(kāi)發(fā)項(xiàng)目中的一個(gè)重點(diǎn)。

2、聯(lián)機(jī)分析處理。網(wǎng)絡(luò)是復(fù)雜的,其中的網(wǎng)絡(luò)信息和數(shù)據(jù)更是十分的龐雜,要想快速、準(zhǔn)確的抓取到自己想要的信息,需要依靠聯(lián)機(jī)分析出不同地域和時(shí)段的多維數(shù)據(jù),聯(lián)機(jī)分析處理方式需要依靠用戶(hù)的配合。在處理多維數(shù)據(jù)時(shí),需要所有計(jì)算機(jī)用戶(hù)自行的使用或者篩選出分析算法,利用這些分析算法對(duì)數(shù)據(jù)做處理,這樣對(duì)探索數(shù)據(jù)也有巨大的推動(dòng)作用。

3、決策樹(shù)。計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)中需要對(duì)決策樹(shù)進(jìn)行規(guī)則化建立,決策樹(shù)是一項(xiàng)重要的開(kāi)發(fā)項(xiàng)目,因?yàn)闆Q策樹(shù)的作用是發(fā)揮預(yù)測(cè)和分類(lèi)的功能,對(duì)所處理的數(shù)據(jù)信息進(jìn)行具體的預(yù)測(cè)和分類(lèi)。目前開(kāi)發(fā)的決策樹(shù)算法已經(jīng)有很多種,主要有SLIQ、SPRINT、ID3、C4.5等,SLIQ算法具備連續(xù)性屬性,還可以對(duì)數(shù)據(jù)做出具體的分類(lèi),SPRINT算法與SLIQ算法有同樣的功能屬性,并且這兩種算法可以通過(guò)大型訓(xùn)練集對(duì)決策時(shí)做出歸納[3]。

4、計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)。計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)在開(kāi)發(fā)之中借助了醫(yī)學(xué)神經(jīng)系統(tǒng)的研究結(jié)果,將人體神經(jīng)元研究脈絡(luò)通過(guò)技術(shù)處理形成了計(jì)算機(jī)網(wǎng)絡(luò)神經(jīng)的研究,并且經(jīng)過(guò)一系列的深入探索,目前已經(jīng)取得了重大的成果。計(jì)算機(jī)中研發(fā)出的神經(jīng)網(wǎng)絡(luò)是安全輸入、輸出和處理單元三種類(lèi)型進(jìn)行規(guī)劃的,這三個(gè)層面代表了計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)系統(tǒng),當(dāng)前的開(kāi)發(fā)結(jié)果中顯示,可以利用計(jì)算機(jī)神經(jīng)網(wǎng)絡(luò)技術(shù)實(shí)現(xiàn)數(shù)據(jù)的調(diào)整、計(jì)算和整理。

5、遺傳算法。計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)中借鑒了許多其他學(xué)科領(lǐng)域中的研究方向和理論,在自然學(xué)科中,生物基因可以通過(guò)遺傳中的不同變化促進(jìn)后代的自我優(yōu)化,利用這種思想理論,在計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)中也可以通過(guò)對(duì)不同模型進(jìn)行組合、演變來(lái)創(chuàng)新開(kāi)發(fā)出新的數(shù)據(jù)算法。

結(jié)束語(yǔ):計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)屬于當(dāng)前社會(huì)中最重要的分析工具之一,數(shù)據(jù)挖掘技術(shù)已經(jīng)被各個(gè)領(lǐng)域廣泛的應(yīng)用,并且其功能得到驗(yàn)證,極大的促進(jìn)了社會(huì)行業(yè)的快速發(fā)展。隨著科技水平的日益提升,相信計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)將會(huì)得到更多方面的創(chuàng)新研究和開(kāi)發(fā),給社會(huì)帶來(lái)更大的促進(jìn)作用。

參 考 文 獻(xiàn)

[1]夏天維. 計(jì)算機(jī)數(shù)據(jù)挖掘技術(shù)的開(kāi)發(fā)及其應(yīng)用探究[A]. 《Q策與信息》雜志社、北京大學(xué)經(jīng)濟(jì)管理學(xué)院.“決策論壇――管理科學(xué)與工程研究學(xué)術(shù)研討會(huì)”論文集(下)[C].《決策與信息》雜志社、北京大學(xué)經(jīng)濟(jì)管理學(xué)院:,2016:1.

第8篇

關(guān)鍵詞: 科研成果管理; 決策支持; 數(shù)據(jù)倉(cāng)庫(kù); 聯(lián)機(jī)分析處理; 數(shù)據(jù)挖掘

中圖分類(lèi)號(hào): TN911?34; TM417 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2016)07?0120?04

Abstract: The traditional scientific research achievement management uses the database to store the result data. The multiple data types of the scientific research achievement and unified storage way become the obstacle to obtain the valid result data in decision?making analysis, simultaneously the traditional scientific research achievement system can only extract the result information. In view of the above problems, the scientific research achievement management and decision support system based on data warehouse is proposed, in which the data warehouse, on?line analysis processing (OLAP) and association rule mining algorithm are integrated. The system supports that the management personnel can discover the potential achievement, evaluate the scientific research projects, and reasonably allocate the human resources. The association rules of the data were mined in college paper database. It is found that paper quantity and time dimension have some relationship, which conforms with the practical training situation. The effectiveness of using Apriori in this system was verified.

Keywords: scientific research achievement management; decision support; data warehouse; OLAP; data mining

0 引 言

傳統(tǒng)的科研項(xiàng)目管理過(guò)程費(fèi)時(shí)費(fèi)力,且浪費(fèi)了大量的人力資源??蒲羞^(guò)程中產(chǎn)生的有價(jià)值的信息,也被這樣死板的管理方法給淹沒(méi)了,人們不能也不愿意從紙質(zhì)的資料文獻(xiàn)中去發(fā)現(xiàn)價(jià)值??蒲泄芾矸绞叫实蜁?huì)嚴(yán)重影響到科研項(xiàng)目開(kāi)發(fā)的進(jìn)度。隨著科學(xué)技術(shù)的快速發(fā)展,科研單位雖然對(duì)傳統(tǒng)方法進(jìn)行了改進(jìn),開(kāi)始建立管理系統(tǒng),但是還遠(yuǎn)遠(yuǎn)不能滿(mǎn)足要求[1]。

近年來(lái),國(guó)內(nèi)研究機(jī)構(gòu)也開(kāi)始重視科研項(xiàng)目管理方面的研究,目的多是為了提高項(xiàng)目管理的水平,對(duì)優(yōu)秀的科研成果進(jìn)行公示,共同分享研究信息[2]??蒲谐晒芾頉Q策支持系統(tǒng)的目的是為了解決傳統(tǒng)科研管理系統(tǒng)對(duì)成果資源的浪費(fèi)情況,加強(qiáng)對(duì)科研成果信息中潛在知識(shí)的利用,提高科研項(xiàng)目管理中對(duì)成果管理的有效性,利用數(shù)據(jù)挖掘充分發(fā)揮成果數(shù)據(jù)的潛力,為管理層提供決策支持依據(jù)[3]。

1 SRAM?DSS的需求分析

1.1 功能需求

科研成果管理決策支持系統(tǒng)主要面向科研項(xiàng)目的成果進(jìn)行管理,這些成果包括學(xué)術(shù)論文、著作、期刊、專(zhuān)利等。數(shù)據(jù)倉(cāng)庫(kù)的應(yīng)用可以對(duì)成果數(shù)據(jù)采取智能的分析,將成果數(shù)據(jù)進(jìn)行歸類(lèi)和按照成果數(shù)據(jù)的分析要求進(jìn)行整理,從中發(fā)現(xiàn)成果與項(xiàng)目、人員之間的聯(lián)系和潛在的規(guī)律,幫助決策者調(diào)整科研定位,做出科學(xué)的決策。

基本管理功能要求用戶(hù)可以利用本系統(tǒng)完成對(duì)成果的基本管理,包括成果提交、 審核、審批等流程的規(guī)范管理,還有對(duì)保密項(xiàng)目成果的加密處理,不僅要系統(tǒng)能夠保存使用過(guò)程中存入的成果,還可以導(dǎo)入外部數(shù)據(jù)庫(kù)的成果數(shù)據(jù),為數(shù)據(jù)挖掘功能提供數(shù)據(jù)基礎(chǔ),對(duì)數(shù)據(jù)的集成程度要求很高,因此需要利用數(shù)據(jù)倉(cāng)庫(kù)存放成果數(shù)據(jù)[4]。

1.2 用戶(hù)需求

系統(tǒng)的主要角色包括科研員,科研管理員,決策員,數(shù)據(jù)管理員,系統(tǒng)管理員。

2 總體設(shè)計(jì)

2.1 科研成果數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)

對(duì)于科研成果數(shù)據(jù)倉(cāng)庫(kù)從概念模型、邏輯模型、物理模型三方面進(jìn)行建模。需要根據(jù)不同的主題把數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)劃分好具體的維度[5]。以成果主題為例,成果數(shù)據(jù)包括成果名稱(chēng),成果類(lèi)型,成果來(lái)源,成果性質(zhì),成果作者,成果審核結(jié)果,所屬項(xiàng)目,成果完成時(shí)間,成果數(shù)量等,以此作為分析的依據(jù)。因?yàn)閿?shù)據(jù)倉(cāng)庫(kù)是多維的,OLAP要在多維數(shù)據(jù)集之上才能進(jìn)行,成果數(shù)據(jù)要滿(mǎn)足分析的要求可以根據(jù)維層次繼續(xù)劃分,成果類(lèi)型包括論文,專(zhuān)利,專(zhuān)著,軟件成果等;成果性質(zhì)包括科技,醫(yī)藥,航天等[6]。

(1) 邏輯模型

系統(tǒng)主要用戶(hù)利用成果信息進(jìn)行分析,以此來(lái)評(píng)估科研項(xiàng)目,并為決策者提供決策支持。分析成果事實(shí)表中的數(shù)據(jù)信息有用戶(hù)維、成果維、時(shí)間維。在OLAP分析時(shí)可以按照不同的層次進(jìn)行分析,如圖2所示。

(2) 物理模型

在設(shè)計(jì)數(shù)據(jù)倉(cāng)庫(kù)的物理模型時(shí),定義成果數(shù)據(jù)的數(shù)據(jù)標(biāo)準(zhǔn)是需要注意的重點(diǎn),目的是使成果數(shù)據(jù)在數(shù)據(jù)倉(cāng)庫(kù)中都有一個(gè)統(tǒng)一的格式,定義表示成果的相關(guān)屬性來(lái)描述成果邏輯關(guān)系,得到對(duì)成果數(shù)據(jù)倉(cāng)庫(kù)的特征進(jìn)行完整描述。系統(tǒng)采用SQLServer2008建立數(shù)據(jù)庫(kù)[7]。利用AnalysisServices獲得后臺(tái)數(shù)據(jù)庫(kù)里面的信息,這樣建立的數(shù)據(jù)倉(cāng)庫(kù)可以滿(mǎn)足需求。

2.2 SRAM?DSS功能的設(shè)計(jì)

為實(shí)現(xiàn)科研成果管理科學(xué),全方位管理,設(shè)計(jì)成果管理,決策支持,用戶(hù)管理,系統(tǒng)管理四個(gè)模塊的內(nèi)容,并且用戶(hù)在登陸系統(tǒng)之前要進(jìn)行身份驗(yàn)證。

(1) 成果管理模塊

成果管理主要包括成果查詢(xún),添加成果,申報(bào)成果,成果審核,成果加密以及成果導(dǎo)出等功能,系統(tǒng)采用分組加密方式進(jìn)行加密。

(2) 決策支持模塊

數(shù)據(jù)倉(cāng)庫(kù)是決策支持功能的數(shù)據(jù)基礎(chǔ),有了數(shù)據(jù)就需要更多的操作來(lái)完成決策支持。對(duì)于系統(tǒng)中不同的數(shù)據(jù)來(lái)源,包括外部導(dǎo)入數(shù)據(jù)利用ETL過(guò)程,實(shí)現(xiàn)規(guī)范化。然后將符合標(biāo)準(zhǔn)的數(shù)據(jù)裝入數(shù)據(jù)倉(cāng)庫(kù)中。然后針對(duì)用戶(hù)的要求進(jìn)行聯(lián)機(jī)分析處理和關(guān)聯(lián)規(guī)則挖掘。

(3) 用戶(hù)管理模塊

用戶(hù)在Web地址欄輸入U(xiǎn)RL進(jìn)入登錄,用戶(hù)名文本框內(nèi)輸入用戶(hù)姓名,在密碼框內(nèi)輸入密碼。系統(tǒng)認(rèn)證平臺(tái)會(huì)判斷用戶(hù)身份,若是新用戶(hù)要完成注冊(cè)才能登陸,注冊(cè)時(shí)要填寫(xiě)用戶(hù)真實(shí)的信息,才能獲得登陸權(quán)利,若用戶(hù)輸入的用戶(hù)信息正確,登錄成功。用戶(hù)可以在用戶(hù)管理中進(jìn)行創(chuàng)建,添加到用戶(hù)數(shù)據(jù)表中,也能獲得系統(tǒng)的使用權(quán)限[8]。

(4) 系統(tǒng)管理模塊

系統(tǒng)管理模塊主要是針對(duì)系統(tǒng)的權(quán)限分配,系統(tǒng)維護(hù)以及一些常用工具的設(shè)計(jì)。不同的用戶(hù)進(jìn)行的操作不同,能夠看到的信息不同,就要求系統(tǒng)控制權(quán)限,建立權(quán)限分配制度,有利于對(duì)用戶(hù)權(quán)限進(jìn)行合理的分配也保證了系統(tǒng)的安全運(yùn)行。系統(tǒng)維護(hù)是管理系統(tǒng)中必不可少的關(guān)鍵功能,包括對(duì)系統(tǒng)用戶(hù)數(shù)據(jù),成果信息數(shù)據(jù)等的備份工作,實(shí)現(xiàn)數(shù)據(jù)庫(kù)的安全管理,管理相應(yīng)功能結(jié)構(gòu)規(guī)范性,為系統(tǒng)的更新與升級(jí)提供支持。

3 系統(tǒng)實(shí)現(xiàn)

3.1 基于數(shù)據(jù)倉(cāng)庫(kù)的OLAP模型

聯(lián)機(jī)分析處理技術(shù)能夠高效的分析數(shù)據(jù),發(fā)現(xiàn)事物發(fā)展規(guī)律,捕獲異常和細(xì)節(jié)。OLAP支持?jǐn)?shù)據(jù)分析,而數(shù)據(jù)倉(cāng)庫(kù)里的數(shù)據(jù)是經(jīng)過(guò)ETL處理后集成到一起,保證了分析在一個(gè)快速的時(shí)間內(nèi)給予響應(yīng)。所以本階段就是基于數(shù)據(jù)倉(cāng)庫(kù)建立OLAP模型,從而得到更為可靠的數(shù)據(jù)立方體,既降低了刷新代價(jià)又提高了響應(yīng)速度。

OLAP包括了維和度量,在前面建立數(shù)據(jù)倉(cāng)庫(kù)時(shí)已經(jīng)完成。利用SQL Server中的Analysis Services項(xiàng)目模板建立多維數(shù)據(jù)集,定義數(shù)據(jù)源以及建立事實(shí)表與維表之間的關(guān)系。

OLAP模型對(duì)數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)利用MDX進(jìn)行多維查找,可以有效分析多維數(shù)據(jù)集。MDX是OLAP的查詢(xún)語(yǔ)句,語(yǔ)法與結(jié)構(gòu)化查詢(xún)語(yǔ)言SQL很類(lèi)似。在成果管理系統(tǒng)中,通過(guò)MDX語(yǔ)言把科研員和決策者需要的成果數(shù)據(jù)查詢(xún)出來(lái),展現(xiàn)在前臺(tái)界面里。

利用OLAP模型進(jìn)行分析,決策者可以依據(jù)分析要求,選擇更多角度去分析數(shù)據(jù),能得到的分析也更多,如下:

(1) 由科研成果的類(lèi)型分布來(lái)看整體項(xiàng)目的側(cè)重重點(diǎn),以及在成果突出領(lǐng)域的發(fā)展機(jī)會(huì)和潛力;

(2) 由科研成果參與者和第一申請(qǐng)單位作者與項(xiàng)目之間的關(guān)系,可以看到參與者職稱(chēng)水平,技術(shù)支持水平對(duì)成果完成數(shù)量與質(zhì)量的關(guān)系,并不是參與者越多的成果越完善,可以以此作為合理分配人才資源參與項(xiàng)目開(kāi)發(fā)的依據(jù),也可以以此評(píng)估參與人員的水平,作為考核參考;

(3) 以科研成果在一定時(shí)間內(nèi)的增長(zhǎng),作為項(xiàng)目進(jìn)度和發(fā)展的一個(gè)參考標(biāo)準(zhǔn)。也可以看到成果的趨勢(shì)和項(xiàng)目完成單位的能力和業(yè)務(wù)的提升;

(4) 可以利用數(shù)據(jù)庫(kù),對(duì)以往成果信息進(jìn)行分析,由于在傳統(tǒng)的數(shù)據(jù)庫(kù)中不具備OLAP的功能。

3.2 基于數(shù)據(jù)倉(cāng)庫(kù)的關(guān)聯(lián)規(guī)則挖掘

基于數(shù)據(jù)倉(cāng)庫(kù)的關(guān)聯(lián)規(guī)則挖掘,Apriori算法的核心是提高關(guān)聯(lián)規(guī)則產(chǎn)生的效率。利用Apriori算法對(duì)科研成果數(shù)據(jù)進(jìn)行分析的時(shí)候要明確成果的特征,根據(jù)成果特征描述來(lái)看,適合利用Apriori算法進(jìn)行關(guān)聯(lián)規(guī)則的挖掘??蒲谐晒麛?shù)據(jù)的特征如下:成果數(shù)據(jù)是按照項(xiàng)目進(jìn)程時(shí)間節(jié)點(diǎn)進(jìn)行錄入的,存儲(chǔ)在成果庫(kù)中;成果評(píng)估方式不統(tǒng)一,對(duì)成果的評(píng)估應(yīng)采取統(tǒng)一的標(biāo)準(zhǔn);科研成果的數(shù)據(jù)存儲(chǔ)在數(shù)據(jù)庫(kù)中,每一個(gè)成果都對(duì)應(yīng)一條記錄,每一個(gè)記錄的屬性都一樣。

以本校論文庫(kù)的數(shù)據(jù)為實(shí)驗(yàn)數(shù)據(jù),在論文管理系統(tǒng)中可導(dǎo)出相關(guān)TXT文檔數(shù)據(jù),利用系統(tǒng)成果導(dǎo)入功能,添加到系統(tǒng)中,對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一的處理。選取2012―2015年間,數(shù)學(xué)、物理、計(jì)算機(jī)、兵器學(xué)科的論文成果數(shù)據(jù)。論文所屬學(xué)科層次劃分到一級(jí)子學(xué)科,時(shí)間層次按照年學(xué)年,繼續(xù)劃分下去。

(1) 數(shù)據(jù)預(yù)處理

數(shù)據(jù)經(jīng)過(guò)清洗,轉(zhuǎn)換,去掉無(wú)效的數(shù)據(jù),采用統(tǒng)一的數(shù)據(jù)編碼規(guī)則,用離散字母代替時(shí)間層次,同時(shí)將學(xué)科按照統(tǒng)一的編碼規(guī)則,重新編碼。進(jìn)一步按照論文數(shù)量劃分等級(jí),五份為一級(jí),等級(jí)越高代表論文數(shù)量越多。

(2) 算法實(shí)現(xiàn)

設(shè)置最小支持度 min_sup=4,支持度=40%,置信度=80%,通過(guò)Apriori算法計(jì)算出的關(guān)聯(lián)規(guī)則信任度見(jiàn)表2。

(3) 結(jié)果分析

采用的實(shí)驗(yàn)數(shù)據(jù)來(lái)自于論文數(shù)據(jù)庫(kù),由于學(xué)校畢業(yè)論文按照培養(yǎng)計(jì)劃有周期性,學(xué)術(shù)性碩士的培養(yǎng)周期為2.5學(xué)年,所以碩士畢業(yè)多集中于第一學(xué)年3月份左右,工程碩士的培養(yǎng)周期為第二學(xué)年9月份,所以對(duì)數(shù)據(jù)的分析結(jié)果多集中于上半年。

規(guī)則1表示,在2012年第一學(xué)年在5篇以?xún)?nèi)且2013年第一學(xué)年畢業(yè)論文在5篇以?xún)?nèi)的學(xué)科專(zhuān)業(yè),則在2013年第二學(xué)年在5篇左右的支持度為40%,信任度為80%。

規(guī)則2表示,在2013年第一學(xué)年在5篇以?xún)?nèi)且2013年第二學(xué)年畢業(yè)論文在5篇以?xún)?nèi)的學(xué)科專(zhuān)業(yè),則在2012年第一學(xué)年在5篇左右的支持度為40%,信任度為80%。

規(guī)則3表示,在2012年第一學(xué)年在5篇以?xún)?nèi)且2013年第一學(xué)年畢業(yè)論文在5篇以?xún)?nèi)的學(xué)科專(zhuān)業(yè),則在2014年第二學(xué)年在5篇左右的支持度為40%,信任度為80%。

3.3 關(guān)聯(lián)規(guī)則說(shuō)明

由于系統(tǒng)中的測(cè)試數(shù)據(jù)多來(lái)自網(wǎng)絡(luò)和本校的數(shù)據(jù)庫(kù),對(duì)關(guān)聯(lián)規(guī)則的挖掘也許存在偏差,但是整體提供的關(guān)聯(lián)規(guī)則數(shù)據(jù)信息還是符合實(shí)際的。簡(jiǎn)要介紹以下幾點(diǎn):

(1) 選取成果完成人的職稱(chēng)級(jí)別和所提交的成果類(lèi)型與數(shù)量作為關(guān)聯(lián)規(guī)則挖掘的維度,發(fā)現(xiàn)成果完成人職稱(chēng)較低的數(shù)量較多,存在關(guān)聯(lián)規(guī)則;

(2) 選取固定時(shí)間內(nèi)論文數(shù)量和專(zhuān)利數(shù)量進(jìn)行關(guān)聯(lián)規(guī)則挖掘,發(fā)現(xiàn)時(shí)間維度與論文數(shù)量多,關(guān)聯(lián)較高;

(3) 對(duì)不同高校的成果數(shù)量進(jìn)行關(guān)聯(lián)分析,985與211高校的科研論文,期刊發(fā)表數(shù)量多具有關(guān)聯(lián)規(guī)則。

4 界面展示

用戶(hù)登陸界面:輸入正確的用戶(hù)名和密碼登陸系統(tǒng),用戶(hù)可以選擇“記住我”,在下次進(jìn)入系統(tǒng)時(shí)可以免登陸,若是新用戶(hù)第一次登陸系統(tǒng),需要注冊(cè),完成注冊(cè)后即獲得登陸權(quán)限。

登陸后看到的首頁(yè),左側(cè)導(dǎo)航欄顯示了主要的功能,成果展示系統(tǒng)中的成果數(shù)量以及系統(tǒng)中的成果列表。

5 結(jié) 論

本文在調(diào)研了解科研成果管理的決策分析需求的基礎(chǔ)上,認(rèn)真研究了數(shù)據(jù)倉(cāng)庫(kù)的有關(guān)技術(shù)知識(shí),聯(lián)機(jī)分析處理技術(shù)的應(yīng)用以及數(shù)據(jù)挖掘關(guān)聯(lián)規(guī)則算法的原理。提出了基于數(shù)據(jù)倉(cāng)庫(kù)的科研成果管理決策支持系統(tǒng)。

開(kāi)發(fā)系統(tǒng)應(yīng)用的主要技術(shù)包括OLAP和Apriori算法,將OLAP和Apriori算法結(jié)合運(yùn)用于實(shí)際的系統(tǒng)開(kāi)發(fā)中,關(guān)聯(lián)規(guī)則計(jì)算在OLAP物化了的多維數(shù)據(jù)集基礎(chǔ)上進(jìn)行,減少了重新計(jì)算的時(shí)間,使決策分析更加智能化,使數(shù)據(jù)挖掘的步驟更具目標(biāo)化,全面提升輔助決策在科研成果管理中的實(shí)用價(jià)值。

參考文獻(xiàn)

[1] 賀建英.大數(shù)據(jù)下MongoDB數(shù)據(jù)庫(kù)檔案文檔存儲(chǔ)去重研究[J].現(xiàn)代電子技術(shù),2015,38(16):51?55.

[2] SUN Hongmei, JIA Ruisheng. Research on the analysis and design of general test database management system [J]. Procedia engineering, 2012, 29: 489?493.

[3] ESLAMIPOOR R, SEPEHRIAR A. Firm relocation as a potential solution for environment improvement using a SWOT?AHP hybrid method [J]. Process safety and environmental protection, 2014, 92(3): 269?276.

[4] KLAUS S R, NEUBAUER J, GOETZ?NEUNHOEFFER F. Hydration kinetics of CA2 and CA?investigations performed on a synthetic calcium aluminate cement [J]. Cement and concrete research, 2013, 43(1): 62?69.

[5] PENG G Y. Marketing decision and decision support system design based on Web [J]. Advanced materials research, 2013, 850: 1048?1051.

[6] 趙維寧.運(yùn)用數(shù)據(jù)倉(cāng)庫(kù)技術(shù)構(gòu)建電信企業(yè)經(jīng)營(yíng)分析系統(tǒng)[J].中文信息,2014(8):22?26.

第9篇

論文關(guān)鍵詞:中藥材市場(chǎng),電子商務(wù)平臺(tái),構(gòu)建研究

一、構(gòu)建中藥材電子商務(wù)平臺(tái)必要性分析

1、國(guó)內(nèi)外市場(chǎng)現(xiàn)狀分析

中醫(yī)藥是祖國(guó)傳統(tǒng)文化燦爛寶庫(kù)中的重要組成部分,人們普遍應(yīng)用中醫(yī)藥進(jìn)行保健、醫(yī)療。國(guó)外,民眾對(duì)中醫(yī)的療效越來(lái)越認(rèn)可和興趣。廣大民眾對(duì)中醫(yī)藥的需求,推動(dòng)了中藥材的種植、加工、儲(chǔ)存、買(mǎi)賣(mài)、應(yīng)用。其中,中藥材集約式買(mǎi)賣(mài)交易造就了大型的中藥材專(zhuān)業(yè)市場(chǎng)。信息時(shí)代,民眾迫切盼望通過(guò)網(wǎng)絡(luò)能查詢(xún)了解中醫(yī)藥知識(shí),中藥材專(zhuān)業(yè)市場(chǎng)、中藥商、中藥消費(fèi)者非常希望能利用網(wǎng)絡(luò)查尋掌握中藥材的行情信息,通過(guò)網(wǎng)上洽談買(mǎi)賣(mài)交易。開(kāi)發(fā)構(gòu)建規(guī)模大,功能齊全的中醫(yī)藥網(wǎng)絡(luò)信息與交易服務(wù)平臺(tái)是中藥材產(chǎn)業(yè)發(fā)展的需要。

2、傳統(tǒng)中藥材市場(chǎng)改革的需要

投巨資建設(shè)的玉林中藥材市場(chǎng),占地175畝,總建筑面積23萬(wàn)平方米,鋪面共有3980間。是我國(guó)西南地區(qū)最大中藥材集散中心。玉林中藥材市場(chǎng)雖然規(guī)模大,基礎(chǔ)設(shè)施好,但市場(chǎng)交易方式仍停留在傳統(tǒng)的、單一的攤位對(duì)手交易,效率低、成本高、信息不暢,不利于客商業(yè)務(wù)擴(kuò)展電子商務(wù)論文,不利于市場(chǎng)規(guī)范管理。在信息化時(shí)代,國(guó)內(nèi)外各類(lèi)市場(chǎng)趨向于電子網(wǎng)絡(luò)商務(wù)的大背景下,玉林中藥材市場(chǎng)沒(méi)有構(gòu)建電子信息服務(wù)、網(wǎng)絡(luò)商務(wù),無(wú)法與國(guó)內(nèi)、國(guó)際市場(chǎng)接軌,市場(chǎng)發(fā)展將受到很大的制約,隨著時(shí)間的推移,市場(chǎng)優(yōu)勢(shì)也將會(huì)消失。玉林中藥材市場(chǎng)迫切需要構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)信息應(yīng)用與交易平臺(tái)。

目前,國(guó)外,主要是西藥網(wǎng)站,以新藥品信息和廣告為主,沒(méi)有中藥網(wǎng)站和相關(guān)的平臺(tái)。國(guó)內(nèi),尚未發(fā)現(xiàn)大型專(zhuān)業(yè)中藥材網(wǎng)絡(luò)信息與交易服務(wù)平臺(tái),多為綜合性藥品網(wǎng)站,中藥材信息是網(wǎng)站的一部分,單獨(dú)而專(zhuān)業(yè)的中藥材網(wǎng)站少,規(guī)模小,功能少。構(gòu)建功能強(qiáng)大,集市場(chǎng)信息和查詢(xún)、網(wǎng)上洽商和交易、質(zhì)量檢查、商鋪信用評(píng)級(jí)、市場(chǎng)需求價(jià)格分析預(yù)測(cè)、行業(yè)培訓(xùn)、商鋪網(wǎng)站、市場(chǎng)管理、中藥材數(shù)據(jù)挖掘、中藥資訊查尋、藥品洽談交易等功能信息服務(wù)平臺(tái),是發(fā)展趨勢(shì)。

二、構(gòu)建中藥材電子商務(wù)平臺(tái)展望

1、構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái),實(shí)體商鋪交易與網(wǎng)絡(luò)商鋪交易并舉,與國(guó)內(nèi)國(guó)際市場(chǎng)接軌,造就大批現(xiàn)代藥商,業(yè)態(tài)升級(jí),做大做強(qiáng)市場(chǎng)。

玉林中藥材市場(chǎng)構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái),實(shí)行網(wǎng)絡(luò)化運(yùn)作,就走上“業(yè)態(tài)提升、功能擴(kuò)充、管理升級(jí)、產(chǎn)業(yè)促進(jìn)”的改革之路。改變傳統(tǒng)的、單一的攤位對(duì)手交易,實(shí)行市場(chǎng)+網(wǎng)絡(luò)商鋪+經(jīng)營(yíng)業(yè)戶(hù)的經(jīng)營(yíng)模式。使中藥材市場(chǎng)逐步形成藥材集散、價(jià)格形成、信息反饋、產(chǎn)業(yè)帶動(dòng)為一體的現(xiàn)代網(wǎng)絡(luò)化市場(chǎng)。實(shí)現(xiàn)長(zhǎng)效科學(xué)規(guī)范管理,市場(chǎng)的組織化程度提高,市場(chǎng)的公平性、誠(chéng)信度提升,市場(chǎng)運(yùn)作效率提高,市場(chǎng)的活力、競(jìng)爭(zhēng)力得到增強(qiáng)中國(guó)期刊全文數(shù)據(jù)庫(kù)。

中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)將中藥材市場(chǎng)傳統(tǒng)的商務(wù)流程數(shù)字化、電子化、網(wǎng)絡(luò)化,突破時(shí)間空間的局限,大大提高商業(yè)運(yùn)作效率;造就現(xiàn)代藥商電子商務(wù)論文,開(kāi)闊視野,在駕馭瞬息萬(wàn)變的市場(chǎng)中始終處于主動(dòng)和優(yōu)勢(shì)。

中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)可實(shí)現(xiàn)遠(yuǎn)程實(shí)時(shí)商務(wù)洽談、交易,為商企低成本拓展全國(guó)、東南亞、國(guó)際市場(chǎng)鋪就了一條低成本的黃金商道,非常有利于玉林中藥材市場(chǎng)走向全國(guó)、全球,從而把市場(chǎng)做大做強(qiáng)。

2、構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái),能提高商業(yè)運(yùn)作效率、降低流通成本,快捷提供豐富的商業(yè)資訊,創(chuàng)造更多商機(jī),規(guī)避商業(yè)風(fēng)險(xiǎn),增強(qiáng)商企的競(jìng)爭(zhēng)力。

中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái),讓商務(wù)流程轉(zhuǎn)化為網(wǎng)絡(luò)化的電子流、信息流,不受時(shí)空限制,大大提高商業(yè)運(yùn)作效率。中藥網(wǎng)絡(luò)信息應(yīng)用與交易平臺(tái)可實(shí)現(xiàn)遠(yuǎn)程實(shí)時(shí)商務(wù)洽談、交易,簡(jiǎn)化了客商之間的流通環(huán)節(jié),最大限度地降低了流通成本,能有效地提高中藥材客商在現(xiàn)代商業(yè)活動(dòng)中的競(jìng)爭(zhēng)力。

中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)為中藥材市場(chǎng)提供一種基于互聯(lián)網(wǎng)的商務(wù)活動(dòng),具有開(kāi)放性、共享性、全球性的特點(diǎn),可為企業(yè)、個(gè)人提供豐富的商業(yè)信息資源,創(chuàng)造更多商業(yè)機(jī)會(huì),同時(shí)有助于客商規(guī)避商業(yè)風(fēng)險(xiǎn)。

中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)對(duì)買(mǎi)賣(mài)交易活動(dòng)頻繁的企業(yè)非常有利,能有效對(duì)企業(yè)商業(yè)活動(dòng)的進(jìn)行科學(xué)、規(guī)范化管理。

中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)使中小企業(yè)擁有和大企業(yè)一樣的流通渠道和信息資源,這樣也使中小企業(yè)以與大型企業(yè)相同的成本進(jìn)行網(wǎng)上交易,高速高效拓展業(yè)務(wù),極大提高了中小企業(yè)的競(jìng)爭(zhēng)力。

3、中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)及時(shí)提供、準(zhǔn)確、可靠、全面的市場(chǎng)供需信息,產(chǎn)銷(xiāo)聯(lián)動(dòng),避免盲目種植藥材,保障藥農(nóng)收益,促進(jìn)中藥種植業(yè)發(fā)展。

玉林中藥材市場(chǎng)的發(fā)展,帶動(dòng)了周邊地區(qū),乃至中西南部眾多省份中藥材種植,中藥材種植面積逐年擴(kuò)大,逐步成為農(nóng)民增收的一個(gè)途徑。但農(nóng)民種植藥材決策主要來(lái)源于市場(chǎng)人員的直覺(jué)信息,由于信息缺乏真實(shí)性、全面性,從而導(dǎo)致種植的盲目性電子商務(wù)論文,影響藥材種植的收益和積極性,對(duì)藥材種植業(yè)帶來(lái)消極影響。

中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)提供及時(shí)、準(zhǔn)確、可靠、全面的市場(chǎng)供需信息,并提供專(zhuān)家對(duì)市場(chǎng)的分析、預(yù)測(cè),有效地幫助藥農(nóng)及時(shí)調(diào)整種植品種,產(chǎn)銷(xiāo)緊密結(jié)合,確保中藥種植收益最大化,有利于中藥種植業(yè)良性發(fā)展。

4、中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)能促進(jìn)中藥材相關(guān)行業(yè)發(fā)展,創(chuàng)造更多的商機(jī),拓展就業(yè),帶動(dòng)經(jīng)濟(jì)發(fā)展。

中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)眾多的優(yōu)勢(shì),將推動(dòng)玉林中藥材市場(chǎng)的快速發(fā)展,交易額大幅上升,市場(chǎng)輻射效應(yīng)加倍擴(kuò)展,進(jìn)而帶動(dòng)中藥材相關(guān)行業(yè),如:加工、物流、旅業(yè)、通訊等二、三產(chǎn)業(yè)的蓬勃發(fā)展,創(chuàng)造更多的商機(jī),增加就業(yè)機(jī)會(huì),帶動(dòng)經(jīng)濟(jì)發(fā)展。

三、中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)的結(jié)構(gòu)與布局

1、中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)功能規(guī)劃

中藥材市場(chǎng)涉及中藥材的種植、加工、質(zhì)檢、交易、倉(cāng)儲(chǔ)、物流,技術(shù)服務(wù)等環(huán)節(jié),業(yè)務(wù)范疇廣、流程復(fù)雜,具有鮮明的行業(yè)特點(diǎn)。中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)應(yīng)該基于一條龍服務(wù)的宗旨進(jìn)行功能規(guī)劃,從技術(shù)角度來(lái)看是一個(gè)全面的解決方案。中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)需要具有如下功能:

(1)向市場(chǎng)提供豐富的商業(yè)信息資源,創(chuàng)造更多商業(yè)機(jī)會(huì)。(2)網(wǎng)上洽商和交易,簡(jiǎn)化了客商之間的流通環(huán)節(jié),提高商業(yè)運(yùn)作效率,最大限度地降低了流通成本,有效地提高中藥材客商的商業(yè)競(jìng)爭(zhēng)力。(3)有效對(duì)客商、企業(yè)商業(yè)活動(dòng)的進(jìn)行科學(xué)、規(guī)范管理,提高市場(chǎng)的組織化程度,增強(qiáng)市場(chǎng)的競(jìng)爭(zhēng)力。(4)使中藥材市場(chǎng)逐步形成藥材集散、價(jià)格形成、信息反饋、產(chǎn)業(yè)帶動(dòng)為一體的現(xiàn)代網(wǎng)絡(luò)化市場(chǎng)。

2、中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)子系統(tǒng)的設(shè)置

根據(jù)中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)的功能規(guī)劃,可考慮設(shè)置九個(gè)子系統(tǒng):市場(chǎng)信息和查詢(xún)系統(tǒng)、市場(chǎng)需求價(jià)格分析預(yù)測(cè)系統(tǒng)、網(wǎng)上洽商和交易系統(tǒng)、市場(chǎng)管理系統(tǒng)、質(zhì)量管理系統(tǒng)、商鋪網(wǎng)站系統(tǒng)、商鋪信用評(píng)級(jí)系統(tǒng)、中藥材數(shù)據(jù)挖掘系統(tǒng)、行業(yè)培訓(xùn)系統(tǒng)等九大功能系統(tǒng)。同時(shí),平臺(tái)還建立交易中介擔(dān)保機(jī)制和數(shù)據(jù)安全機(jī)制。

3、中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)的功能模塊設(shè)置

對(duì)應(yīng)中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)九個(gè)子系統(tǒng)進(jìn)行功能模塊的規(guī)劃設(shè)置。

(1)市場(chǎng)信息和查詢(xún)系統(tǒng)

藥材資訊:行業(yè)動(dòng)態(tài)、各地快訊、產(chǎn)地信息、藥材展會(huì)、招商合作、藥材進(jìn)出口。

藥材供應(yīng)信息:最新供應(yīng)信息、所有供應(yīng)信息、供應(yīng)信息綜合查詢(xún)、供應(yīng)信息反饋統(tǒng)計(jì)。

藥材求購(gòu)信息:最新求購(gòu)信息、所有求購(gòu)信息、求購(gòu)信息綜合查詢(xún)、求購(gòu)信息反饋統(tǒng)計(jì)。

藥材價(jià)格信息:最新價(jià)格變動(dòng)、全部?jī)r(jià)格、價(jià)格走勢(shì)、分析預(yù)測(cè)。

藥材排行榜:供應(yīng)金額排行、供應(yīng)數(shù)量排行、求購(gòu)金額排行、求購(gòu)數(shù)量排行、成交金額排行、成交數(shù)量排行、價(jià)格查詢(xún)熱度排行、資訊查詢(xún)熱度排行、查詢(xún)總熱度排行。

藥材商鋪:商鋪基本信息、商鋪供求信息、商鋪其它信息、商鋪綜合排行、商鋪問(wèn)詢(xún)、推薦商鋪。

(2)市場(chǎng)需求價(jià)格分析預(yù)測(cè)系統(tǒng):供求分析、供求預(yù)測(cè)、價(jià)格分析、價(jià)格預(yù)測(cè)。

(3)網(wǎng)上洽商和交易系統(tǒng):會(huì)員管理、網(wǎng)上洽談、網(wǎng)上交易、網(wǎng)上付款、收發(fā)貨管理、貨款撥退。

(4)市場(chǎng)管理系統(tǒng):通知公告、文件流轉(zhuǎn)、租賃管理、合同管理、收費(fèi)管理。

(5)質(zhì)量管理系統(tǒng):質(zhì)量抽樣檢驗(yàn)、商品標(biāo)識(shí)抽檢、索證備案檢查、進(jìn)貨臺(tái)帳檢查、下柜退市貨物檢查、虛假宣傳檢查、侵權(quán)檢查、檢查綜合評(píng)分、排行處理。

(6)商鋪網(wǎng)站系統(tǒng):商鋪網(wǎng)站注冊(cè)、商鋪網(wǎng)站模板管理、商鋪網(wǎng)站信息上傳、商鋪網(wǎng)站綜合排行、商鋪網(wǎng)站綜合管理。

(7)商鋪信用評(píng)級(jí)系統(tǒng):商鋪信用評(píng)分、商鋪信用排行、商鋪信用監(jiān)督。

(8)中藥材數(shù)據(jù)挖掘系統(tǒng):數(shù)據(jù)挖掘模型管理、數(shù)據(jù)挖掘、數(shù)據(jù)挖掘結(jié)果儲(chǔ)存、數(shù)據(jù)挖掘結(jié)果顯示、挖掘特點(diǎn)統(tǒng)計(jì)。

(9)行業(yè)培訓(xùn)系統(tǒng):中藥材種植技術(shù)培訓(xùn)、中藥材加工技術(shù)培訓(xùn)、中藥材鑒別培訓(xùn)、中藥材儲(chǔ)存知識(shí)培訓(xùn)、中藥材醫(yī)用培訓(xùn)、其它知識(shí)培訓(xùn)。

四、構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)可行性

網(wǎng)絡(luò)電子商務(wù)平臺(tái)的技術(shù)基礎(chǔ)和社會(huì)基礎(chǔ):現(xiàn)代社會(huì),網(wǎng)絡(luò)信息技術(shù)發(fā)展迅速,應(yīng)用廣泛電子商務(wù)論文,技術(shù)成熟。有眾多的成功的網(wǎng)絡(luò)信息服務(wù)平臺(tái)范例可供借鑒,構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)具有良好的技術(shù)基礎(chǔ)中國(guó)期刊全文數(shù)據(jù)庫(kù)。隨著計(jì)算機(jī)網(wǎng)絡(luò)在社會(huì)各行各業(yè)、各階層的廣泛應(yīng)用,計(jì)算機(jī)網(wǎng)絡(luò)已是人們的工作、生活密不可分的工具,社會(huì)已普遍形成了應(yīng)用計(jì)算機(jī)網(wǎng)絡(luò)良好行為習(xí)慣,構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)也具有了廣泛的社會(huì)基礎(chǔ)。

五、關(guān)鍵技術(shù)與創(chuàng)新

與一般信息網(wǎng)站、網(wǎng)絡(luò)信息服務(wù)平臺(tái)不同,中藥材市場(chǎng)涉及中藥材的種植、加工、質(zhì)檢、交易、倉(cāng)儲(chǔ)、物流,技術(shù)服務(wù)等環(huán)節(jié),業(yè)務(wù)范疇廣、流程復(fù)雜,行業(yè)特色明顯。因此,中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)規(guī)模大,集成九大功能系統(tǒng),設(shè)置七十六個(gè)模塊,需要解決的關(guān)鍵技術(shù)不少。如:(1)網(wǎng)上交易中,不同企業(yè)、不同技術(shù)標(biāo)準(zhǔn)的系統(tǒng)之間實(shí)現(xiàn)數(shù)據(jù)實(shí)時(shí)傳送、接收。(2)使用不同開(kāi)發(fā)工具的系統(tǒng)集成到一個(gè)平臺(tái),并實(shí)現(xiàn)數(shù)據(jù)無(wú)縫互通。(3)復(fù)雜多樣的業(yè)務(wù)數(shù)據(jù)交換標(biāo)準(zhǔn)的研制。(4)巨量數(shù)據(jù)并發(fā)處理機(jī)制設(shè)計(jì)。(5)多服務(wù)器分布處理響應(yīng)。(6)平臺(tái)交易數(shù)據(jù)安全技術(shù)。(7)中藥材數(shù)據(jù)挖掘技術(shù)。(8)多媒體培訓(xùn)課件的設(shè)計(jì)與集成等等。

網(wǎng)絡(luò)信息應(yīng)用模式的創(chuàng)新:(1)創(chuàng)建現(xiàn)代網(wǎng)絡(luò)化中藥材市場(chǎng)。(2)中藥材網(wǎng)上交易。(3)創(chuàng)建中藥材網(wǎng)絡(luò)商鋪。(4)中藥材市場(chǎng)信息平臺(tái)中的數(shù)據(jù)挖掘技術(shù)應(yīng)用。(5)中藥材交易資訊服務(wù)。(6)中藥材種植資訊服務(wù)。(7)網(wǎng)絡(luò)化市場(chǎng)管理。(8)網(wǎng)絡(luò)多媒體中藥材綜合知識(shí)培訓(xùn)等。在實(shí)際開(kāi)發(fā)構(gòu)建中藥材網(wǎng)絡(luò)電子商務(wù)平臺(tái)的過(guò)程中,對(duì)這些技術(shù)關(guān)鍵,要進(jìn)行大量的分析研究,逐個(gè)攻關(guān)解決。

參考文獻(xiàn)

俞文群,城市公共信息服務(wù)平臺(tái)的設(shè)計(jì)與實(shí)現(xiàn)[J].寧波工程學(xué)院學(xué)報(bào),2006,(2):34-37