時間:2024-03-20 10:58:54
導(dǎo)語:在大數(shù)據(jù)時代的特性的撰寫旅程中,學(xué)習(xí)并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內(nèi)容能夠啟發(fā)您的創(chuàng)作靈感,引領(lǐng)您探索更多的創(chuàng)作可能。
〔關(guān)鍵詞〕大數(shù)據(jù);企業(yè);競爭情報系統(tǒng);系統(tǒng)評價;指標(biāo)體系
DOI:10.3969/j.issn.1008-0821.2016.02.001
〔中圖分類號〕G250.25〔文獻標(biāo)識碼〕A〔文章編號〕1008-0821(2016)02-0003-05
〔Abstract〕In view of the fact that methods of competitive intelligence system evaluation do not reflect characteristics of big data,characteristics of competitive intelligence system based on big data are summed up according to three changes of thinking pattern made by big data.Then,the train of evaluation thought of competitive intelligence system based on big data is put forward according to the constitution of the competitive intelligence system.Furthermore,the evaluation index system of the competitive intelligence system based on big data,including function index,technique index and the user index,is established from the views of the strategic security,operation status and user experience.Finally,methods to measure the quantitative and qualitative index are discussed briefly.The proposed evaluation index system has characteristics of multi-level and multi perspective,which can provide references for the construction of competitive intelligence system based on big data.
〔Key words〕big data;enterprise;competitive intelligence system;system evaluation;index system
大數(shù)據(jù)正在改變我們的生活以及理解世界的方式,也在改變著商業(yè)組織和社會組織的運行模式。充分理解數(shù)據(jù)的價值,知道如何利用大數(shù)據(jù)為企業(yè)經(jīng)營決策提供依據(jù),目前已逐漸成為大數(shù)據(jù)時代商業(yè)組織應(yīng)具備的最基本思維。在這種數(shù)據(jù)驅(qū)動決策的思維模式下,不少情報學(xué)研究者從對大數(shù)據(jù)競爭情報系統(tǒng)的模型、體系結(jié)構(gòu)、運行機制等多方面進行了探討。如2013年,中山大學(xué)黃曉斌教授率先提出了基于大數(shù)據(jù)的企業(yè)競爭情報系統(tǒng)模型,并分析了該模型的結(jié)構(gòu)和作用[1]。同時,越來越多的企業(yè),如IBM、亞馬遜、谷歌、微軟、沃爾瑪?shù)?,開始重視大數(shù)據(jù)競爭情報軟件系統(tǒng)的開發(fā)與建設(shè)的嘗試,并且取得一定的成果。
然而,由于大數(shù)據(jù)的復(fù)雜性以及對大數(shù)據(jù)研究尚屬于啟動階段,為確保大數(shù)據(jù)競爭情報系統(tǒng)的實用性和安全性,有必要建立一套面向大數(shù)據(jù)的競爭情報系統(tǒng)評價指標(biāo)體系,引導(dǎo)企業(yè)在大數(shù)據(jù)時代建設(shè)競爭情報系統(tǒng),提高競爭情報服務(wù)質(zhì)量。本文根據(jù)競爭情報系統(tǒng)的構(gòu)成,圍繞大數(shù)據(jù)帶來的思維變化和當(dāng)前競爭情報系統(tǒng)面臨的問題與挑戰(zhàn),研究大數(shù)據(jù)競爭情報系統(tǒng)的評價框架,戰(zhàn)略、技術(shù)和人3個方面相結(jié)合,構(gòu)建體現(xiàn)大數(shù)據(jù)思維的競爭情報系統(tǒng)評價指標(biāo)體系,從功能覆蓋、運行狀態(tài)和用戶體驗等多角度出發(fā),綜合考察競爭情報系統(tǒng),提升競爭情報系統(tǒng)的準(zhǔn)確性和有效性。
1競爭情報系統(tǒng)評價研究現(xiàn)狀
隨著競爭情報在企業(yè)戰(zhàn)略管理中扮演的角色越來越重要,人們對于競爭情報系統(tǒng)及其帶來的效益展開了多角度多層次的評價。從文獻調(diào)查結(jié)果來看,國外對于競爭情報系統(tǒng)評價方面的研究成果主要集中在信息系統(tǒng)質(zhì)量評價,提出了不少評價模型。如McCall模型[2]、Boehm模型[3]、Perry模型[4]和Gillies模型[5],以及由國際標(biāo)準(zhǔn)化組織提出的一系列軟件質(zhì)量模型,如ISO/IEC9126、ISO/IEC25010模型等。而對于大數(shù)據(jù)系統(tǒng)的評價研究正在進行之中,其中影響較大的是圍繞CAP理論展開的研究。2000年和2012年,Brewer提出并完善了CAP理論,認(rèn)為分布式系統(tǒng)應(yīng)具備3個特性:一致性(Consistency)、可用性(Availability)和分區(qū)容錯性(Partition Tolerance),并且論述了這3個特性之間的關(guān)系和取舍[6]。此后圍繞CAP理論展開了激烈的討論。如Abadi提出在大數(shù)據(jù)時代,分布式系統(tǒng)除了有C.A.P特性之外,還應(yīng)該考慮到系統(tǒng)的響應(yīng)時間[7]。
國內(nèi)對于競爭情報系統(tǒng)評價的研究成果主要集中在以下3個方面:(1)績效評價。張翠英,張靜等根據(jù)競爭情報系統(tǒng)績效的影響因素選擇相應(yīng)的技術(shù)指標(biāo)體系,構(gòu)建企業(yè)競爭情報系統(tǒng)灰色模糊評價模型[8];邱均平等基于預(yù)期效用理論構(gòu)建了競爭情報系統(tǒng)績效評價指標(biāo)和評價模型[9]。(2)軟件系統(tǒng)評價。如侯麗從決策與情報系統(tǒng)的互動角度出發(fā),探討了情報系統(tǒng)三大子系統(tǒng)的評價方式,并構(gòu)建了相應(yīng)的競爭情報系統(tǒng)指標(biāo)體系[10];胡桓構(gòu)建了競爭情報系統(tǒng)軟件可用性測評體系,并針對國內(nèi)三大競爭情報系統(tǒng)軟件進行了實際測評并使用層次分析法對測評數(shù)據(jù)進行分析[11];(3)成果評價。如張志千,趙繼倫在分析企業(yè)競爭情報成果的類型及特點的基礎(chǔ)上,從內(nèi)容性、可用性、應(yīng)用效果、用戶滿意度4個方面構(gòu)建包含11個二級指標(biāo)的評價體系,對企業(yè)競爭情報成果進行模糊綜合評價[12]。
總的來說,國外研究成果比較多,但是這些評價模型總是想要以單個的模型廣泛地應(yīng)用于所有軟件和信息系統(tǒng)的開發(fā),顯然難以直接應(yīng)用于業(yè)務(wù)性很強的競爭情報系統(tǒng)評價中。國內(nèi)的研究比較具有針對性,但是從文獻調(diào)查的結(jié)果來看,目前大數(shù)據(jù)競爭情報系統(tǒng)的評價研究欠缺。而大數(shù)據(jù)無疑會給競爭情報系統(tǒng)帶來巨大的沖擊,因此,如何針對大數(shù)據(jù)競爭情報系統(tǒng)建立合適的評價指標(biāo)體系和評價模型依然是一個開放的課題。
2大數(shù)據(jù)對競爭情報系統(tǒng)性能提出的新要求
維克托?舍恩伯格在《大數(shù)據(jù)時代:生活、工作與思維的大變革》中明確指出,大數(shù)據(jù)時代人們對待數(shù)據(jù)的思維方式發(fā)生了3個方面的變化:全數(shù)據(jù)而不是樣本數(shù)據(jù)、接受混雜性而放棄精確性、關(guān)注相關(guān)性而放棄追究因果關(guān)系[13]。這些思維變化給競爭情報系統(tǒng)提出了新的挑戰(zhàn),突出表現(xiàn)在以下幾個方面:
2.1高性能
大數(shù)據(jù)帶來思維的第一個變化是全局思維:對全數(shù)據(jù)進行考察,發(fā)現(xiàn)趨勢和主流,而不是深入樣本數(shù)據(jù)進行局部探索。這對競爭情報系統(tǒng)性能提出了挑戰(zhàn):一方面,要有足夠的容量來存儲和處理全數(shù)據(jù);另一方面,流程整合、信息挖掘和實時工作等新應(yīng)用系統(tǒng)對競爭情報系統(tǒng)的帶寬、響應(yīng)時間、吞吐量等提出了更高的要求。高性能是競爭情報系統(tǒng)在大數(shù)據(jù)環(huán)境中生存的基礎(chǔ),既需要大數(shù)據(jù)競爭情報系統(tǒng)升級硬件產(chǎn)品,在系統(tǒng)容量上實現(xiàn)提升,也需要采取更符合大數(shù)據(jù)處理應(yīng)用的數(shù)據(jù)計算邏輯,增強系統(tǒng)的彈性,提高資源的利用率。
2.2容錯性
大數(shù)據(jù)帶來思維的第二個變化是容錯思維:忽略數(shù)據(jù)不一致帶來的分析結(jié)果不精確性,快速獲得研究對象的發(fā)展趨勢比精確度更重要。這要求競爭情報系統(tǒng)有足夠的容錯性來應(yīng)對數(shù)據(jù)處理過程中因磁盤故障、網(wǎng)絡(luò)故障、服務(wù)器故障等帶來的數(shù)據(jù)不一致性,容許一定程度的錯誤與混雜,用概率看問題,站在更高的層面來觀察和分析數(shù)據(jù),獲得支持決策的知識和洞察力。
2.3智能性
大數(shù)據(jù)帶來思維的另一個重大變革相關(guān)思維:關(guān)注相關(guān)性而不是追究因果關(guān)系。這意味著更多的創(chuàng)新,跳出原有的思維定式,從關(guān)聯(lián)事物中找到突破口,孕育新的事物。這使得競爭情報系統(tǒng)也要跳出線性思維的運作模式,提高系統(tǒng)的智能性,采用云計算、機器學(xué)習(xí)、數(shù)據(jù)挖掘等智能技術(shù),對海量的數(shù)據(jù)進行統(tǒng)計性的搜索、比較、分析、歸納,并對事物發(fā)展趨勢和前景進行主動、立體、邏輯地分析,幫助人們提前發(fā)現(xiàn)事物的規(guī)律,預(yù)測事物進展的趨勢,早人一步提出創(chuàng)新性的決策。
2.4安全性
大數(shù)據(jù)作為企業(yè)最寶貴的核心資產(chǎn),它的安全需要強有力的保障,避免病毒、攻擊、非授權(quán)的訪問與泄密。目前對大數(shù)據(jù)安全的也受到人們越來越多的關(guān)注,如2013年澳大利亞政府明確提出了將個人隱私保護和安全性作為衡量大數(shù)據(jù)處理系統(tǒng)的一個重要標(biāo)準(zhǔn)。作為企業(yè)決策支持系統(tǒng),大數(shù)據(jù)競爭情報系統(tǒng)必須做到對企業(yè)敏感數(shù)據(jù)的安全監(jiān)管,包括企業(yè)交易數(shù)據(jù)、合同信息等隱私或者敏感數(shù)據(jù),有能力保護企業(yè)的敏感數(shù)據(jù)不被有意或無意的泄露出去。
3面向大數(shù)據(jù)的競爭情報系統(tǒng)評價指標(biāo)體系
競爭情報系統(tǒng)是一個應(yīng)用性很強的綜合系統(tǒng),除了上述對大數(shù)據(jù)思維的考慮之外,還需要考慮競爭情報系統(tǒng)實際運行情況、情報保障能力以及使用者的感受考慮進去。下文先從競爭情報系統(tǒng)的構(gòu)成出發(fā),探討競爭情報系統(tǒng)的評價思路,然后將大數(shù)據(jù)的特性考慮進去,在綜合其他文獻提出的指標(biāo)的基礎(chǔ)上,設(shè)計出大數(shù)據(jù)競爭情報系統(tǒng)的評價指標(biāo)體系。
3.1大數(shù)據(jù)競爭情報系統(tǒng)的評價思路
企業(yè)競爭情報系統(tǒng)是以人的智能為主導(dǎo)、以信息網(wǎng)絡(luò)為手段、以增強企業(yè)競爭力為目標(biāo)的人機結(jié)合的企業(yè)競爭戰(zhàn)略決策支持與咨詢系統(tǒng)[14]。由此可見,競爭情報系統(tǒng)由戰(zhàn)略、技術(shù)和人3個方面組成:①競爭情報系統(tǒng)要服務(wù)于企業(yè)戰(zhàn)略,要滿足或者超越企業(yè)決策支持的期望和需求。②競爭情報系統(tǒng)是建立在信息技術(shù)基礎(chǔ)上的軟件系統(tǒng),要有足夠的技術(shù)支持才能勝任競爭情報任務(wù),尤其是在大數(shù)據(jù)時代。③競爭情報系統(tǒng)的服務(wù)對象是人,包括開發(fā)者、管理者和使用者。
建設(shè)競爭情報系統(tǒng)的目的是以人為本,采用適當(dāng)?shù)男畔⒓夹g(shù),構(gòu)建功能強大的軟件信息系統(tǒng),為滿足和超越企業(yè)戰(zhàn)略需求提供足夠的情報支持。因此,我們不能僅從系統(tǒng)的技術(shù)性能表現(xiàn)來判斷系統(tǒng)好壞,而要從多個角度來綜合衡量:
(1)戰(zhàn)略保障角度。主要考察競爭情報系統(tǒng)是否能夠根據(jù)企業(yè)戰(zhàn)略的具體要求,搭建競爭情報系統(tǒng)的功能構(gòu)架,提供足夠的競爭情報能力,滿足或者超越企業(yè)決策支持的期望和需求。
(2)運行狀態(tài)角度。主要考察競爭情報系統(tǒng)的技術(shù)性能狀態(tài)。技術(shù)是競爭情報系統(tǒng)運行的基本保障,尤其是在大數(shù)據(jù)時代,必須要有足夠的性能表現(xiàn)才能應(yīng)對海量的復(fù)雜數(shù)據(jù)。在評價時,要深入到技術(shù)層面,考察各個功能模塊的性能表現(xiàn),從細(xì)節(jié)上衡量競爭情報系統(tǒng)的好壞。
(3)用戶體驗角度。主要考察管理者和用戶對競爭情報系統(tǒng)的使用感受。競爭情報系統(tǒng)是一個人機結(jié)合的智能系統(tǒng),人的感受是決定其效用的一個重要方面,同樣也是進行系統(tǒng)評價時必不可少的一個方面。
根據(jù)上述描述,我們對競爭情報系統(tǒng)的評價思路進行了歸結(jié),如圖1所示:
從評價過程來看,采用由表及里、主觀評判與客觀測量的評價策略。先評價靜態(tài)的東西,考察競爭情報系統(tǒng)的功能構(gòu)成,然后深入到每個功能模塊,測量其性能表現(xiàn),再從用戶的角度,根據(jù)用戶感受對系統(tǒng)進行補充評價。評價的主要目的是要改善和提高競爭情報系統(tǒng)的質(zhì)量,因此,在評價過程中有內(nèi)反饋、外反饋和跨域反饋,如圖中虛線所示。其中,內(nèi)反饋是指前向的直接反饋,如功能評價后,發(fā)現(xiàn)問題,反饋到情報規(guī)劃層,修改或補充系統(tǒng)功能;外反饋是指從評價結(jié)果到大數(shù)據(jù)情報系統(tǒng)的反饋;而跨域則是不同的領(lǐng)域之間的相互反饋,如根據(jù)用戶評價的結(jié)果,調(diào)整系統(tǒng)的技術(shù)指標(biāo)等。
根據(jù)圖1可知,該評價思路中有3個評價過程:
(1)功能評價。評價紙面上的東西,即評價競爭情報系統(tǒng)所具備的功能、數(shù)據(jù)處理類型、提供的文檔、制定的流程和安全管理的規(guī)范等。
(2)性能評價。性能評價是對競爭情報系統(tǒng)的運行情況進行評價,該過程需要統(tǒng)計系統(tǒng)日常運行的記錄數(shù)據(jù),包括網(wǎng)絡(luò)流量、響應(yīng)時間、故障恢復(fù)時間等。這些因素是系統(tǒng)在運行過程中表現(xiàn)出來的特質(zhì),是系統(tǒng)性能狀態(tài)的數(shù)據(jù)表征,較為客觀地反映了系統(tǒng)的真實質(zhì)量。相對來說,技術(shù)性能視角的評價更為科學(xué)、客觀和顆粒度更細(xì)。
(3)用戶評價。用戶評價主要是從情報系統(tǒng)的使用者和管理者的視角來考查系統(tǒng)的質(zhì)量問題,由管理者和使用者根據(jù)系統(tǒng)在競爭情報業(yè)務(wù)流程中發(fā)揮的功能效用的使用體驗,對大數(shù)據(jù)競爭情報系統(tǒng)的質(zhì)量進行評價。
3.2大數(shù)據(jù)競爭情報系統(tǒng)的評價指標(biāo)體系
由上節(jié)提出的評價視角和評價過程分析,我們將競爭情報系統(tǒng)的評價指標(biāo)劃分為3類:功能性指標(biāo)、性能指標(biāo)、用戶指標(biāo)。在這3類指標(biāo)中,我們力圖突出大數(shù)據(jù)的特性,提出符合大數(shù)據(jù)思維的競爭情報系統(tǒng)評價指標(biāo)體系,如表1所示。
3.3評價指標(biāo)的度量
從上述對評價思路、評價視角的分析來看,大數(shù)據(jù)競爭情報系統(tǒng)的評價與一般的軟件系統(tǒng)評價有很大的區(qū)別:
3.3.1評價指標(biāo)多層次多視角
大數(shù)據(jù)競爭情報系統(tǒng)的評價涉及到多個階段,從總體到細(xì)節(jié),由外至里,劃分為3個不同的評價過程。每個評價過程涉及的因素眾多,指標(biāo)體系呈現(xiàn)多視角、多層次結(jié)構(gòu)。
3.3.2主客觀評價相結(jié)合
除了技術(shù)性能中部分指標(biāo)之外,其他指標(biāo)為定性指標(biāo),有一部分指標(biāo)需要依靠主觀評價得出,如用戶體驗視角的評價指標(biāo)。
對于客觀指標(biāo),主要的手段為專項測試,針對大數(shù)據(jù)競爭情報系統(tǒng)的某個屬性,采用專業(yè)技術(shù)進行單項測試,檢驗系統(tǒng)在某個功能上的性能表征。如系統(tǒng)的TB 可以通過測量系統(tǒng)的平均等待時間內(nèi)響應(yīng)次數(shù),然后除以測量次數(shù),即可得到客觀的數(shù)據(jù)值。表2是部分三級指標(biāo)的度量方法。
對于主觀指標(biāo),主要手段有兩種:專家打分和問卷調(diào)查。專家打分邀請競爭情報方面的專家和有豐富經(jīng)驗的競爭情報工作者對系統(tǒng)的功能、設(shè)計進行評分,然后采用層次分析法、灰色評價法或神經(jīng)網(wǎng)絡(luò)法進行綜合評判;問卷調(diào)查則是將設(shè)計好的問卷發(fā)送給競爭情報從業(yè)人員,讓其回答問題,根據(jù)回答問題的結(jié)果進行評分。專家打分表部分如表3所示。
4結(jié)束語
本文從戰(zhàn)略保障、運行狀態(tài)和用戶體驗3個角度出發(fā),結(jié)合大數(shù)據(jù)思維對競爭情報系統(tǒng)的影響,在宏觀、中觀和微觀層面建立了大數(shù)據(jù)競爭情報軟件系統(tǒng)的評價指標(biāo)體系。本文提出的評價指標(biāo)體系將業(yè)務(wù)、技術(shù)和人對競爭情報系統(tǒng)的要求相結(jié)合,提取出不同的評價指標(biāo),能夠較為全面地反映系統(tǒng)質(zhì)量的特點。由于大數(shù)據(jù)本身的復(fù)雜性,評價指標(biāo)體系對于大數(shù)據(jù)的特性體現(xiàn)得仍然不足。在今后的工作中,將繼續(xù)深入探究大數(shù)據(jù)的特性,進一步完善評價指標(biāo)體系,增強量化評價的可操作性,同時,統(tǒng)籌兼顧各指標(biāo)間的內(nèi)在聯(lián)系和相互制約,研究建立綜合量化的大數(shù)據(jù)競爭情報系統(tǒng)評估方法。
參考文獻
[1]黃曉斌,鐘輝新.基于大數(shù)據(jù)的企業(yè)競爭情報系統(tǒng)模型構(gòu)建[J].情報雜志,2013,(3):37-43.
[2]J McCall,P Richards,G Walters.Factors in Software Quality[R].Technical Report CDRL A003,US Rome Air Development Centre,1977,(1):1106-1113.
[3]B W Boehm,J Brown,H Kaspar,et al.Characteristics of Software Quality[A].TRW Serious of Software Technology Vol 1[M].New York:North-Holland,1978.
[4]W E Perry.Quality Assurance for Information Systems:Methods,Tools and Techniques[M].New York:John Wiley & Sons,1991.
[5]A Gillies.Modelling Software Quality in The Commercial Envi-ronment[J].Software Quality Journal,1992,(1):175-191.
[6]Eric A.Brewer.Toward robust distributed systems[C].Proceedings of the Annual ACM Symposium on Principles of Distributed Computing,Portland,July,2000,(19):7-10.
[7]D.J.Abadi.Consistency Tradeoffs in Modern Distributed Database System Design:CAP is only part of the story[J].Computer,2012,45(2):37-42.
[8]張翠英,張靜.灰色模糊評價法在競爭情報系統(tǒng)績效評價中的應(yīng)用[J].情報科學(xué),2010,(1):81-85.
[9]邱均平,謝輝,李進華.競爭情報系統(tǒng)績效綜合評價研究[J].情報科學(xué),2011,(4):481-486.
[10]侯麗.基于決策的情報系統(tǒng)評價指標(biāo)體系構(gòu)建[J].情報理論與實踐,2009,(1):105-108,104.
[11]胡桓.基于層次分析法的競爭情報軟件可用性評價[J].情報科學(xué),2010,(3):434-437.
[12]張志千,趙繼倫.企業(yè)競爭情報成果模糊綜合評價研究[J].圖書情報工作,2014,(4):53-58.
近幾年隨著社會的發(fā)展,信息技術(shù)和計算機在迅猛發(fā)展,在各個領(lǐng)域都需要大量的數(shù)據(jù),這有利于企業(yè)了解市場,而這個時代的數(shù)據(jù)大爆炸已經(jīng)不能被現(xiàn)代化的計算機所消化了。在信息化社會,到2020年,全球以電子形式存儲的數(shù)據(jù)量預(yù)計將達到35ZB,而這其中,企業(yè)數(shù)據(jù)正在以55%的速度逐年增長。IDC預(yù)測,大數(shù)據(jù)技術(shù)與服務(wù)市場將在2015年達到169億美元,年增長率甚至達到40%,這是大數(shù)據(jù)時代到來的趨勢。我們將這些數(shù)據(jù)稱為“海量數(shù)據(jù)”,這個概念其實在2008年時就已經(jīng)被提出來了,最早提出是在谷歌成立10周年的慶祝典禮上,被稱為“BigData”,后來也曾在雜志上討論,我們應(yīng)該如何面對現(xiàn)在的數(shù)據(jù)大爆炸時代,這不僅是機遇,也是一種挑戰(zhàn)。可以這么說,大數(shù)據(jù)時代是信息社會的變革,是信息化和科技發(fā)展的產(chǎn)物,它具有很強的緊迫性,對我們這個時代也有重要意義,如何將數(shù)據(jù)整理、分析、歸納和共享成為全世界都在關(guān)注的事情。大數(shù)據(jù)時代的到來對于企業(yè)來說是更大地挑戰(zhàn),如何在這樣的一個時代加強自己的競爭力,把握住每一個客戶的資料和數(shù)據(jù),成為企業(yè)提高國際競爭力的關(guān)鍵。數(shù)據(jù)流的廣泛應(yīng)用使企業(yè)不斷審視自己的IT管理模式,逐漸形成規(guī)模化、多樣化和高速化的企業(yè)管理模式,可以說大數(shù)據(jù)時代的到來對于企業(yè)既是機遇又是挑戰(zhàn)。
2相關(guān)概念
在信息化時代“,數(shù)據(jù)”成為一個熱門詞匯,如今數(shù)據(jù)已經(jīng)深入到每一個行業(yè)和領(lǐng)域,并成為促進生產(chǎn)的重要因素。而“大數(shù)據(jù)”這樣的概念是在數(shù)據(jù)的基礎(chǔ)上逐漸流行起來的,這最早源于美國“。大數(shù)據(jù)”指的是運用更先進軟件和科技對數(shù)據(jù)進行管理和分析,將數(shù)據(jù)流整合,將海量的數(shù)據(jù)進行處理,也就是說,傳統(tǒng)的數(shù)據(jù)管理技術(shù)已經(jīng)不能適應(yīng)現(xiàn)在的大量數(shù)據(jù)了,我們要進行新技術(shù)的開發(fā),迎接大數(shù)據(jù)時代的到來。大數(shù)據(jù)(Bigdata)一般指的是軟件工具難以捕捉、管理和分析的大容量數(shù)據(jù),其單位通常是“TB”。大數(shù)據(jù)是一個企業(yè)在創(chuàng)造了大量非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù)后,組成一個數(shù)據(jù)集,其具有4V特性:(1)容量大(Volume)。非結(jié)構(gòu)化數(shù)據(jù)的超大規(guī)模和增長;占總數(shù)據(jù)量的80%~90%;比結(jié)構(gòu)化數(shù)據(jù)增長快10到50倍,是傳統(tǒng)數(shù)據(jù)倉庫的10~50倍。(2)格式多(Variety)。異構(gòu)和多樣性;很多不同的形式,如文本、圖像、視頻、機器數(shù)據(jù)等;沒有模式或者模式不明顯;不連貫的語法或句義。(3)價值高(Value)。大量的不相關(guān)信息的提純;對未來趨勢與模式的可預(yù)測分析;深度復(fù)雜分析(機器學(xué)習(xí)、人工智能VS傳統(tǒng)商務(wù)智能咨詢、報告等)。(4)速度快(Velocity)。實時分析而非批量式分析數(shù)據(jù)輸入、處理與丟棄,立竿見影而非事后見效。數(shù)據(jù)之間的跨應(yīng)用和跨系統(tǒng)的結(jié)構(gòu)化和非結(jié)構(gòu)化數(shù)據(jù)體現(xiàn)著數(shù)據(jù)與數(shù)據(jù)的復(fù)雜關(guān)系,這些數(shù)據(jù)相互之間關(guān)聯(lián)卻又相對獨立,大量的數(shù)據(jù)通過儲存和分享進行交換和聯(lián)系。通過對大量數(shù)據(jù)進行分析、整合和交換,不斷創(chuàng)造新的價值,加快生產(chǎn),發(fā)現(xiàn)新領(lǐng)域和新知識,將數(shù)據(jù)流最大價值化和最大應(yīng)用化,這是大數(shù)據(jù)的實質(zhì)與內(nèi)涵,簡單來說,就是將大數(shù)據(jù)內(nèi)部信息進行關(guān)聯(lián)和挖掘。
3大數(shù)據(jù)給公司帶來的挑戰(zhàn)
新疆新捷股份有限公司成立于1995年8月,是專業(yè)從事天然氣終端銷售及綜合利用的企業(yè)。公司秉承中國石油“奉獻能源、創(chuàng)造和諧”企業(yè)宗旨,堅持昆侖能源“低碳經(jīng)濟、綠色發(fā)展”理念,努力將公司建設(shè)成為國內(nèi)一流的天然氣終端銷售企業(yè)。從企業(yè)戰(zhàn)略著眼,信息就是財富,企業(yè)如果對這些大數(shù)據(jù)管理得當(dāng),就可以發(fā)掘出更為強大可靠的決策信息。目前大數(shù)據(jù)時代給企業(yè)管理者帶來的挑戰(zhàn)有如下幾個方面。
3.1如何獲取大數(shù)據(jù)現(xiàn)在很多企業(yè)所能獲取的數(shù)據(jù)信息有限,僅僅是冰山一角,大約為總數(shù)據(jù)的15%以下,并且對數(shù)據(jù)整合程度不夠,存在很多非結(jié)構(gòu)化數(shù)據(jù)和半結(jié)構(gòu)化數(shù)據(jù)。無法獲取足夠的數(shù)據(jù)成為企業(yè)發(fā)展的障礙,這些對于現(xiàn)代企業(yè)來說是一個很大的難題,傳統(tǒng)的商業(yè)智能系統(tǒng)對大量信息數(shù)據(jù)的標(biāo)準(zhǔn)化和結(jié)構(gòu)化整合已經(jīng)不能適應(yīng),海量數(shù)據(jù)的產(chǎn)生需要企業(yè)運用先進的手段獲取更多,并對信息數(shù)據(jù)加以整合,這樣才能通過大量的數(shù)據(jù)分析市場需求,增加客戶,提高企業(yè)的服務(wù)質(zhì)量,不斷提升企業(yè)的國際競爭力。因此,如何獲取大數(shù)據(jù)成為新疆新捷股份有限公司的一個挑戰(zhàn)。
3.2對管理團隊的挑戰(zhàn)新疆新捷股份有限公司的傳統(tǒng)管理模式是高層決策者憑借自己的經(jīng)驗和決策能力下決定,其他管理人員負(fù)責(zé)完善決策和執(zhí)行。在大數(shù)據(jù)時代來臨前數(shù)據(jù)量較小,信息有限且獲取信息的成本較高,因此這種傳統(tǒng)的管理模式還可以適應(yīng)企業(yè)發(fā)展。但隨著信息化社會的發(fā)展和大數(shù)據(jù)時代的到來,這種傳統(tǒng)的管理模式已經(jīng)不能適應(yīng)海量的數(shù)據(jù),這更多的是需要新疆新捷股份有限公司通過大量的數(shù)據(jù)進行分析,結(jié)合企業(yè)自身的特點,組成管理團隊進行決策,這樣才能不斷適應(yīng)社會的發(fā)展,增強企業(yè)的競爭力。決策者在決策過程中的直覺主義已經(jīng)不能適應(yīng)大數(shù)據(jù)時代,這是企業(yè)在管理上遇到的一個挑戰(zhàn)。
3.3對企業(yè)管理流程的挑戰(zhàn)多數(shù)企業(yè)的管理流程是逆向思維方式,也就是說通過在經(jīng)營過程中出現(xiàn)的問題進行分析,通過一個管理團隊的討論和協(xié)商,制定出一套解決方案,這樣的管理流程有一定的好處,但也會因為有一些管理問題還沒有出現(xiàn),導(dǎo)致管理上的疏漏,而新疆新捷股份有限公司就曾是這樣的管理流程。對于現(xiàn)在海量數(shù)據(jù)的產(chǎn)生,新疆新捷股份有限公司不能再按照逆向思維模式進行管理了,其應(yīng)該盡量運用正向思維的管理方式,根據(jù)現(xiàn)在大數(shù)據(jù)時代的特點,進行數(shù)據(jù)收集,找出數(shù)據(jù)之間潛在的關(guān)系,對客戶信息進行整理分析,充分了解客戶的需求,進而提出優(yōu)化方案,這樣更有利于企業(yè)發(fā)現(xiàn)自身的問題,并走在其他企業(yè)前面,提高競爭力。
4大數(shù)據(jù)時代企業(yè)管理變革
隨著信息流動、網(wǎng)絡(luò)新生代的成長和數(shù)據(jù)量的增加,過去傳統(tǒng)企業(yè)可能通過強大的體制控制力,或者信息不對稱的優(yōu)勢地位進行封閉企業(yè)管理的模式,在今天已經(jīng)越來越行不通了。面對海量數(shù)據(jù),我們要以數(shù)據(jù)體現(xiàn)的內(nèi)容為先決條件,不斷適應(yīng)大數(shù)據(jù)時代的變革,同時,對企業(yè)的管理進行改進和變革,大數(shù)據(jù)時代下企業(yè)管理需要做出變革幾點如下。
4.1獲取數(shù)據(jù)在大數(shù)據(jù)時代,企業(yè)最重要的是進行數(shù)據(jù)的獲取,收集一定的數(shù)據(jù)才能更好地對企業(yè)進行管理和實施決策。大數(shù)據(jù)需要有一個平臺,需要進行一個數(shù)據(jù)的抓取,它有傳輸、分析、建模、優(yōu)化等作用,最后產(chǎn)生認(rèn)知,這些都是在大數(shù)據(jù)這個平臺上所必須具備的一些特性。這些特性使得企業(yè)間可以通過大數(shù)據(jù)平臺進行跨行業(yè)交流。大數(shù)據(jù)平臺會把全世界的數(shù)據(jù)進行共享,使得全世界在物理空間的活動都得以體現(xiàn)在大數(shù)據(jù)平臺上,這是一個很重要的概念。對于企業(yè)來說,要不斷融入這個平臺,通過共享數(shù)據(jù)和收集數(shù)據(jù),開發(fā)潛在客戶。
4.2管理團隊的挑戰(zhàn)大數(shù)據(jù)時代的到來對于企業(yè)的管理既是機遇又是挑戰(zhàn),對于企業(yè)的管理者來說,這有利于數(shù)據(jù)的收集和分析,我們在面對大數(shù)據(jù)的挑戰(zhàn)時,首先要將數(shù)據(jù)量化,量化的數(shù)據(jù)有利于管理效率的提升,管理者通過大量的數(shù)據(jù)信息掌握公司的業(yè)務(wù)和客戶,對公司內(nèi)部和外部客戶進行管理,提升管理和決策的質(zhì)量。我們可以通過以下三個方面面對挑戰(zhàn)。
4.2.1轉(zhuǎn)變管理模式企業(yè)在管理上要與時俱進,要在大數(shù)據(jù)時代充分了解數(shù)據(jù)是什么,并通過數(shù)據(jù)進行有利于自己企業(yè)發(fā)展的分析,要根據(jù)大數(shù)據(jù)轉(zhuǎn)變管理模式。海量數(shù)據(jù)是管理的主線,我們應(yīng)該通過數(shù)據(jù)說話,利用數(shù)據(jù)進行潛在客戶的挖掘。以往的管理模式都是由高層人員根據(jù)自己的經(jīng)驗進行決策和管理,而在大數(shù)據(jù)時代,我們應(yīng)該建立一個管理團隊,對海量數(shù)據(jù)進行管理和收集,通過分析數(shù)據(jù)得出結(jié)論,再通過研究討論,最終確立決策方案。這種管理方式可以給企業(yè)帶來巨大的商業(yè)價值,實現(xiàn)企業(yè)對客戶進行增值服務(wù)的附加值,以數(shù)據(jù)為主的管理模式更合理,更科學(xué),也更符合大數(shù)據(jù)時代的特點,此外,還有利于企業(yè)增強競爭力,提高管理和決策的效率。
4.2.2轉(zhuǎn)變思維模式面對大數(shù)據(jù)時代,企業(yè)管理者需要對大數(shù)據(jù)進行量化分析,這和傳統(tǒng)的思維模式并不相同,因此需要轉(zhuǎn)變管理者的思維模式。在面對重大決策和企業(yè)管理時,要先進行數(shù)據(jù)查找和數(shù)據(jù)分析,從數(shù)據(jù)上得出結(jié)論,分析結(jié)果,最后再進行決策和管理,這種方式不但會提高管理者的效率,也會提高其他工作人員的積極性和業(yè)務(wù)執(zhí)行能力。另外,我們要允許數(shù)據(jù)做主,也就是說提高數(shù)據(jù)分析的力度,將來自一線的數(shù)據(jù)進行分析,通過數(shù)據(jù)判斷決策是否正確,大數(shù)據(jù)的整理和分析是需要較長的時間來完成的,這對企業(yè)來說也是一種挑戰(zhàn)。
4.2.3培養(yǎng)人才資源在大數(shù)據(jù)時代人才資源是一個企業(yè)發(fā)展的重要因素。如今的高級管理人才越來越稀缺,擁有綜合能力的管理人才不多,因此企業(yè)應(yīng)該進行管理人才的培養(yǎng),只有將人才、科技、管理、決策進行融合和調(diào)整,才能使企業(yè)清晰自己的發(fā)展目標(biāo),制定適合自己的發(fā)展戰(zhàn)略。企業(yè)可以在管理人才的選擇上挑選一些經(jīng)驗豐富、學(xué)歷較高的人才,再進行崗前培訓(xùn)和在職培訓(xùn),提高他們的管理能力和應(yīng)對大數(shù)據(jù)時代的能力。企業(yè)通過培養(yǎng)視覺化、系統(tǒng)化人才,將企業(yè)的海量數(shù)據(jù)進行快速、高效的整理和分析,從而提高企業(yè)競爭力,使企業(yè)能充分迎接大數(shù)據(jù)時代帶來的挑戰(zhàn),更好地把握大數(shù)據(jù)時代出現(xiàn)的機遇。
5結(jié)語
[關(guān)鍵詞]大數(shù)據(jù);統(tǒng)計數(shù)據(jù);準(zhǔn)確性;評估方法;適用性
[DOI]1013939/jcnkizgsc201529041
1大數(shù)據(jù)的出現(xiàn)與應(yīng)對
1.1大數(shù)據(jù)的概念特征
大數(shù)據(jù)的概念從字面上可以理解為龐大的數(shù)據(jù)集合,當(dāng)然,如今的數(shù)據(jù)早已不局限于單一的數(shù)值變化,而是在數(shù)字網(wǎng)絡(luò)概念中彼此交疊冪次增長的非結(jié)構(gòu)化信息統(tǒng)籌。根據(jù)IDC報告,我們可知全球數(shù)據(jù)量的驚人變化,2009年80萬PB,2010年增幅達50%,達到了120萬PB,至2011年躍至190萬PB,激增的數(shù)據(jù)量印證著大數(shù)據(jù)時代的到來,見下圖。
2009―2011年的數(shù)據(jù)量變化柱狀圖
雖然對于大數(shù)據(jù)還沒有約定熟成的理論定義,但是在本文中我們不妨直觀地將其理解為涵蓋數(shù)值數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),并對其進行分析整合的海量數(shù)據(jù)集。
大數(shù)據(jù)的幾項具有辨識度的特征,首先是數(shù)據(jù)集在體量上應(yīng)超越TB數(shù)量級,其次是數(shù)據(jù)信息應(yīng)多樣化,有數(shù)值數(shù)據(jù),也有像是圖片、視頻、音頻等非結(jié)構(gòu)化數(shù)據(jù),再次是數(shù)據(jù)的產(chǎn)生、采集和處理應(yīng)快速及時,最后是數(shù)據(jù)集整合的數(shù)據(jù)信息應(yīng)具有全面性和有效性。
1.2大數(shù)據(jù)對統(tǒng)計研究的挑戰(zhàn)
大數(shù)據(jù)的龐大數(shù)據(jù)體量,快速增長處理需求,多樣化全面性數(shù)據(jù)整合等現(xiàn)實情況都讓統(tǒng)計研究面臨著巨大挑戰(zhàn)。傳統(tǒng)的單一維度的樣本抽查的研究分析模式已經(jīng)不足以保證統(tǒng)計數(shù)據(jù)的準(zhǔn)確性。因此,我們不僅要擴大研究分析的樣本量保證統(tǒng)計結(jié)果的客觀性和真實性,還要通過增加反饋信息的呈現(xiàn)路徑,激發(fā)目標(biāo)群體的新型互動模式,將文字、圖片、視頻、音頻等都納入數(shù)據(jù)庫,從而增加數(shù)據(jù)維度,獲取高品質(zhì)海量數(shù)據(jù),實現(xiàn)統(tǒng)計研究新變革。
2大數(shù)據(jù)時代背景下統(tǒng)計數(shù)據(jù)質(zhì)量的界定
2.1統(tǒng)計數(shù)據(jù)質(zhì)量的含義
統(tǒng)計數(shù)據(jù)質(zhì)量的核心在于其準(zhǔn)確性,在大數(shù)據(jù)時代背景下,統(tǒng)計數(shù)據(jù)質(zhì)量還需考量統(tǒng)計目的,即滿足統(tǒng)計目的的具有準(zhǔn)確性的統(tǒng)計數(shù)據(jù)呈現(xiàn)。
2.2統(tǒng)計數(shù)據(jù)質(zhì)量的特征
根據(jù)上述統(tǒng)計數(shù)據(jù)質(zhì)量的含義,我們可以提煉出有關(guān)大數(shù)據(jù)時代背景下統(tǒng)計數(shù)據(jù)質(zhì)量的兩點特征。第一,是針對數(shù)據(jù)內(nèi)容,應(yīng)在客戶接受范圍內(nèi)控制誤差,保證數(shù)據(jù)采集處理的快速及時,并符合統(tǒng)計目的。第二,是針對數(shù)據(jù)呈現(xiàn),要有規(guī)范性的闡述,保證統(tǒng)計數(shù)據(jù)的口徑計算等采用相對一致的方式,表達完整,直觀易懂,盡量避免歧義冗長。
3各類統(tǒng)計數(shù)據(jù)質(zhì)量的評估方法及適用性分析
3.1邏輯規(guī)則檢驗
邏輯規(guī)則檢驗法,是宏觀的針對總量數(shù)據(jù)的一種評估方法,即根據(jù)統(tǒng)計數(shù)據(jù)中各個指標(biāo)之間相互作用,彼此粘連的內(nèi)在邏輯關(guān)系,來衡量測試數(shù)據(jù)的真實性和可信度。
由于這種邏輯規(guī)則檢驗法是基于傳統(tǒng)的統(tǒng)計理論,且可操作性強,易被客戶理解接受,所以在實際統(tǒng)計數(shù)據(jù)評估中應(yīng)用廣泛,常被用于政府統(tǒng)計部門的統(tǒng)計工作。但是,這種方法存在明顯漏洞,因為其檢驗規(guī)則過于單一,只要不出現(xiàn)重大邏輯沖突則推論出數(shù)據(jù)可信,加上即使出現(xiàn)了邏輯矛盾,僅通過比較無法獲知問題所在,無法確定問題數(shù)據(jù)的準(zhǔn)確范圍無法規(guī)避結(jié)果的多重性,使得結(jié)果相對粗略草率。
根據(jù)以上分析判斷邏輯規(guī)則檢驗法的適用性,我們可以將其作為初步評估統(tǒng)計數(shù)據(jù)的方法,在宏觀經(jīng)濟統(tǒng)計數(shù)據(jù)中以它為基礎(chǔ),結(jié)合其他方法,進行復(fù)式檢驗,能夠更好地得出統(tǒng)計結(jié)論,獲得民眾理解和認(rèn)可。
3.2核算數(shù)據(jù)重估
核算數(shù)據(jù)重估法,是一種對于邏輯規(guī)則檢驗法延伸拓展的評估方法,即基于待評估數(shù)據(jù)的核算體系重新設(shè)定的統(tǒng)計指標(biāo),從而重新估算統(tǒng)計數(shù)據(jù),然后對比現(xiàn)實數(shù)據(jù),實現(xiàn)對統(tǒng)計數(shù)據(jù)質(zhì)量的評估。這種評估方法的基本思路是一種在重新計量中的重復(fù)調(diào)查,擴充針對性的資料,將理想數(shù)據(jù)與實際數(shù)據(jù)對比分析,找出問題所在。
這種重估統(tǒng)計指標(biāo)的評估方法與邏輯規(guī)則檢驗一樣是在假設(shè)基礎(chǔ)核算構(gòu)成準(zhǔn)確性的前提下進行的,而重設(shè)的統(tǒng)計指標(biāo)與現(xiàn)實統(tǒng)計的指標(biāo)方式仍具有差異性,因此其對比評估的結(jié)果只能作為一種參考性依據(jù),能找到問題數(shù)據(jù)的大致方向但無法呈現(xiàn)具體錯誤情況。它尤其適用于判斷GDP的增速準(zhǔn)確性。
3.3計量模型分析
計量模型分析法,也是一種針對總量數(shù)據(jù)的評估方法,即在難以確定統(tǒng)計數(shù)據(jù)確切邏輯關(guān)系的情況下,建立模型評估,檢查是否出現(xiàn)差異情況。這種方法的關(guān)鍵是建立模型,尋找異常點,在操作過程中需要先根據(jù)統(tǒng)計理論和統(tǒng)計目的建立相應(yīng)的計量模型,再將樣本數(shù)據(jù)進行相應(yīng)估算檢查,反復(fù)調(diào)整,多次代入評估,最終得出結(jié)論。
3.4統(tǒng)計分布驗證
統(tǒng)計分布驗證法,是針對分類數(shù)據(jù)的一種評估方法,即在掌握了個體數(shù)據(jù)和分類匯總數(shù)據(jù)之后,基于已知的分布特性,驗證理論性分布情況與實際統(tǒng)計數(shù)據(jù)分布情況是否相悖,進而得出評估結(jié)果。
這種評估方法的檢驗過程首先是通過理論分析和調(diào)查研究確定統(tǒng)計分布的特性,找到個體數(shù)據(jù)與匯總數(shù)據(jù)的分布形態(tài),然后對比理論數(shù)據(jù)與待評估數(shù)據(jù)的分布是否一致,若是發(fā)現(xiàn)異常點則需要進一步驗證分析其具體誤差值情況,從而判斷統(tǒng)計數(shù)據(jù)質(zhì)量。這種評估方法的缺陷在于確定統(tǒng)計數(shù)據(jù)的分布特性,這是評估的前提,但也是在實際操作中最難攻克的關(guān)鍵。
3.5調(diào)查偏差評估
調(diào)查偏差評估法,是一種事后調(diào)查分析的方法,即通過對統(tǒng)計數(shù)據(jù)中調(diào)查偏差的評估,約束調(diào)查條件進行重復(fù)調(diào)查,以期獲得最真實的統(tǒng)計數(shù)據(jù)。這種方法的開展是在預(yù)設(shè)存在可得的真實統(tǒng)計數(shù)據(jù)前提下,那么這個關(guān)鍵點就成為了該評估方法最大的痛點和爭議點,因為是否存在理想調(diào)查條件下可得的真實統(tǒng)計數(shù)據(jù)是未知的,換言之就是假想的,沒有科學(xué)依據(jù)的。加之在實際操作中,要進行有效的調(diào)查條件控制涉及誤差參數(shù)的確定,計量模型的構(gòu)建,同時在區(qū)域范圍內(nèi)實現(xiàn)多次重復(fù)調(diào)查的難度也很大,因此,調(diào)查偏差評估的實際應(yīng)用有限,當(dāng)下僅適用于像人口普查這類的地區(qū)性普查統(tǒng)計數(shù)據(jù)的分析。
3.6多維評估延伸
由于大數(shù)據(jù)時代統(tǒng)計數(shù)據(jù)內(nèi)容的多樣性,多維化,評估方法的多維延伸也成為必然。所謂多維評估法目前涉及四種的評估路徑,即多級量度、指標(biāo)檢測、用戶需求,以及統(tǒng)籌綜合。雖然由于長期以來對數(shù)值統(tǒng)計分析的側(cè)重,多維評估還在發(fā)展階段,尚不成熟,但是隨著統(tǒng)計數(shù)據(jù)的非結(jié)構(gòu)化特性日益彰顯和人們對于統(tǒng)計數(shù)據(jù)質(zhì)量要求的日益提升,多維化評估將逐漸受到重視,得到完善應(yīng)用。
4結(jié)論
本文分析了包括邏輯規(guī)則檢驗、核算數(shù)據(jù)重估、計量模型分析、統(tǒng)計分布驗證、調(diào)查偏差評估、多維評估延伸在內(nèi)的六種評估方法的概念特征,以及適用性。其中前三種都是針對統(tǒng)計總量的評估方式,而后幾種則是針對分類數(shù)據(jù)的評估方法,涉及充分的信息采集,分布特性的確定,初始調(diào)查條件的確定,以及多維度的延伸。這些假定的前提與實際數(shù)據(jù)始終存在偏差,因此在獲得真實數(shù)據(jù)上還是屬于理想化推測,始終存在爭議點,而且在實際操作中具有執(zhí)行困難。
通過分析,我們不難發(fā)現(xiàn)目前各個對于統(tǒng)計數(shù)據(jù)質(zhì)量的評估方法仍存在較大的缺陷,這直接影響到我國統(tǒng)計事業(yè)的發(fā)展和與之密切相關(guān)的經(jīng)濟社會的總體發(fā)展。因此,我們需要加強對統(tǒng)計數(shù)據(jù)質(zhì)量評估方法的研究力度,進一步完善評估體系,適應(yīng)大數(shù)據(jù)時代的發(fā)展需求,用多維度復(fù)合型的研究成果保證統(tǒng)計結(jié)果的客觀性和真實性,還要通過增加反饋信息的呈現(xiàn)路徑,激發(fā)目標(biāo)群體的新型互動模式,實現(xiàn)中國統(tǒng)計研究的新變革。
參考文獻:
[1]王華,金勇進統(tǒng)計數(shù)據(jù)準(zhǔn)確性評估:方法分類及適用性分析[J].統(tǒng)計研究,2009(1)
[2]許滌龍,葉少波統(tǒng)計數(shù)據(jù)質(zhì)量評估方法研究述評[J].統(tǒng)計與信息論壇,2011(7)
[3]程開明,莊燕杰大數(shù)據(jù)背景下的統(tǒng)計[J].統(tǒng)計研究,2014(11)
[4]崔路云基于大數(shù)據(jù)時代背景對統(tǒng)計學(xué)教育的幾點思考[D].北京:首都經(jīng)濟貿(mào)易大學(xué),2013.
[5]劉春燕論大數(shù)據(jù)時代的統(tǒng)計制度與方法改革[J].蕪湖職業(yè)技術(shù)學(xué)院學(xué)報,2013(11)
電子商務(wù)的發(fā)展離不開大數(shù)據(jù),企業(yè)通過大數(shù)據(jù)對各種數(shù)據(jù)進行整理得出一定的規(guī)律來探尋近期的消費趨向、消費特征,以此來制定一系列的相應(yīng)營銷策略,這樣大大縮小了市場調(diào)查與決策分析的時間,使企業(yè)獲得更多的經(jīng)濟效益,實現(xiàn)了一個良性的市場循環(huán)使各個環(huán)節(jié)都實現(xiàn)高效運作。大數(shù)據(jù)與電子商務(wù)的結(jié)合是必然的,它將帶我們步入一個新的創(chuàng)新局面。
一、大數(shù)據(jù)概述
大數(shù)據(jù)不僅僅只是單獨意義上的擁有海量的數(shù)據(jù)信息量,而在于它更深層次的意義,對數(shù)據(jù)進行專業(yè)化的處理及分析,大數(shù)據(jù)是指所涉及的海量數(shù)據(jù)無法通過一些技術(shù)或者工具來進行整理和收集,而大數(shù)據(jù)時代的到來卻解決了這一問題,使海量數(shù)據(jù)變成了企業(yè)最寶貴的財富,給企業(yè)和人們的生活帶來了無法想象的巨大影響。
大數(shù)據(jù)和傳統(tǒng)的數(shù)據(jù)倉庫相比,具有很多的優(yōu)勢和創(chuàng)新點。大數(shù)據(jù)具有四方面的特點:
1、數(shù)據(jù)量巨大。它擁有各類的海量的數(shù)據(jù),涉及面更廣、種類更加齊全,還包括了需求分析、用戶細(xì)分等不同的數(shù)據(jù)分類,能夠滿足人們不同的需求。
2、數(shù)據(jù)種類繁多。大數(shù)據(jù)的容量比傳統(tǒng)的數(shù)據(jù)倉庫更大,其容納的信息量也必然繁多,信息種類也更加廣泛,有用戶的反饋信息、消費記錄、消費特點等非結(jié)構(gòu)化的數(shù)據(jù)。
3、價值密度低,商業(yè)價值高。大數(shù)據(jù)需要從海量的數(shù)據(jù)當(dāng)中提取出來對人們有用的資料,技術(shù)的難度增加了,數(shù)據(jù)的價值密度與其數(shù)據(jù)量不成正比,因此數(shù)據(jù)的價值密度低而商業(yè)價值高。
4、數(shù)據(jù)處理速度快。大數(shù)據(jù)通過對海量的數(shù)據(jù)進行處理,在巨大的數(shù)據(jù)庫中進行查詢,找出有價值的資料,只有通過不斷的提高其運行速度才能降低成本獲得經(jīng)濟利益。
從某種程度來說,大數(shù)據(jù)是信息時代的一種創(chuàng)新技術(shù),它將海量的信息數(shù)據(jù)量進行統(tǒng)計分析,從中獲取有價值的數(shù)據(jù),它的這種獲取有用信息的能力就是大數(shù)據(jù)。企業(yè)通過這一技術(shù)能夠提高決策效率,降低生產(chǎn)成本從而獲得經(jīng)濟效益。
二、大數(shù)據(jù)處理與電子商務(wù)
(一)電子商務(wù)的大數(shù)據(jù)時代
大數(shù)據(jù)的特點為電子商務(wù)帶來了許多的技術(shù)創(chuàng)新和思想觀念的改變,電子商務(wù)的發(fā)展主要依賴于消費者,掌握了消費信息的數(shù)據(jù),就能夠以此來制定合理化的經(jīng)營策略,能夠提前預(yù)測市場的發(fā)展方向,提前規(guī)劃和調(diào)整商品的類型及數(shù)量,依據(jù)消費者的消費特性來生產(chǎn)不會造成資源的浪費,還提高了生產(chǎn)效率,降低了成本。使企業(yè)擁有了更多的時間來開發(fā)新的商品,來增加消費者的數(shù)量,提高市場占有率。
(二)大數(shù)據(jù)時代的電子商務(wù)
步入大數(shù)據(jù)時代的原因:
1、個性化需求的增加。社會的發(fā)展使人們的生活水平不段的提高,人們的消費心理也在不斷地發(fā)生著變化,都希望自己是獨特的,是與眾不同的,企業(yè)通過大數(shù)據(jù)來進行數(shù)據(jù)分析,來為人們制定不同的需求方案和個性化產(chǎn)品。
2、信息技術(shù)的發(fā)展。隨著互聯(lián)網(wǎng)的發(fā)展我們進入了信息時代,海量的數(shù)據(jù)信息的出現(xiàn)讓數(shù)據(jù)的收集更加的便利,通過網(wǎng)絡(luò)數(shù)據(jù)被廣泛的使用,提高了其利用價值,還能夠被反復(fù)地使用,實現(xiàn)循環(huán)利用超出了其自身的價值。
3、用戶產(chǎn)生數(shù)據(jù)。大量的數(shù)據(jù)是來源于用戶,用戶通過網(wǎng)購、查詢資料、瀏覽網(wǎng)頁等都能產(chǎn)生大量的數(shù)據(jù),通過對數(shù)據(jù)的收集、分析就能夠為用戶制定出不同的需求方案,這種信息的種類是廣泛的,成本是低廉的。
4、數(shù)據(jù)的可獲得性。網(wǎng)店與傳統(tǒng)的零售商相比不同的就是數(shù)據(jù)的獲取方式不同,網(wǎng)店通過用戶的訪問就能得到用戶的相關(guān)信息,瀏覽記錄和消費行為,得到用戶更多的相關(guān)信息,而傳統(tǒng)的零售商只能知道用戶此時的需求和購買意向,無法獲得更全面的信息和更有價值的資料,電子商務(wù)使數(shù)據(jù)的可獲得性更加便利。
5、決策分析方法的智能化。大數(shù)據(jù)通過對數(shù)據(jù)的分析整理使企業(yè)的經(jīng)營決策更加精準(zhǔn)與便利,智能化的應(yīng)用節(jié)省了企業(yè)大量的時間,提高了其效率,也為未來的發(fā)展提供了經(jīng)營方向,同時也推動了各種分析工具的發(fā)展。
三、大數(shù)據(jù)為電子商務(wù)帶來的影響
(一)加強信息的安全服務(wù)
數(shù)據(jù)是一個企業(yè)的核心資源,也是企業(yè)具有競爭力的關(guān)鍵,加強信息的安全與保護對企業(yè)的持續(xù)經(jīng)營至關(guān)重要?;ヂ?lián)網(wǎng)本身就具有很大的安全隱患,存在著漏洞,容易被黑客和不法分子攻擊、利用,如果對信息不加以嚴(yán)密保護將會造成很嚴(yán)重的后果,許多辛苦研發(fā)出來的成果也將會丟失造成不必要的麻煩,加強信息安全是企業(yè)必須進行的一道程序。
(二)提供準(zhǔn)確的數(shù)據(jù)分析 ,創(chuàng)新營銷模式
大數(shù)據(jù)通過提供準(zhǔn)確的數(shù)據(jù)分析,得到人們廣泛的重視,使企業(yè)能更加便捷的制定出合理的營銷策略,提高生產(chǎn)效率,降低成本,實現(xiàn)精準(zhǔn)營銷。為創(chuàng)新商務(wù)的發(fā)展提供了突破口,有力的推動了電子商務(wù)的發(fā)展,構(gòu)建了新型的商務(wù)模式,并且創(chuàng)新了營銷模式,為用戶提供了個性化的服務(wù),凸顯不同消費者的特性,增加了企業(yè)的經(jīng)營業(yè)績,使其進入到了一個新的發(fā)展階段。
(三)及時的應(yīng)急處理能力
大數(shù)據(jù)能夠?qū)A康臄?shù)據(jù)資源進行信息查詢、數(shù)據(jù)分析、能夠快速的處理各種的數(shù)據(jù),企業(yè)不需要任何的硬件安裝,就能通過云平臺來進行存儲數(shù)據(jù),同時云技術(shù)能夠存儲海量的數(shù)據(jù),為大數(shù)據(jù)的發(fā)展提供了便利,能夠不占任何企業(yè)的空間來發(fā)展企業(yè),為企業(yè)存儲信息、分析數(shù)據(jù)提供了便利,加快了企業(yè)的運營速度,促進了企業(yè)的發(fā)展。
(四)實現(xiàn)產(chǎn)業(yè)技術(shù)創(chuàng)新,推動差異化競爭
創(chuàng)新使一個企業(yè)具備新的活力源泉,創(chuàng)新為企業(yè)增添了向前發(fā)展的動力,使其具有更廣闊的發(fā)展前景和發(fā)展空間, 阿里巴巴集團通過對其旗下的平臺業(yè)務(wù)資源發(fā)展創(chuàng)新不斷整合,使其擁有了獨特的數(shù)據(jù)處理與分析的能力。提高了企業(yè)的競爭力,使企業(yè)上升了一個層次,通過技術(shù)創(chuàng)新使企業(yè)獲得發(fā)展,用低成本獲得高收益。
【關(guān)鍵詞】大數(shù)據(jù)時代;計算科學(xué)與技術(shù);專業(yè)綜合改革;人才培養(yǎng)
引 言
大數(shù)據(jù)是一次信息技術(shù)的大變革,已經(jīng)慢慢成為商業(yè)、科技甚至教育領(lǐng)域的焦點,它的數(shù)據(jù)信息量龐大,其龐大的程度是沒有辦法在人工的有限時間內(nèi)管理和分析,并且從中提取到能為人們所利用的信息的。大數(shù)據(jù)通常有四種特性:數(shù)據(jù)的信息量巨大;數(shù)據(jù)的類型多種多樣,包含常見的視頻、圖片、音頻、文本和它們的聚合體等;數(shù)據(jù)處理的速度極快,能從各種數(shù)據(jù)中快速獲取有價值的信息并能給出決策。大數(shù)據(jù)技術(shù)高速發(fā)展,行業(yè)應(yīng)用的需求也越來越大,所以目前市場上的掌握大數(shù)據(jù)的人才很緊缺,因此,對大數(shù)據(jù)人才的培養(yǎng)是目前教育行業(yè)的重點。大數(shù)據(jù)的時代使現(xiàn)當(dāng)代的大學(xué)生有了新的機遇去創(chuàng)業(yè)和創(chuàng)新,同樣的也為當(dāng)代的高校信息與計算科學(xué)專業(yè)課程的改革提供了方向,其人才的培養(yǎng)模式和課程研究顯得尤為重要。
一、什么是大數(shù)據(jù)
大數(shù)據(jù)就是海量的數(shù)據(jù),并從中獲得有很大價值的信息或見解的當(dāng)今社會特有的一種新的能力。大數(shù)據(jù)通常有四種特性:數(shù)據(jù)的信息量巨大;數(shù)據(jù)的類型多種多樣,包含常見的視頻、圖片、聲音、文本以及它們的聚合體等;數(shù)據(jù)處理的速度極快,能從各種數(shù)據(jù)中快速獲取有價值的信息并能給出決策;具有很高的商業(yè)價值。
二、大數(shù)據(jù)時代對人才的需求與培養(yǎng)
在大數(shù)據(jù)的背景下,對信息與計算科學(xué)專業(yè)的學(xué)生的教育與培養(yǎng)目標(biāo)主要是:
(1)增強對于數(shù)據(jù)的分析能力
面對數(shù)據(jù)龐大的大數(shù)據(jù),分析能力顯得及其重要,在合理的時間內(nèi)進行管理和處理對幫助公司經(jīng)營和決策具有積極的作用。
(2)增強本專業(yè)的知識,計算科學(xué)專業(yè)的知識對于數(shù)據(jù)的分析并了解其中的結(jié)構(gòu)很重要
(3)要增強對數(shù)據(jù)的應(yīng)用能力
在對數(shù)據(jù)的分析能力的前提下增強對數(shù)據(jù)分析的應(yīng)用能力,從而實現(xiàn)數(shù)據(jù)的最終應(yīng)用。
這三種能力的培養(yǎng)使得學(xué)生既具有對大數(shù)據(jù)的分析能力,又符合當(dāng)代社會對該專業(yè)的知識的需求,從而更好地適應(yīng)社會,培養(yǎng)出一批能夠掌握能對大數(shù)據(jù)地收集,儲存,分析,處理并應(yīng)用地人才。
三、提高大學(xué)生的創(chuàng)業(yè)創(chuàng)新能力
要提高大學(xué)生的創(chuàng)業(yè)創(chuàng)新能力,在大數(shù)據(jù)的時代不斷進步的社會環(huán)境下,要增加對實踐能力的培養(yǎng),多在社會中磨練,增強自主意識,增加創(chuàng)業(yè)實踐的機會,讓學(xué)生的創(chuàng)新能力在一次次的親身體會中得以增強。因此對計算科學(xué)專業(yè)課程的結(jié)構(gòu)進行改變并優(yōu)化,使得其具有創(chuàng)業(yè)創(chuàng)新效果的變革顯得極其重要。應(yīng)當(dāng)對課堂教學(xué)內(nèi)容和課后的實踐教學(xué),并且對于考核的方式和方法要有實質(zhì)性的改變。
專業(yè)知識教學(xué)和實踐教學(xué)之間要完美結(jié)合起來,在實踐中鞏固理論知識,要培養(yǎng)學(xué)生的獨立工作能力,增強計算科學(xué)專業(yè)的學(xué)生的競爭能力,要處理好這個教學(xué)環(huán)節(jié),就要增加實踐的次數(shù),要充分利用實踐活動,要求全員參加,不得被其它課程取締或占用。
四、要編寫好新型的適合大數(shù)據(jù)時代的教材并提升相關(guān)地硬件設(shè)施
目前的教材需求是要增加計算機信息技術(shù)、數(shù)據(jù)處理和分析的相關(guān)知識,例如:大數(shù)據(jù)的分析,數(shù)據(jù)的探索,大數(shù)據(jù)網(wǎng)絡(luò)的建設(shè)等課程。對于一些不太重要的內(nèi)容可以適當(dāng)?shù)南鳒p或取消,相關(guān)的一些及其復(fù)雜的理論可以適當(dāng)?shù)穆灾v,而要把重點放在實踐和應(yīng)用上,從而加強學(xué)生的應(yīng)用計算能力。增強學(xué)生對概念的理解能力,將一些實用性很強的專業(yè)比如C++語言和Matlab語言的應(yīng)用等課程提前開設(shè),讓學(xué)生可以在之后的學(xué)習(xí)中對實際的問題進行求解,為了實踐課程的學(xué)習(xí)鋪墊基礎(chǔ)。同時加強對實踐實驗室的建設(shè),對硬件的升級,全面改善學(xué)生的實踐環(huán)境,讓實踐教學(xué)能更好地進行,讓學(xué)生在理論學(xué)習(xí)后能很快地動手實踐,并在實踐后能又很快地去學(xué)習(xí),實現(xiàn)理論學(xué)習(xí)和實踐活動地完美結(jié)合。
五、考核方式要變革
改變現(xiàn)有的考試和平時相結(jié)合的模式,要重點加強對學(xué)生的實踐成果和實踐能力的檢測。好的考核方法會更利于教學(xué)的進行。要以能力為核心全面考核學(xué)生的學(xué)習(xí)、實踐和創(chuàng)新能力。要對實驗實訓(xùn)進行全面評價,以利于接下來的實訓(xùn)的工作的進行。
結(jié)束語
逐漸完成教育制度,規(guī)范教學(xué)模式,提高教學(xué)質(zhì)量。全面提高人才的培養(yǎng)水平,讓國家的人才能為國家的建設(shè)增磚添瓦,而計算科學(xué)專業(yè)體系的建設(shè)仍然有更大的空間去開發(fā),時代在進步,科學(xué)在不斷地發(fā)展,要把傳授知識和培養(yǎng)能力并提高學(xué)生的素質(zhì)完美地融合起來,而這還需要很長的路要走,這就需要相關(guān)人員的共同努力奮斗,不斷變革,創(chuàng)新,讓我國的人才們能更出色,從而推動社會的發(fā)展,讓我國的教育實力越來越強,在邁向世界強國的路上能走的更快,提升我國的綜合國力。
作者簡介:吳娜(1995.9-),女,籍貫:湖南岳陽,研究方向:計算機。
參考文獻:
[1]劉淳安.大數(shù)據(jù)時代信息與計算科學(xué)專業(yè)課程體系優(yōu)化改革c實踐――高教學(xué)刊,2016.
關(guān)鍵詞:互聯(lián)網(wǎng)時代;大數(shù)據(jù)營銷
0.引言
隨著新時代互聯(lián)網(wǎng)技術(shù)的不斷不發(fā)展,人們的衣食住行已完全離不開現(xiàn)代信息技術(shù),企業(yè)在發(fā)展運營過程中對信息技術(shù)的要求越來越高,應(yīng)用也越來越廣,企業(yè)需要依靠現(xiàn)代信息技術(shù)將收集到的數(shù)據(jù)經(jīng)過匯總分析,總結(jié)出客戶的喜好,市場的走向,以便根據(jù)市場的變化,隨時做出相應(yīng)的調(diào)整?,F(xiàn)代企業(yè)的競爭越來越激烈,好的營銷策略是企業(yè)在市場競爭中占據(jù)一席之地的重要力量,想要企業(yè)在如此激烈的競爭中脫穎而出,就必須依靠大數(shù)據(jù)時代的先進的技術(shù)手段找到最簡單有效的營銷策略。大數(shù)據(jù)的普遍應(yīng)用對傳統(tǒng)的營銷模式產(chǎn)生了巨大的沖擊,消費者對生活品質(zhì)的個性化追求日益提高,大數(shù)據(jù)分析技術(shù)下的營銷模式逐漸成為各行業(yè)企業(yè)取得市場優(yōu)勢、贏得消費者喜歡的突破口。各行各業(yè)根植于本行業(yè)特性,在原有成熟營銷體系下加入大數(shù)據(jù)分析技術(shù),提升營銷策略的準(zhǔn)確性,實現(xiàn)營銷手段經(jīng)濟價值最大化變現(xiàn)。目前,針對大數(shù)據(jù)技術(shù)營銷的發(fā)展還處于萌芽期,企業(yè)對用戶消費網(wǎng)絡(luò)行為等數(shù)據(jù)的采集、追蹤、智能畫像、定向輸出等高新網(wǎng)絡(luò)技術(shù)的整合系統(tǒng)還不完善,還未挖掘出大數(shù)據(jù)技術(shù)營銷的潛力,沒有體現(xiàn)出其巨大的商業(yè)價值。因此,跳出現(xiàn)有的行業(yè)營銷模式和營銷思維,輔以大數(shù)據(jù)技術(shù)特點及已取得突破的大數(shù)據(jù)營銷模式最新研究成果,全面地分析大數(shù)據(jù)營銷模式落地實施方式,探索在大數(shù)據(jù)時代背景下企業(yè)營銷的發(fā)展目標(biāo)和方向,從長遠(yuǎn)來看有利于企業(yè)創(chuàng)造出順應(yīng)時代潮流的營銷模式,加入大數(shù)據(jù)技術(shù)手段的創(chuàng)新性營銷能夠極大地刺激消費人群,最直接地提高企業(yè)對消費市場的占有份額,實現(xiàn)營銷經(jīng)濟投入與產(chǎn)出的價值最大化。
1.互聯(lián)網(wǎng)時展下企業(yè)大數(shù)據(jù)營銷存在的問題
1.1數(shù)據(jù)質(zhì)量較差
大數(shù)據(jù)營銷的基礎(chǔ)是通過大數(shù)據(jù)技術(shù)收集、分析用戶的消費網(wǎng)絡(luò)行為的作出定向輸出內(nèi)容,基礎(chǔ)數(shù)據(jù)的準(zhǔn)確性是大數(shù)據(jù)行銷的根本。而亟需營銷創(chuàng)新的大部分中小企業(yè)由于技術(shù)和設(shè)備跟不上,專業(yè)的技術(shù)人員缺乏,導(dǎo)致大數(shù)據(jù)獲取渠道有限,并且未能對所獲取的大數(shù)據(jù)進行專業(yè)精確地分析。由此當(dāng)大部分中小企業(yè)面對企業(yè)經(jīng)營過程中用戶產(chǎn)生的海量消費數(shù)據(jù),也無法提取出有價值的信息,剔除無效信息,導(dǎo)致企業(yè)的大數(shù)據(jù)分析成本極高而轉(zhuǎn)化率無法滿足企業(yè)的要求,無法發(fā)揮其高效的營銷效果。同時,大數(shù)據(jù)技術(shù)營銷的各種成功案例促使著機構(gòu)和相關(guān)企業(yè)利用大數(shù)據(jù)炒作、造假和詐騙現(xiàn)象屢見不鮮,辨別數(shù)據(jù)真實性的專業(yè)技術(shù)手段也成了企業(yè)利用大數(shù)據(jù)營銷時所面對的難題之一。企業(yè)獲取的不準(zhǔn)確數(shù)據(jù)容易造成企業(yè)營銷決策的方向性錯誤,導(dǎo)致企業(yè)在市場競爭中掉隊,甚至經(jīng)營困難面臨倒閉的危機。企業(yè)必須通過正規(guī)的渠道獲取大數(shù)據(jù)以保證數(shù)據(jù)來源的可靠性和準(zhǔn)確性。只有在所獲取數(shù)據(jù)真實準(zhǔn)確的前提下,才能真正地發(fā)揮出大數(shù)據(jù)的優(yōu)勢。同時企業(yè)也需要配備大數(shù)據(jù)相應(yīng)的技術(shù)人員,引導(dǎo)企業(yè)營銷人員分析企業(yè)的大數(shù)據(jù),并將獲取到的有效信息運用到實際營銷中。另一方面,有些企業(yè)在人員、技術(shù)和設(shè)備等方面都能夠投入足夠的資源,但是仍然存在著較大的問題。是因為在大數(shù)據(jù)營銷實踐過程中,片面地關(guān)注于大數(shù)據(jù)的數(shù)據(jù)量上,卻忽視了數(shù)據(jù)本身只是為營銷行為所服務(wù)的,需要對數(shù)據(jù)根據(jù)不同產(chǎn)品、不同部門進行分類同時全盤統(tǒng)籌,避免不同營銷人員和部門各自為政。數(shù)據(jù)的分割是企業(yè)面臨的一個嚴(yán)重問題,不同產(chǎn)品和部門的數(shù)據(jù)收集儲存在不同地方,聯(lián)通性差難以對用戶全面有效地數(shù)據(jù)匯總分析。而且企業(yè)的營銷人員的能力限制,導(dǎo)致無法把收集的數(shù)據(jù)轉(zhuǎn)化為有針對的營銷方法,大大降低了大數(shù)據(jù)營銷的使用效果和轉(zhuǎn)化成果。
1.2營銷效果不理想
當(dāng)今社會發(fā)展中傳統(tǒng)營銷方面,廣告媒介比較豐富,除了傳統(tǒng)電視報紙等媒體之外,還有門戶網(wǎng)站、商業(yè)LED屏、手機APP客戶端、交通宣傳等多種方式,想要達到宣傳效果,就需要統(tǒng)籌媒介渠道,這種營銷手段的營銷成本十分高昂。另外,一般的綜藝冠名和活動贊助費用動輒過億,明星代言更是花費巨大,所以企業(yè)采用傳統(tǒng)的營銷費用是顯而易見的。但是即便在高企的營銷費用基礎(chǔ)上,企業(yè)也承擔(dān)著較大的風(fēng)險,企業(yè)產(chǎn)品與代言的明星相關(guān)性太強,一旦明星發(fā)生任何負(fù)面新聞,對于企業(yè)也是有著不小的影響。即便企業(yè)在產(chǎn)品設(shè)計、市場定價、渠道銷售等方面考慮得面面俱到,例如產(chǎn)品市場定位,先打入中高端市場建立人氣和口碑,再擴展自己的產(chǎn)品線發(fā)展極具性價比的低端產(chǎn)品;在銷售渠道方面,參與各大節(jié)日促銷和網(wǎng)絡(luò)平臺促銷。但是往往企業(yè)忽視了產(chǎn)品營銷的根本點,比如對于日常出行類而言,客戶所關(guān)心的問題是質(zhì)量、安全、性價比,這三項特性有一項不足,再完美的營銷策略也達不到預(yù)期的效果。
1.3缺乏專業(yè)的大數(shù)據(jù)營銷人才
在這個大數(shù)據(jù)時代,數(shù)據(jù)的量多且繁雜,要想從龐大的數(shù)據(jù)庫中提取出高價值的信息,就需要專業(yè)的數(shù)據(jù)處理團隊。數(shù)據(jù)的收集、整理、篩選等工作,都不是簡單的數(shù)學(xué)計算或依靠電腦軟件就能夠獲得的,目前很多企業(yè)都缺乏處理海量數(shù)據(jù)的專業(yè)人才。專業(yè)的數(shù)據(jù)分析員成為了各大企業(yè)爭相得到的人才,而既能對本公司的運營操作了如指掌又能熟練地掌握龐大的數(shù)據(jù)信息的人才更是少之又少,大部分的企業(yè)在大數(shù)據(jù)營銷人才方面還是很匱乏的。很多企業(yè)雖然有專業(yè)的市場營銷團隊,甚至不惜花大價錢聘請專業(yè)的營銷管理者,但是,大數(shù)據(jù)營銷人才和大數(shù)據(jù)技術(shù)型人才仍是他們稀缺的人才資源。
2.互聯(lián)網(wǎng)時展下的企業(yè)大數(shù)據(jù)營銷策略分析
2.1拓寬數(shù)據(jù)來源
在互聯(lián)網(wǎng)時代背景下,企業(yè)可以根據(jù)需要多方位的獲取有效數(shù)據(jù):(1)政府機構(gòu)如銀行等數(shù)據(jù);(2)交易數(shù)據(jù);(3)移動通信數(shù)據(jù);(4)移動通信數(shù)據(jù);(5)機器和傳感器數(shù)據(jù);(6)企業(yè)信息系統(tǒng)。大數(shù)據(jù)可以作為企業(yè)對營銷決策的輔助手段,不能跳躍企業(yè)決策人直接下達指令。在大數(shù)據(jù)技術(shù)運用過程中,企業(yè)應(yīng)結(jié)合傳統(tǒng)的調(diào)研手段構(gòu)建企業(yè)創(chuàng)新型大數(shù)據(jù)營銷體系。
2.2提升營銷效率
為了進一步提升企業(yè)營銷工作效率,企業(yè)可以選擇第三方技術(shù)團隊幫助自己搭建大數(shù)據(jù)系統(tǒng),通過大數(shù)據(jù)系統(tǒng)源源不斷地獲取數(shù)據(jù),并進行高效地數(shù)據(jù)提取和分析,然后智能化輸出與企業(yè)商品、服務(wù)及用戶群體相關(guān)聯(lián)的信息鏈,在系統(tǒng)中將這些信息鏈優(yōu)化處理并不斷累積,逐漸形成企業(yè)自有的龐大用戶信息數(shù)據(jù)系統(tǒng),以供營銷人員作為營銷方案的原始數(shù)據(jù)。企業(yè)在經(jīng)營過程和營銷活動中利用大數(shù)據(jù)平臺的作用,積累大量的市場信息與客戶數(shù)據(jù),依靠大數(shù)據(jù)系統(tǒng)數(shù)據(jù)作為基礎(chǔ),對每一位實際消費者和潛在消費者進行智能畫像,透析其個人喜好與需求,精準(zhǔn)地向其輸出商品信息。大數(shù)據(jù)營銷關(guān)鍵在于企業(yè)應(yīng)建立對市場定位及用戶信息數(shù)據(jù)的信心,從零到有加大資源投入,做到比用戶更了解自己替用戶做出選擇。例如,企業(yè)在運營過程中可以利用移動端應(yīng)用、移動通訊、免費WiFi點等服務(wù)獲取本地位置信息類大數(shù)據(jù),還可以通過各大電商、搜索、短視頻平臺獲取用戶近期瀏覽、搜索、關(guān)注的內(nèi)容信息并智能化分析,了解其的消費需求信息,整合不同企業(yè)的商品及服務(wù)內(nèi)容,采取精準(zhǔn)定向投放內(nèi)容包括商品折扣活動、廣告信息、銷售鏈接渠道等多種信息,具有個性化的營銷活動能更加貼近消費者,提高企業(yè)營銷投入的轉(zhuǎn)化成功率。大數(shù)據(jù)系統(tǒng)的建立和運營需要企業(yè)投入足夠的設(shè)備及軟件系統(tǒng)、專業(yè)技術(shù)人員、信息渠道等資源,收集企業(yè)所提供的商品、服務(wù)、技術(shù)解決方案相關(guān)的經(jīng)營數(shù)據(jù)、市場定位、競品信息、客戶及潛在客戶等一系列數(shù)據(jù),在大數(shù)據(jù)系統(tǒng)中將這些信息有效的聯(lián)系整合,然后通過分析建立企業(yè)的用戶消費數(shù)據(jù)庫。
2.3加強專業(yè)人才的培養(yǎng)
在大數(shù)據(jù)系統(tǒng)運營中需要有專業(yè)的技術(shù)人員提供維護、升級、更新、數(shù)據(jù)轉(zhuǎn)化等服務(wù),可以將企業(yè)原有的營銷部門人員配合專業(yè)的大數(shù)據(jù)分析工程師組成工作小組,根據(jù)企業(yè)商品和服務(wù)的特點以及現(xiàn)有營銷活動,制定出大數(shù)據(jù)背景下的個性化營銷方案,而原有營銷部門人員也可以發(fā)揮工作特長,調(diào)研前期市場需求和定位,后續(xù)跟進商品口碑及改進建議,分析其市場占有率及相關(guān)競品數(shù)據(jù)等信息。通過調(diào)研信息調(diào)整企業(yè)新業(yè)務(wù)戰(zhàn)略發(fā)展方向,打造符合市場潮流的爆款新品,爭取更多的市場占用率。新產(chǎn)品運營部有利于公司大數(shù)據(jù)資源的成果轉(zhuǎn)化,利用大數(shù)據(jù)系統(tǒng)預(yù)測用戶潛在消費力和消費想法,提前布局搶占商機。同時在企業(yè)管理方面,可以將該部門并入業(yè)務(wù)團隊,確定以數(shù)據(jù)流量、用戶粘度、消費額作為考核要點。將營銷部門和大數(shù)據(jù)工作部門作為兄弟部門,提供良好的溝通協(xié)作環(huán)境,提升工作效率。企業(yè)也可組建單獨的大數(shù)據(jù)部門,發(fā)揮大數(shù)據(jù)技術(shù)的強大分析能力。加強對大數(shù)據(jù)分析人才的重視和培養(yǎng),推進大數(shù)據(jù)營銷復(fù)合型人才的崗位定崗定薪工作,快速推進企業(yè)大數(shù)據(jù)營銷的發(fā)展。
或許會讓你感到驚訝,但它確實是全新英特爾至強E7 v2處理器帶來的變化。E7 v2是否就是那把打開大數(shù)據(jù)應(yīng)用之門的鑰匙?、
“IDC報告顯示,到2020年,中國產(chǎn)生的數(shù)據(jù)量將達到9ZB?!叭绻麑⑦@些數(shù)據(jù)印刷裝訂成冊,形成的書將厚得超過在冥王星和地球之間往返30次的距離?!?月25日,在英特爾至強處理器 E7 v2 產(chǎn)品家族的會上,英特爾(中國)有限公司產(chǎn)品平臺事業(yè)部總經(jīng)理Brent Young所形容的這個數(shù)據(jù)世界,離我們還有不到6年。但今天,大多數(shù)人一定依然覺得它十分遙遠(yuǎn)。
不要著急,我們與數(shù)據(jù)親密接觸的時間,或許能伴隨英特爾至強處理器 E7 v2 產(chǎn)品家族的面世而大幅縮短。作為通往大數(shù)據(jù)未來的關(guān)鍵,這個全新的計算平臺或許會驅(qū)動整個產(chǎn)業(yè)鏈向大數(shù)據(jù)快步進發(fā)。
內(nèi)存計算的突破
正如Brent Young所說,對計算平臺而言,大數(shù)據(jù)是一種“新負(fù)載”,它所對應(yīng)的將是對內(nèi)存計算、內(nèi)存分析和大規(guī)模虛擬化的需求。英特爾至強E7 v2正是為這種“新負(fù)載”而設(shè)計的。擁有最多15個處理內(nèi)核,每插槽1.5TB內(nèi)存容量,平均性能為上一代產(chǎn)品的兩倍,最高可支持32路的服務(wù)器平臺……這些改變,讓英特爾至強E7 v2相比上一代產(chǎn)品有了本質(zhì)上的變化。
人們對大數(shù)據(jù)的最初設(shè)想,是具備對數(shù)據(jù)的實時分析能力,而支撐實時分析能力的恰恰是內(nèi)存計算。過去幾年,應(yīng)用層的眾多需求都指向內(nèi)存計算,這個訴求雖然一直驅(qū)動著計算的發(fā)展,但質(zhì)的變化遠(yuǎn)沒有E7 V2顯著。從以往計算平臺的演進來看,多核、并行的發(fā)展趨勢,并不能有效解決大數(shù)據(jù)實時分析的需求。在浪潮集團副總裁胡雷鈞看來,E7 V2與上一代產(chǎn)品相比,內(nèi)存的可擴展能力提升了3倍,是最令人感到興奮的地方。原先必須放到硬盤上的數(shù)據(jù)現(xiàn)在可以放到內(nèi)存中,意味著未來80%以上的數(shù)據(jù)庫都可以放在內(nèi)存中運行,連續(xù)的數(shù)據(jù)處理能力將大幅提升,其意義將是劃時代的。
“基于Hadoop架構(gòu)的大數(shù)據(jù)分析,對處理器和內(nèi)存之間的帶寬要求同樣很高。光有大內(nèi)存并不一定會讓內(nèi)存計算發(fā)揮其應(yīng)有的效力。E7 v2不僅有足夠大的內(nèi)存容量,還有足夠強大的內(nèi)存帶寬的擴展能力,才能讓軟件體現(xiàn)出足夠好的性能。”胡雷鈞強調(diào),這些新特性將讓未來的大數(shù)據(jù)應(yīng)用有更大的發(fā)揮空間。
大數(shù)據(jù)是技術(shù)推動的結(jié)果,扼制住大數(shù)據(jù)的恰恰也是技術(shù)本身的局限性。長久以來,內(nèi)存計算的變革主要依賴系統(tǒng)上的優(yōu)化,“胡雷鈞們”要突破眾多技術(shù)難關(guān)僅能獲得“一小步”改善。而基于計算平臺的突破性變革,才是讓內(nèi)存計算跨出“一大步”的關(guān)鍵。
從分析到實時分析
數(shù)據(jù)宇宙中的東西對人們似乎很重要,但當(dāng)前的大數(shù)據(jù)分析、大數(shù)據(jù)應(yīng)用,還遠(yuǎn)遠(yuǎn)沒有達到人們的預(yù)期。人們已經(jīng)看到了那個將由大數(shù)據(jù)改變一切的未來,但卻觸不可及;人們努力嘗試著各種大數(shù)據(jù)應(yīng)用,但代價卻是長時間的等待或高昂的成本。基于傳統(tǒng)的計算平臺,大數(shù)據(jù)的價值根本沒有被挖掘出來。
在會現(xiàn)場,戴爾的工程師展示了一個真實的大數(shù)據(jù)應(yīng)用案例。這是一個基于HANA和BU平臺的智能交通應(yīng)用,主要是對一個城市的交通狀況進行實時分析,數(shù)據(jù)量約為100億條、40TB。按照戴爾大中華區(qū)企業(yè)級解決方案部市場總監(jiān)彭宇恒的話說,這個演示如果運行在以前的平臺至少需要幾個小時,有時甚至還“跑”不出來。但在E7 V2平臺上,不管是基于投入、成本比或勞動強度進行的運價補貼可選性分析,還是通過基于空間熱點的地理位置分析實現(xiàn)的車輛調(diào)度、駕駛路徑優(yōu)化,抑或是基于一定區(qū)域?qū)哲嚳蛰d率的行駛速度和負(fù)重車行駛速度的分析判斷城市道路擁堵狀況,出分析結(jié)果的時間均為秒級。
“比如我們選擇一周的數(shù)據(jù),一般是100GB左右。再選擇管理駕駛艙,再選擇一個時間段,系統(tǒng)就會立即對這個時間段的數(shù)據(jù)進行回歸分析,得出數(shù)據(jù)分布圖,還能細(xì)化到每小時、每天、每輛車的數(shù)據(jù)展示,參數(shù)可以隨時調(diào)整?!迸碛詈愕恼麄€演示過程就像在玩游戲,無需等待,所有的分析結(jié)果都是實時按照他的操作顯示成圖表。對于這樣驚人的分析速度,彭宇恒給出的解釋是,因為這是“內(nèi)存計算”。所有的數(shù)據(jù)都在內(nèi)存中,可以被實時讀取,所以數(shù)據(jù)分析的圖形可以實時動態(tài)變化。
這次演示帶給觀者的最強烈感受是,一直在阻礙人們接近大數(shù)據(jù)應(yīng)用時代的東西似乎已被移除。如果說這是計算平臺的又一次進步,那么這次進步正在改變的正是人們對數(shù)據(jù)分析、數(shù)據(jù)應(yīng)用的感官認(rèn)知。更關(guān)鍵的是,它帶來了成本效益上的巨大變化,而這才是大數(shù)據(jù)被廣泛應(yīng)用的前提。
2018年,內(nèi)存計算技術(shù)市場規(guī)模將達到132.3億美元,是2013年的6倍之多。內(nèi)存計算會在系統(tǒng)內(nèi)存中放置整個大型數(shù)據(jù)集進行分析,而非在傳統(tǒng)硬盤上進行。這意味著企業(yè)可以“實時”完成復(fù)雜的數(shù)據(jù)分析,為用戶提供之前無法想象的全新體驗和服務(wù)。面對海量數(shù)據(jù)的實時分析,企業(yè)束手無策,很難高效、實時地分析數(shù)據(jù),并用其進行高效的商業(yè)決策、改善用戶體驗、完成精準(zhǔn)的廣告營銷等的局面將宣告結(jié)束。
服務(wù)器產(chǎn)業(yè)再度進入創(chuàng)新期
E7 v2的價值還不僅僅是在大數(shù)據(jù)分析領(lǐng)域發(fā)酵。胡雷鈞認(rèn)為,在關(guān)鍵業(yè)務(wù)領(lǐng)域,E7 v2對于大幅提升系統(tǒng)穩(wěn)定性又提供了更多的可能?!皫啄昵?,在底層硬件平臺還沒有像今天這么完善的情況下,我們一直在上層尋求突破。但實際上,如果從系統(tǒng)的角度去做更多保障CPU穩(wěn)定性的設(shè)計,不僅困難大,耗費的精力也會很多,而且還可能費力不討好。一個處理器的生命周期一般只有兩年或兩年多一點,但這種優(yōu)化就要花上幾個月甚至半年時間?!彼嬖V記者,現(xiàn)在很多問題都已經(jīng)被英特爾在處理器端解決,上層的軟件可以做更多創(chuàng)造性工作。例如,過去如果處理器周邊的電路上落有灰塵,在電磁環(huán)境不好的時候,隨時可能因為靜電短路發(fā)生錯誤,而這些意外錯誤積累到一定程度隨時可能會發(fā)生突變。如果可以利用軟件查看到這些問題,就可以立即解決,而以前這些問題是沒有辦法解決的。現(xiàn)在我們通過CPU提供的一些特性就可以用軟件隨時凍結(jié)或關(guān)閉CPU,而不影響業(yè)務(wù)運行。因為處理器有了這樣的特性,服務(wù)器廠商才能在系統(tǒng)平臺上進行相應(yīng)的設(shè)計,處理器特性的豐富也會給浪潮的設(shè)計帶來更大的想象空間。
“從計算的角度看,E7 v2將會帶來強勁的創(chuàng)新加速效應(yīng)。”在胡雷鈞眼中,服務(wù)器廠商等待已久的創(chuàng)新機會即將因為E7 v2而到來。
通過E7 v2,英特爾已經(jīng)把高性能計算領(lǐng)域的很多關(guān)鍵技術(shù)移植到了商業(yè)應(yīng)用領(lǐng)域,商用服務(wù)器產(chǎn)品的潛能將由此被激發(fā),而在大數(shù)據(jù)分析領(lǐng)域,它又提供了解決核心問題的突破性方法。當(dāng)初,E5的推出曾被服務(wù)器市場認(rèn)為是恰逢“云”時,而今天E7 v2的面世在大數(shù)據(jù)領(lǐng)域似乎也產(chǎn)生了類似的效果。英特爾如果能贏得整個產(chǎn)業(yè)鏈的響應(yīng),很可能會讓國內(nèi)的大數(shù)據(jù)應(yīng)用在明年出現(xiàn)全新局面。
一、大數(shù)據(jù)的概念和發(fā)展
大數(shù)據(jù)指的是以多元化形式,根據(jù)眾多來源搜集信息,并將其匯總成一個巨大的數(shù)據(jù)庫。一般情況下,大數(shù)據(jù)具有實時特性,這些數(shù)據(jù)來源于社交網(wǎng)絡(luò)、電子商務(wù)網(wǎng)站或者顧客的來訪紀(jì)錄等等,而這并不是企業(yè)公司與消費者關(guān)系管理數(shù)據(jù)庫中的常態(tài)數(shù)據(jù)。在大數(shù)據(jù)庫中,不僅蘊藏著數(shù)據(jù)生產(chǎn)者的喜好、目的、真實意圖等非傳統(tǒng)結(jié)構(gòu)上的數(shù)據(jù)信息,有效處理這些數(shù)據(jù)信息對網(wǎng)絡(luò)架構(gòu)及數(shù)據(jù)處理能力也帶來了更多挑戰(zhàn)。同樣,從酒店管理的未來發(fā)展走向來看,隨著大數(shù)據(jù)時代的不斷推進,酒店領(lǐng)域的大數(shù)據(jù)化也正處于發(fā)展階段,這就需要酒店企業(yè)正視大數(shù)據(jù)時代的發(fā)展優(yōu)勢,緊緊抓住發(fā)展機遇,切實提高酒店管理工作的效率和質(zhì)量。
二、大數(shù)據(jù)應(yīng)用于酒店管理工作的現(xiàn)狀
(一)對大數(shù)據(jù)的認(rèn)識不全面
在不同時代,酒店行業(yè)的發(fā)展會遇到不同的機遇和挑戰(zhàn),伴隨大數(shù)據(jù)時代的不斷發(fā)展,酒店行業(yè)也得到了更為廣泛的發(fā)展平臺。所謂大數(shù)據(jù),就是將客戶的資料信息進行綜合歸納和整理,以便作為酒店企業(yè)在進行布置布局的重要數(shù)據(jù)基礎(chǔ),從而促進酒店行業(yè)的快速發(fā)展。在采集客戶數(shù)據(jù)的過程中,仍然存在很多紕漏和不足,而且由于很多企業(yè)對大數(shù)據(jù)的認(rèn)識不夠全面,導(dǎo)致數(shù)據(jù)庫往往失去其原本作用,徒有形式而沒有實際作用。
(二)應(yīng)用程度較低
經(jīng)過調(diào)查與分析,發(fā)現(xiàn)很多酒店在進行客戶數(shù)據(jù)整理與利用方面都存在或多或少的缺陷,其中多數(shù)酒店僅僅將大數(shù)據(jù)應(yīng)用于銷售營業(yè)報表以及盈利預(yù)算方面,疏于對這些數(shù)據(jù)的進一步開發(fā)與分析,導(dǎo)致數(shù)據(jù)信息的浪費,沒有真正發(fā)揮在酒店市場營運方面應(yīng)有的作用。由此可見,在現(xiàn)代酒店管理工作中,很多酒店企業(yè)對大數(shù)據(jù)的應(yīng)用程度極低,在很大程度上影響了酒店行業(yè)的后續(xù)發(fā)展。
(三)酒店基本服務(wù)設(shè)施不配套
對一個優(yōu)秀的酒店企業(yè)而言,其服務(wù)質(zhì)量和水平不僅體現(xiàn)在為客人提供的優(yōu)質(zhì)餐飲方面,更體現(xiàn)在酒店客房別具一格的設(shè)計上。然而,很多酒店企業(yè)的基本服務(wù)設(shè)施不配套,也影響了消費者對酒店服務(wù)的滿意程度。因此,為了解決這一問題,各大酒店企業(yè)必須要充分考慮到消費者的隱私問題,采取智能門禁、智能取電開關(guān)、智能電腦網(wǎng)絡(luò)等等先進設(shè)備,提升消費者的滿意度。
三、酒店管理工作中大數(shù)據(jù)的具體應(yīng)用
(一)應(yīng)用標(biāo)準(zhǔn)化酒店管理,簡化數(shù)據(jù)管理
在酒店管理工作中,為了保證其科學(xué)化與自動化,就必須要采取良性循環(huán)發(fā)展的管理模式,應(yīng)用標(biāo)準(zhǔn)化酒店管理,簡化客戶信息數(shù)據(jù)管理。另外,酒店也要根據(jù)技術(shù)與市場的不斷發(fā)展做出相應(yīng)的調(diào)適,充分運用大數(shù)據(jù),達到推動酒店行業(yè)快速發(fā)展的終極目的。
(二)確保大數(shù)據(jù)運用的安全性
目前,由于大數(shù)據(jù)技術(shù)系統(tǒng)仍然存在漏洞,在酒店管理服務(wù)工作中常發(fā)生客戶信息泄露等問題,而這也嚴(yán)重威脅著酒店行業(yè)的經(jīng)營與發(fā)展。因此,酒店大數(shù)據(jù)管理系統(tǒng)必須要及時更新,并通過設(shè)計具體管理部門,對客戶信息加密,保證酒店信息的正常流動。由此可見,確保大數(shù)據(jù)運用的安全性,能夠有效提升消費者的滿意程度,從而增加酒店的收入。
(三)加強酒店信息系統(tǒng)的開發(fā)
面對大數(shù)據(jù)時代的發(fā)展與推動,酒店行業(yè)必須要積極應(yīng)對挑戰(zhàn),及時加強對酒店信息系統(tǒng)的進一步開發(fā),充分發(fā)揮在線旅游平臺的優(yōu)勢,從而建立獨立的數(shù)據(jù)收集與整理的平臺,通過對信息的歸納與分析,幫助酒店企業(yè)更好地了解消費者的實際需求。
關(guān)鍵詞:大數(shù)據(jù);信息;大數(shù)據(jù)安全
中圖分類號:TP311.13
麥肯錫公司在2011年的報告(Bigdata:the Next FrontierforInnovation)中,對這種密集型數(shù)據(jù)爆炸的現(xiàn)象稱為“大數(shù)據(jù)”時代的到來。大數(shù)據(jù)領(lǐng)域出現(xiàn)的許多新技術(shù),是大數(shù)據(jù)采集、存儲、處理和呈現(xiàn)的有力武器。
1 大數(shù)據(jù)概念
大數(shù)據(jù)概念的前身是海量數(shù)據(jù),但兩者有很大的區(qū)別。海量數(shù)據(jù)主要強調(diào)了數(shù)據(jù)量的規(guī)模,對其特性并沒有特別關(guān)注。而大數(shù)據(jù)對傳播速率、體積、特征等數(shù)據(jù)的各種特性進行了描述。目前對大數(shù)據(jù)最廣泛的定義是:大數(shù)據(jù)是無法在一定時間內(nèi)用通常的軟件工具進行收集、分析、管理的大量數(shù)據(jù)的集合。大數(shù)據(jù)的特點一般用“4V”概括,即:Volume:數(shù)據(jù)量大,目前大數(shù)據(jù)的最小單位一般被認(rèn)為是10~20TB的量級;Variety:數(shù)據(jù)類型多,包括了結(jié)構(gòu)化、非結(jié)構(gòu)化和半結(jié)構(gòu)化數(shù)據(jù);value:數(shù)據(jù)的價值密度很低;velocity:數(shù)據(jù)產(chǎn)生和處理的速度非???。
2 大數(shù)據(jù)相關(guān)技術(shù)
2.1 大數(shù)據(jù)處理通用技術(shù)架構(gòu)。大數(shù)據(jù)的基本處理流程與傳統(tǒng)數(shù)據(jù)處理流程的主要區(qū)別在于:由于大數(shù)據(jù)要處理大量、非結(jié)構(gòu)化的數(shù)據(jù),所以在各個處理環(huán)節(jié)中都可以采用并行處理。目前,Map Reduce等分布式處理方式已經(jīng)成為大數(shù)據(jù)處理各環(huán)節(jié)的通用處理方法。
Map Reduce分布式方法最先由谷歌設(shè)計并實現(xiàn),包括分布式文件系統(tǒng)GFS、Map Reduce分布式編程環(huán)境以及分布式大規(guī)模數(shù)據(jù)庫管理系統(tǒng)Bigrable。Map Reduce是一套軟件框架,包括Map和Reduce兩個階段,可以進行海量數(shù)據(jù)分割、任務(wù)分解與結(jié)果匯總,從而完成海量數(shù)據(jù)的并行處理。Map Reduce的工作原理是先分后合的數(shù)據(jù)處理方式。Map即“分解”,把海量數(shù)據(jù)分割成若干部分,分給多臺處理器并行處理;Reduce即“合并”,把各臺處理器處理后的結(jié)果進行匯總操作,以得到最終結(jié)果。用戶只需要提供自己的Map函數(shù)以及Reduce函數(shù)就可以在集群上進行大規(guī)模的分布式數(shù)據(jù)處理。Map Reduce將處理任務(wù)分配到不同的處理節(jié)點,因此具有更強的并行處理能力。
2.2 大數(shù)據(jù)采集。大數(shù)據(jù)的采集是指利用數(shù)據(jù)庫等方式接收發(fā)自客戶端(Web、App或者傳感器形式等)的數(shù)據(jù)。大數(shù)據(jù)采集的主要特點是并發(fā)訪問量大,因為同時有可能會有成千上萬的用戶來進行訪問和操作,比如火車票售票網(wǎng)站的并發(fā)訪問量在峰值時達到上百萬,這時傳統(tǒng)的數(shù)據(jù)采集工具很容易失效。大數(shù)據(jù)采集方法主要包括:系統(tǒng)日志采集、網(wǎng)絡(luò)數(shù)據(jù)采集、數(shù)據(jù)庫采集、其他數(shù)據(jù)采集等四種。
2.3 大數(shù)據(jù)分享。目前數(shù)據(jù)分享主要通過數(shù)據(jù)集市和開放數(shù)據(jù)平臺等方法實現(xiàn)。開放數(shù)據(jù)平臺可以提供涵蓋本地服務(wù)、娛樂、教育和醫(yī)療等方方面面的數(shù)據(jù)集合,用戶不但可以通過API訪問,還可以很方便地通過SDK集成到移動應(yīng)用當(dāng)中。在線數(shù)據(jù)集市除了提供下載數(shù)據(jù)的功能外,還為用戶提供上傳和交流數(shù)據(jù)的場所。數(shù)據(jù)平臺和數(shù)據(jù)集市不但吸引有數(shù)據(jù)需求用戶,還能夠吸引很多數(shù)據(jù)開發(fā)者在平臺上進行開發(fā)。
2.4 大數(shù)據(jù)預(yù)處理。數(shù)據(jù)預(yù)處理就是對采集的數(shù)據(jù)進行清洗、填補、平滑、合并、規(guī)格化以及檢查一致性等處理,并對數(shù)據(jù)的多種屬性進行初步組織,從而為數(shù)據(jù)的存儲、分析和挖掘做好準(zhǔn)備。通常數(shù)據(jù)預(yù)處理包含三個部分:數(shù)據(jù)清理、數(shù)據(jù)集成和變換和數(shù)據(jù)規(guī)約。
2.5 大數(shù)據(jù)存儲及管理。大數(shù)據(jù)需要行之有效的存儲和管理,否則人們不能處理和利用數(shù)據(jù),更不能從數(shù)據(jù)中得到有用的信息。目前,大數(shù)據(jù)的存儲和管理技術(shù)主要分三類:分布式文件系統(tǒng)、數(shù)據(jù)倉庫和非關(guān)系型數(shù)據(jù)庫(NoSOL)。
2.6 大數(shù)據(jù)分析及挖掘。大數(shù)據(jù)的分析和挖掘是一種決策支持過程,它主要基于人工智能、機器學(xué)習(xí)、模式識別、數(shù)據(jù)挖掘、統(tǒng)計學(xué)、數(shù)據(jù)庫等技術(shù),高度自動化地分析大數(shù)據(jù),做出歸納性的推理,從中挖掘出潛在的模式,從而在大數(shù)據(jù)中提取有用信息。大數(shù)據(jù)的分析和挖掘與傳統(tǒng)的數(shù)據(jù)挖掘比較有兩個特點:一是通常采用并行處理的方式;二是大數(shù)據(jù)分析對實時處理的要求很高,流處理等實時處理技術(shù)受到人們歡迎。常用的方法有:機器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識別、統(tǒng)計分析、并行處理。
2.7 大數(shù)據(jù)檢索。(1)數(shù)據(jù)庫實時檢索:在數(shù)據(jù)倉庫或者NoSOL等大數(shù)據(jù)存儲平臺上,或者多個不同結(jié)構(gòu)的數(shù)據(jù)存儲平臺之間快速、實時地查詢和檢索不同結(jié)構(gòu)的數(shù)據(jù)。(2)實時搜索引擎:對互聯(lián)網(wǎng)上的大量數(shù)據(jù)和信息進行即時、快速搜索,實現(xiàn)即搜即得的效果。目前各大搜索引擎都在致力于實時搜索的實現(xiàn)。
2.8 大數(shù)據(jù)可視化??梢蕴峁└鼮榍逦庇^的數(shù)據(jù)感官,將錯綜復(fù)雜的數(shù)據(jù)和數(shù)據(jù)之間的關(guān)系,通過圖片、映射關(guān)系或表格,以簡單、友好、易用的圖形化、智能化的形式呈現(xiàn)給用戶供其分析使用,可通過數(shù)據(jù)訪問接口或商業(yè)智能門戶實現(xiàn),通過直觀的方式表達出來。可視化與可視分析通過交互可視界面來進行分析、推理和決策;從海量、動態(tài)、不確定甚至相互沖突的數(shù)據(jù)中整合信息,獲取對復(fù)雜情景的更深層的理解;可供人們檢驗已有預(yù)測,探索未知信息,同時提供快速、可檢驗、易理解.的評估和更有效的交流手段??梢暬侨藗兝斫鈴?fù)雜現(xiàn)象,診釋復(fù)雜數(shù)據(jù)的重要手段和途徑。