時(shí)間:2023-03-21 17:04:45
導(dǎo)語(yǔ):在測(cè)算方法論文的撰寫(xiě)旅程中,學(xué)習(xí)并吸收他人佳作的精髓是一條寶貴的路徑,好期刊匯集了九篇優(yōu)秀范文,愿這些內(nèi)容能夠啟發(fā)您的創(chuàng)作靈感,引領(lǐng)您探索更多的創(chuàng)作可能。
/
關(guān)鍵詞:練習(xí)設(shè)計(jì);形成性作業(yè);障礙診斷;“減負(fù)增效”科學(xué)化
文章編號(hào):1005–6629(2014)2–0003–04 中圖分類(lèi)號(hào):G633.8 文獻(xiàn)標(biāo)識(shí)碼:B
作業(yè)這個(gè)詞在我國(guó)教育教學(xué)領(lǐng)域廣為使用始于上世紀(jì)50年代“學(xué)習(xí)蘇聯(lián)”之后。在俄語(yǔ)詞匯中,作業(yè)(задание)還有功課、任務(wù)的意思,它的同詞根詞задача則是任務(wù)、習(xí)題的意思。упражнение也有作業(yè)的意思,但主要指練習(xí)作業(yè)和習(xí)題。在蘇聯(lián)教育學(xué)中,學(xué)生的實(shí)驗(yàn)室作業(yè)和實(shí)習(xí)作業(yè)是作業(yè)的重要類(lèi)型。由此,通常認(rèn)為作業(yè)是指要求學(xué)生在一定時(shí)限內(nèi)完成的學(xué)習(xí)性的活動(dòng)任務(wù),它包括練習(xí)以及以解決問(wèn)題為主的設(shè)計(jì)及實(shí)踐活動(dòng)??梢?jiàn),作業(yè)不僅僅是練習(xí),兩者之間是有些區(qū)別的。但是,時(shí)至今日,作業(yè)一詞在我國(guó)似乎成了練習(xí)的代名詞,加上基礎(chǔ)教育的特點(diǎn)和教學(xué)時(shí)間等條件的限制,中學(xué)化學(xué)教學(xué)中的作業(yè)是以練習(xí)為主的,大量的是練習(xí),通常所說(shuō)作業(yè)設(shè)計(jì)實(shí)際上是指練習(xí)設(shè)計(jì),實(shí)驗(yàn)室作業(yè)和實(shí)習(xí)作業(yè)大多用實(shí)驗(yàn)(活動(dòng))和實(shí)踐活動(dòng)來(lái)分別指稱(chēng)。本文在討論作業(yè)設(shè)計(jì)時(shí),相應(yīng)地以練習(xí)設(shè)計(jì)為主,用意在于突出對(duì)練習(xí)設(shè)計(jì)改進(jìn)的研究。
2005年,筆者曾經(jīng)概括化學(xué)新教材中練習(xí)設(shè)計(jì)和練習(xí)教學(xué)的主要問(wèn)題,并就存在問(wèn)題的解決提出了一些意見(jiàn)[1]。然而8年之后,就總體情況而言,教材練習(xí)設(shè)計(jì)與教學(xué)實(shí)際“兩張皮”,各搞一套,形成巨大落差的現(xiàn)象依然存在。而且,應(yīng)試壓力越來(lái)越大,許多教師在練習(xí)教學(xué)中追求“一步到位”,達(dá)到新的程度;“題海惡浪”使學(xué)生苦不堪言,許多教師也無(wú)可奈何;少數(shù)人對(duì)“造?!焙途幵祀y題頗為得意,卻沒(méi)有重視練習(xí)異化的嚴(yán)重威脅日益臨近:學(xué)生摔書(shū)、棄學(xué)事件頻發(fā),“讀書(shū)無(wú)用論”重新泛起,“取消化學(xué)學(xué)科升學(xué)考試”的趨勢(shì)日益明確……“物極必反”,先人總結(jié)的這個(gè)規(guī)律,應(yīng)該喚起我們的警醒。不錯(cuò),考試還是要的,恰當(dāng)?shù)膽?yīng)試教學(xué)是需要的,改革有關(guān)制度也不是教師所能決定的,但這并不意味著教師可以因循守舊,維持現(xiàn)狀,無(wú)所作為,依然按舊認(rèn)識(shí)、舊經(jīng)驗(yàn)辦事。我們都希望化學(xué)教育搞得更好,都不希望化學(xué)教育受到影響,因此,每一個(gè)教師都必須深入地思考和探索如何消除痼疾,如何在教師職責(zé)范圍內(nèi)改革應(yīng)試和練習(xí)教學(xué),努力實(shí)現(xiàn)“減負(fù)增效”。
筆者認(rèn)為,要實(shí)現(xiàn)練習(xí)教學(xué)減負(fù)增效,除了要堅(jiān)持整體規(guī)劃,系統(tǒng)設(shè)計(jì),逐步提高,積極創(chuàng)新之外,當(dāng)前應(yīng)著重解決好下列問(wèn)題:
1 合理定位,注意跟課文融合
總的來(lái)看,目前教材的編寫(xiě)仍存在重“學(xué)”輕“習(xí)”、“學(xué)”“習(xí)”分離現(xiàn)象,對(duì)課文編寫(xiě)比較重視,練習(xí)編寫(xiě)有時(shí)只是起點(diǎn)綴作用,缺乏深入、有效的練習(xí)指導(dǎo),助推了實(shí)踐中各行其是。
實(shí)際上,練習(xí)屬于問(wèn)題之列,跟教材或者課堂教學(xué)中設(shè)置的問(wèn)題沒(méi)有本質(zhì)的區(qū)別。有計(jì)劃的、恰當(dāng)編制的跟課文融合的練習(xí)不但能鞏固、拓展、深化學(xué)生的知識(shí)技能,培養(yǎng)學(xué)生的能力,也能使學(xué)生在情感態(tài)度價(jià)值觀方面得到發(fā)展,具有促進(jìn)學(xué)生發(fā)展的功能。通過(guò)練習(xí)還可以獲得教學(xué)反饋信息,利于教學(xué)調(diào)控,促進(jìn)預(yù)定教學(xué)目標(biāo)的實(shí)現(xiàn)。練習(xí)過(guò)程也是學(xué)生繼續(xù)學(xué)習(xí)的過(guò)程,是學(xué)習(xí)過(guò)程的一個(gè)重要環(huán)節(jié)。
由此可以將練習(xí)合理地定位為:它不僅是“習(xí)”,也是“學(xué)”的重要方式和組成部分;要重視教材中練習(xí)的編寫(xiě),加強(qiáng)練習(xí)指導(dǎo),使它跟課文有機(jī)地融合,做到“學(xué)”中有“習(xí)”,“習(xí)”中有“學(xué)”。在教材中練習(xí)的編寫(xiě)尚未得到改善時(shí),教師在教學(xué)設(shè)計(jì)中可以做出適當(dāng)?shù)难a(bǔ)充和調(diào)整。
2 有的放矢,重視練習(xí)的“形成”本性
在應(yīng)試需要的驅(qū)使下,不少教師把練習(xí)變成了“做卷子”的過(guò)程,仿照終結(jié)性考試的編制方法來(lái)編制平常的教學(xué)練習(xí),使練習(xí)喪失了應(yīng)有的基本屬性——形成性。久而久之,一些教師甚至不知道如何有效地編制形成性練習(xí)了。因此,重視和體現(xiàn)練習(xí)的形成本性,針對(duì)學(xué)生的薄弱環(huán)節(jié),有的放矢地促進(jìn)“形成”是十分重要的。
2.1 前提:準(zhǔn)確診斷
最有效的“形成”,是有的放矢的“形成”。為此,除了要研究和遵循學(xué)生學(xué)習(xí)各具體內(nèi)容的一般規(guī)律外,還需要做好學(xué)習(xí)困難和障礙的診斷。
思維的過(guò)程就是解決問(wèn)題的過(guò)程,學(xué)習(xí)困難大多出現(xiàn)在解決問(wèn)題的過(guò)程之中,它們的主要類(lèi)型有:基礎(chǔ)較差型(包括知識(shí)缺失型、程序缺陷型等);能力較弱型(包括策略無(wú)效型、經(jīng)驗(yàn)貧乏型、思維緩慢型、不太熟練型等);元認(rèn)知失衡型(包括元認(rèn)知缺乏型、注意不當(dāng)型、缺乏反思型等);以及情意問(wèn)題型(包括信心不足型、害怕困難型、心不在焉型、易受干擾型)等。
進(jìn)行學(xué)習(xí)困難和障礙診斷的方法主要有:基于任務(wù)分析的個(gè)別談話(huà)、概念圖表達(dá)、思維路線(xiàn)陳述、出聲思維、行為觀察以及診斷性作業(yè)等等。
2.2 關(guān)鍵:對(duì)“癥”處理
在明確學(xué)習(xí)困難和障礙類(lèi)型之后,可以用不同類(lèi)型的作業(yè)配合其他方面的措施,作對(duì)“癥”處理。例如:
對(duì)于知識(shí)缺失型,可以通過(guò)補(bǔ)救型作業(yè)、拓展型作業(yè)、應(yīng)用型作業(yè)進(jìn)行知識(shí)“補(bǔ)課”;通過(guò)分解型作業(yè)促進(jìn)理解;通過(guò)對(duì)比型作業(yè)突出條件、特點(diǎn);通過(guò)變式型作業(yè)促進(jìn)對(duì)核心、本質(zhì)、重點(diǎn)的掌握;通過(guò)強(qiáng)化型作業(yè)促進(jìn)知識(shí)鞏固。
對(duì)于程序缺陷型,可以通過(guò)矯正型作業(yè)、補(bǔ)救型作業(yè)糾正程序錯(cuò)誤;通過(guò)誘錯(cuò)型作業(yè)消除錯(cuò)誤定勢(shì)、引起警惕。
對(duì)于策略無(wú)效型,可以通過(guò)分解型作業(yè)和綜合型作業(yè)結(jié)合,促進(jìn)對(duì)策略的理解;通過(guò)觀念的方法論內(nèi)涵演繹與樣例示范促進(jìn)策略的思考和累積;豐富題型知識(shí),注意題型體驗(yàn)。
對(duì)于經(jīng)驗(yàn)貧乏型,可以通過(guò)變化型作業(yè)、拓展型作業(yè)、應(yīng)用型作業(yè)來(lái)充實(shí)、豐富經(jīng)驗(yàn)。
對(duì)于思維緩慢型和不太熟練型,通過(guò)歸納型作業(yè),以及有序和適當(dāng)?shù)卦黾泳毩?xí)量,以促進(jìn)形成“圖式*”,有利于思維提速和熟練解題過(guò)程。
對(duì)于元認(rèn)知缺乏型,可以通過(guò)解說(shuō)型作業(yè),要求學(xué)生解說(shuō)解題依據(jù)及過(guò)程,學(xué)習(xí)反思和換位換向思考,強(qiáng)化其元認(rèn)知意識(shí)、知識(shí)和體驗(yàn)。
對(duì)于情意問(wèn)題型,應(yīng)以心理矯正方法為主,也可以應(yīng)用激趣型作業(yè)、應(yīng)用型作業(yè)、動(dòng)手型作業(yè)來(lái)配合。
對(duì)于注意不當(dāng)型,可以通過(guò)強(qiáng)化策略意識(shí),改善情意心理來(lái)提高注意品質(zhì)。
上述各種類(lèi)型的作業(yè)都是針對(duì)學(xué)生薄弱環(huán)節(jié)的“形成性練習(xí)”,廣義地說(shuō),這種“形成性練習(xí)”也包括診斷性作業(yè)在內(nèi)。除此之外,還有不具有特定目的、旨在進(jìn)行常規(guī)教學(xué)訓(xùn)練的“形成性練習(xí)”,下面討論中的舉例即可歸屬于此類(lèi)。
3 劃分層次,逐步“到位”
教學(xué)中的練習(xí)應(yīng)該是由若干習(xí)題構(gòu)成的有機(jī)整體,而不是若干習(xí)題的隨意拼湊,應(yīng)該根據(jù)預(yù)期功能賦予適當(dāng)?shù)膶哟谓Y(jié)構(gòu):或者是變式重復(fù),以求鞏固、強(qiáng)化;或者逐步拓展,以求發(fā)展;或者是逐步深入,以求提高。
課時(shí)練習(xí)跟單元練習(xí)、學(xué)段練習(xí)以及升學(xué)應(yīng)試練習(xí)要注意拉開(kāi)檔次,明確分工,不能“一步到位”。為此,需要先做好整體計(jì)劃,并注意有計(jì)劃地覆蓋基本的題型。
對(duì)于學(xué)習(xí)基礎(chǔ)不同、學(xué)習(xí)速度各異的不同類(lèi)型學(xué)生,應(yīng)該通過(guò)練習(xí)選擇指導(dǎo),分類(lèi)提供適合他們的練習(xí),使他們都能逐步發(fā)展、提高。
恰當(dāng)?shù)貏澐至?xí)題的層次是按照上述內(nèi)容搞好練習(xí)教學(xué)的重要前提。怎樣合理地給習(xí)題劃分層次呢?通常可采用的方法主要是:
3.1 參照布魯姆教育目標(biāo)分類(lèi)體系劃分習(xí)題層次
在B. S.布魯姆提出教育目標(biāo)分類(lèi)法之后,曾任美國(guó)《Journal of Chemical Education》總主編的列品考特(W. T. Lippincott)教授等人就用來(lái)對(duì)化學(xué)試(習(xí))題進(jìn)行過(guò)分類(lèi)。1987年,筆者曾經(jīng)借鑒布魯姆的分類(lèi)思想、指導(dǎo)原則和編制方法,根據(jù)解答問(wèn)題時(shí)需要涉及的認(rèn)知操作,將中學(xué)化學(xué)試(習(xí))題分為知道、領(lǐng)會(huì)或?qū)W會(huì)、應(yīng)用、綜合運(yùn)用和創(chuàng)新等層次,測(cè)量它們的實(shí)際難度,發(fā)現(xiàn)這個(gè)認(rèn)知序列跟難度增長(zhǎng)有著很明顯的相關(guān)性[2]。據(jù)此,可以參照布魯姆的教育目標(biāo)分類(lèi)體系把習(xí)題區(qū)分為不同的層次(見(jiàn)表1)。
3.2 利用SOLO分類(lèi)體系劃分習(xí)題層次
SOLO(Structure of the Observed Learning Outcome,意為可觀察的學(xué)習(xí)成果的結(jié)構(gòu))分類(lèi)評(píng)價(jià)理論是由比格斯(J. B. Biggs)及其同事提出的。其基本觀點(diǎn)是:兒童的心理發(fā)展在不同的學(xué)科中有不同的表現(xiàn),具有階段性的特征,同一個(gè)學(xué)生甚至在同一個(gè)學(xué)科的不同知識(shí)點(diǎn)上都會(huì)處于不同思維階段。教學(xué)不僅要關(guān)心學(xué)生的認(rèn)知發(fā)展階段,更要關(guān)注學(xué)生的真實(shí)學(xué)習(xí)情況,尋找學(xué)生學(xué)習(xí)質(zhì)量出現(xiàn)差異的原因,以便“因材施教”促進(jìn)學(xué)生的發(fā)展。他們把學(xué)生在學(xué)習(xí)新知識(shí)過(guò)程中表現(xiàn)出來(lái)的可以觀察到的思維階段稱(chēng)為“可觀察的學(xué)習(xí)成果結(jié)構(gòu)”,根據(jù)學(xué)生解答具體問(wèn)題時(shí)表現(xiàn)出的思維結(jié)構(gòu)在性質(zhì)和抽象水平上的復(fù)雜變化,假設(shè)學(xué)生在學(xué)習(xí)時(shí)存在由感覺(jué)運(yùn)動(dòng)的、形象的、具體符號(hào)的、形式的、后形式的5種方式依次組成的普遍發(fā)展順序,并進(jìn)而描述了每種方式下的反應(yīng)水平,把學(xué)生的學(xué)習(xí)結(jié)果由低到高劃分為前結(jié)構(gòu)的、單一結(jié)構(gòu)的、多元結(jié)構(gòu)的、關(guān)聯(lián)結(jié)構(gòu)的和拓展抽象結(jié)構(gòu)的5個(gè)層次[3]:
(1)前結(jié)構(gòu)水平(Prestructural):學(xué)生被情境中無(wú)關(guān)的方面及以前所學(xué)的無(wú)關(guān)知識(shí)所困擾或誤導(dǎo),沒(méi)有真正理解問(wèn)題,不了解相關(guān)知識(shí),或使用過(guò)于簡(jiǎn)單的方法去解決問(wèn)題,表現(xiàn)為任務(wù)沒(méi)有得到合理地處理,回答問(wèn)題時(shí)邏輯混亂,給出錯(cuò)誤的或不相關(guān)的答案。這是最低級(jí)的水平,可認(rèn)為學(xué)習(xí)者不具有回答該問(wèn)題的能力。
(2)單一結(jié)構(gòu)水平(Unistructural):學(xué)習(xí)者只能聯(lián)系與該問(wèn)題相關(guān)的單一事件,找到一個(gè)線(xiàn)索或資料就立即得出結(jié)論,忽視了可能的內(nèi)在矛盾,或者僅僅是靠記憶回答,而不是真正理解。
(3)多元結(jié)構(gòu)水平(Multistructural):學(xué)生回答問(wèn)題時(shí),能聯(lián)系多個(gè)孤立事件,使用兩個(gè)或多個(gè)線(xiàn)索或資料,但未能覺(jué)察到這些線(xiàn)索或資料之間的聯(lián)系,未能對(duì)線(xiàn)索或資料進(jìn)行有機(jī)整合。常常給出一些支離破碎的信息,未形成相關(guān)問(wèn)題的知識(shí)網(wǎng)絡(luò)。
(4)關(guān)聯(lián)結(jié)構(gòu)水平(Relational):學(xué)習(xí)者能夠把握問(wèn)題線(xiàn)索和相關(guān)素材及它們之間的聯(lián)系,進(jìn)行概括歸納,將它們聯(lián)結(jié)在總體的聯(lián)系框架中成為一個(gè)有機(jī)整體,能解決較為復(fù)雜的問(wèn)題,并將解答的各部分內(nèi)容整合起來(lái),使之具有統(tǒng)一的結(jié)構(gòu)和意義。這表明學(xué)習(xí)者已對(duì)這個(gè)主題有充分的理解。
(5)拓展、抽象結(jié)構(gòu)水平(Extended abstract):學(xué)習(xí)者能概括一些抽象特征,把前面得到的整體概念轉(zhuǎn)化到更高的抽象水平,或者拓展問(wèn)題本身的意義,推廣這個(gè)結(jié)構(gòu)到一個(gè)新的主題或領(lǐng)域,表現(xiàn)出較高的創(chuàng)新能力。
以這個(gè)5層次發(fā)展序列為標(biāo)準(zhǔn),可以把習(xí)題劃分為不同水平(見(jiàn)表2),根據(jù)學(xué)生在解答問(wèn)題時(shí)的表現(xiàn)來(lái)判斷他所處的思維發(fā)展階段。這就是說(shuō),SOLO法可用于形成性的學(xué)生學(xué)業(yè)評(píng)價(jià)。
4 探索負(fù)荷測(cè)算方法,實(shí)現(xiàn)“減負(fù)增效”科學(xué)化
要科學(xué)地“減負(fù)增效”,需要對(duì)負(fù)荷進(jìn)行測(cè)算,而不是只憑主觀感覺(jué)“毛估估”。
澳大利亞心理學(xué)家約翰·斯威勒(John Sweller)在1988年提出認(rèn)知負(fù)荷理論[5]。他認(rèn)為,學(xué)習(xí)過(guò)程中的各種認(rèn)知活動(dòng)都需要消耗認(rèn)知資源,如果所需要的認(rèn)知資源總量超過(guò)了個(gè)體所具有的認(rèn)知資源總量,存在認(rèn)知資源分配不足的問(wèn)題,會(huì)出現(xiàn)超負(fù)荷現(xiàn)象,從而影響學(xué)習(xí)效率和質(zhì)量。認(rèn)知負(fù)荷包括內(nèi)在認(rèn)知負(fù)荷、外在認(rèn)知負(fù)荷和關(guān)聯(lián)認(rèn)知負(fù)荷。內(nèi)在認(rèn)知負(fù)荷與學(xué)習(xí)材料的性質(zhì)關(guān)聯(lián),是由所學(xué)材料本身的復(fù)雜程度決定的,在信息要素高度交互作用以及學(xué)習(xí)者還沒(méi)有有效掌握合適圖式時(shí),會(huì)產(chǎn)生高度的內(nèi)在認(rèn)知負(fù)荷。外在認(rèn)知負(fù)荷是由信息的呈現(xiàn)方式和學(xué)習(xí)者需要的學(xué)習(xí)活動(dòng)所引起的,它主要是由設(shè)計(jì)不當(dāng)引起。關(guān)聯(lián)認(rèn)知負(fù)荷是指與促進(jìn)圖式構(gòu)建和圖式自動(dòng)化過(guò)程相關(guān)的認(rèn)知負(fù)荷,它也受控于設(shè)計(jì)者。外在和內(nèi)在認(rèn)知負(fù)荷不利于學(xué)習(xí),而關(guān)聯(lián)認(rèn)知負(fù)荷有利于學(xué)習(xí)。認(rèn)知負(fù)荷理論在20世紀(jì)90年展成為研究認(rèn)知過(guò)程和教學(xué)設(shè)計(jì)框架的一個(gè)重要理論,但學(xué)者們對(duì)其涵義的理解始終沒(méi)有統(tǒng)一[6]。
目前在管理研究領(lǐng)域,國(guó)際上有關(guān)腦力負(fù)荷的研究方法主要有:主任務(wù)度量法、次任務(wù)度量法、生理度量法和主觀度量法。其中,主任務(wù)度量法是通過(guò)對(duì)操作者在工作中的表現(xiàn)來(lái)推算這一工作強(qiáng)加于操作者的腦力負(fù)荷,有很明顯的缺陷;次任務(wù)度量法通過(guò)對(duì)操作者完成次要任務(wù)時(shí)的表現(xiàn)來(lái)推算,受到的質(zhì)疑更多;生理度量法目前的可靠性不強(qiáng)而且依賴(lài)于多種特殊儀器、難于廣泛應(yīng)用;主觀度量法則永遠(yuǎn)無(wú)法完全消除其主觀性[7]。
筆者認(rèn)為,在練習(xí)設(shè)計(jì)中對(duì)習(xí)題的主任務(wù)進(jìn)行結(jié)構(gòu)分析,有可能表征其復(fù)雜性,由此可以確定習(xí)題的靜態(tài)難度(或稱(chēng)絕對(duì)難度)和推測(cè)學(xué)生的認(rèn)知負(fù)荷極限,并進(jìn)一步確定習(xí)題的層次。
試(習(xí))題難度的標(biāo)定方法大致可以分為采用客觀指標(biāo)的事后標(biāo)定和主要采用主觀指標(biāo)的事前標(biāo)定兩大類(lèi)型。事后標(biāo)定大多以通過(guò)率或者得分率作為試(習(xí))題的難度,在測(cè)驗(yàn)評(píng)價(jià)和試卷分析中已經(jīng)廣泛應(yīng)用。對(duì)于試(習(xí))題編制及其難度調(diào)控來(lái)說(shuō),事前標(biāo)定難度比事后標(biāo)定難度似乎更有直接意義,但是事前標(biāo)定實(shí)際難度的困難要比事后標(biāo)定大,其主觀性也比事后標(biāo)定大。目前,國(guó)內(nèi)外都有不少學(xué)者在探索如何更好地進(jìn)行試(習(xí))題難度的事前標(biāo)定,嘗試根據(jù)影響因素來(lái)標(biāo)定問(wèn)題的絕對(duì)難度;提出了各種絕對(duì)難度標(biāo)定方法,如多維度分析系統(tǒng)、任務(wù)加工信息數(shù)量評(píng)估法、認(rèn)知復(fù)雜性評(píng)估法、認(rèn)知任務(wù)分析法和關(guān)系-表征復(fù)雜性模型等等[8,9,10,11,12]。
一般說(shuō)來(lái),試(習(xí))題的難度與其復(fù)雜性有關(guān),對(duì)其復(fù)雜性系統(tǒng)地作具體分析,有助于確定影響試(習(xí))題難度的主要內(nèi)在因素并進(jìn)而測(cè)算其量值。問(wèn)題是由基質(zhì)(或稱(chēng)預(yù)設(shè)、主題、已知等)、疑項(xiàng)和解3部分組成的,并且往往在一定的背景下產(chǎn)生,用適當(dāng)?shù)恼Z(yǔ)言表述,在一定的情境中呈現(xiàn)。由此可以推測(cè)影響試(習(xí))題難度的各種因素包括下列各方面:
(1)問(wèn)題表述的準(zhǔn)確性和鮮明性;閱讀量大小。
(2)情境的復(fù)雜性;情境與問(wèn)題以及學(xué)生認(rèn)知經(jīng)驗(yàn)的貼近程度,對(duì)建模以解決問(wèn)題的啟發(fā)性、便利性。
(3)基質(zhì)(已知條件)中包括模塊和圖式在內(nèi)的知識(shí)點(diǎn)的多少、隱蔽性、充分必要性;各知識(shí)點(diǎn)的關(guān)聯(lián)復(fù)雜性。
(4)疑項(xiàng)和解的多少;已知條件與解之間的障礙與干擾的多少;中間任務(wù)或中間目標(biāo)的多少(任務(wù)的復(fù)雜性)。
(5)解的開(kāi)放性、指向性(搜索空間大?。?。
(6)問(wèn)題結(jié)構(gòu)的多元性、關(guān)聯(lián)性、拓展性以及要求的抽象-具體跨度大小。
(7)問(wèn)題解決過(guò)程必須的策略及程序的復(fù)雜程度和熟悉程度,認(rèn)知操作水平、邏輯操作數(shù)量,等等。
情境越復(fù)雜;試(習(xí))題涉及的知識(shí)點(diǎn)(或知識(shí)組塊)越多,知識(shí)的學(xué)習(xí)(應(yīng)用)水平要求越高;任務(wù)復(fù)雜性越大、中間任務(wù)(階段任務(wù))越多;條件的隱蔽性和結(jié)論的開(kāi)放性越大,障礙與干擾越多,問(wèn)題的結(jié)構(gòu)越復(fù)雜;解的指向性越弱,可采取的策略(圖式)和程序越復(fù)雜,都會(huì)使試(習(xí))題的難度越大。
不過(guò),上述推測(cè)不一定可靠,需要經(jīng)過(guò)實(shí)踐檢驗(yàn)和修正,只能作為研究過(guò)程中的一個(gè)假設(shè)。例如,一般推測(cè)知識(shí)內(nèi)容模塊個(gè)數(shù)會(huì)影響試(習(xí))題難度,然而有人在實(shí)證研究中發(fā)現(xiàn):知識(shí)內(nèi)容模塊個(gè)數(shù)對(duì)試(習(xí))題難度并沒(méi)有顯著的影響,達(dá)不到統(tǒng)計(jì)檢驗(yàn)的顯著性水平[13]。
確定影響試(習(xí))題難度的主要因素不是一件容易的事,由這些因素來(lái)建立模型準(zhǔn)確地測(cè)算難度數(shù)值也不輕松。
5 需要解決的其他問(wèn)題
除了合理定位,跟課文融合;有的放矢,重視練習(xí)的“形成”本性;劃分層次,逐步“到位”;探索負(fù)荷測(cè)算方法,實(shí)現(xiàn)“減負(fù)增效”科學(xué)化之外,心懷精品意識(shí),努力把練習(xí)和習(xí)題設(shè)計(jì)成精品,絕不茍且應(yīng)付,對(duì)于搞好作業(yè)設(shè)計(jì)非常重要、非常關(guān)鍵!
還有一些問(wèn)題也需要注意和解決。例如,一些教師總感覺(jué)到課本中的習(xí)題“不給力”,其原因在于大多數(shù)仍停留在表面,運(yùn)用知識(shí)分析解決實(shí)際問(wèn)題少,導(dǎo)致學(xué)生興趣低下、缺乏主動(dòng)性、對(duì)練習(xí)持應(yīng)付態(tài)度、抄襲作業(yè)現(xiàn)象嚴(yán)重;隨手拼湊練習(xí)多、重復(fù)多,選擇題數(shù)量過(guò)度,造成“題海”高耗低效;注重學(xué)科特點(diǎn)不夠,胡亂編造的“實(shí)際”題時(shí)有出現(xiàn)……在練習(xí)教學(xué)方面,教師講評(píng)枯燥、狹隘,重結(jié)果輕過(guò)程,忽視知識(shí)構(gòu)建,忽視思維培養(yǎng),缺乏方法、策略訓(xùn)練,不注意透過(guò)現(xiàn)象看本質(zhì),難以達(dá)到舉一反三效果;忽視個(gè)別指導(dǎo),缺少有效的矯正和補(bǔ)救措施,加劇了學(xué)習(xí)分化……實(shí)踐表明,文化內(nèi)涵貧乏、人文精神缺失,會(huì)嚴(yán)重地牽制練習(xí)和練習(xí)教學(xué)水平的提高。
“減負(fù)”只是努力的一個(gè)方面,另一方面,還要從指導(dǎo)思想、教學(xué)原則以及練習(xí)的內(nèi)容、形式和教學(xué)實(shí)施、批改、講評(píng)等環(huán)節(jié)努力“增效”。限于篇幅,這里就姑且從略了。
參考文獻(xiàn):
[1]吳俊明,李艷靈.關(guān)于高中化學(xué)新教材練習(xí)設(shè)計(jì)和練習(xí)教學(xué)的思考.載于:課程改革的探索之旅——《課程·教材·教法》創(chuàng)刊30周年百篇精粹[M].北京:人民教育出版社,2011:561~565.
[2]吳俊明,王槐.試論中學(xué)化學(xué)教學(xué)目標(biāo)的分類(lèi)[J].揚(yáng)州師院學(xué)報(bào)自然科學(xué)版,1987,(4):99~104.
[3] John B. Biggs,Kevin F. Collis.Evaluating the Quality of Learning——The SOLO Taxonomy [M]. NY: Academic Press,l982.
[4]薛春蘭. SOLO分類(lèi)評(píng)價(jià)理論在高一化學(xué)教學(xué)中的應(yīng)用[J].化學(xué)教學(xué),2012,(12):28~30.
[5] Jobn Sweller. Cognitive Load During Problem Solving: Effects on Learning [J]. Cognitive science, 1988,(12):257~285.
[6]趙俊峰.解密學(xué)業(yè)負(fù)擔(dān) 學(xué)習(xí)過(guò)程中的認(rèn)知負(fù)荷研究[M].北京:科學(xué)出版社,2011.
[7]崔凱,孫林巖,馮泰文,邢星.腦力負(fù)荷度量方法的新進(jìn)展述評(píng)[J].工業(yè)工程,2008,11(5):1~5.
[8][13]杜明榮.高中物理試題難度的影響因素研究[D].重慶:西南大學(xué)碩士學(xué)位論文,2008.
[9]邵志芳,余嵐.試題難度的事前認(rèn)知任務(wù)分析[J].心理科學(xué),2008,31(3):696~698.
[10]李二霞,邵志芳.試題難度多項(xiàng)指標(biāo)的認(rèn)知任務(wù)分析[J].心理科學(xué),2009,32(6):1342~1344.
關(guān)鍵詞:統(tǒng)計(jì)測(cè)度;統(tǒng)計(jì)學(xué);大數(shù)據(jù);數(shù)據(jù)科學(xué);
作者簡(jiǎn)介:李金昌,男,50歲,浙江義烏人。浙江財(cái)經(jīng)大學(xué)校長(zhǎng),統(tǒng)計(jì)學(xué)教授,博士生導(dǎo)師。研究方向?yàn)榻?jīng)濟(jì)統(tǒng)計(jì)學(xué),統(tǒng)計(jì)理論與方法,抽樣技術(shù),政府統(tǒng)計(jì)等。
最近兩年,統(tǒng)計(jì)學(xué)界對(duì)大數(shù)據(jù)問(wèn)題所進(jìn)行的理論探討逐漸增多,視角也各有千秋,引起了一些共鳴。圍繞大數(shù)據(jù)問(wèn)題,由統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)等學(xué)科共同支撐的數(shù)據(jù)科學(xué)開(kāi)始形成。但大數(shù)據(jù)畢竟是一個(gè)新課題,因此遠(yuǎn)未達(dá)到對(duì)其有一個(gè)系統(tǒng)完整的認(rèn)識(shí),仍然需要從不同的方面加以研究,其中有一個(gè)重要但又容易被忽視的問(wèn)題,即統(tǒng)計(jì)測(cè)度問(wèn)題,值得去探討。
一、什么是統(tǒng)計(jì)測(cè)度
漢語(yǔ)上,測(cè)度是指猜測(cè)、揣度、估計(jì)。數(shù)學(xué)上,測(cè)度是一個(gè)函數(shù),它對(duì)一個(gè)給定集合的某些子集指定一個(gè)數(shù),這個(gè)數(shù)可以比作大小、體積、概率等等。通俗地說(shuō),測(cè)度把每個(gè)集合映射到非負(fù)實(shí)數(shù)來(lái)規(guī)定這個(gè)集合的大?。嚎占臏y(cè)度是0;集合變大時(shí)測(cè)度至少不會(huì)減小(因?yàn)橐由献兇蟮牟糠值臏y(cè)度,而它是非負(fù)的)。
除了數(shù)學(xué)角度的測(cè)度論,查閱國(guó)內(nèi)文獻(xiàn)資料,帶有測(cè)度這個(gè)詞匯的文獻(xiàn)不少,但專(zhuān)門(mén)針對(duì)統(tǒng)計(jì)測(cè)度(或測(cè)度)內(nèi)涵的討論幾乎沒(méi)有。一些對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析測(cè)度的文獻(xiàn),例如新型工業(yè)化進(jìn)程測(cè)度、貨幣流動(dòng)性測(cè)度、全面小康社會(huì)發(fā)展進(jìn)程測(cè)度、收入分配公平性測(cè)度、技術(shù)效率測(cè)度、人力資本測(cè)度、金融風(fēng)險(xiǎn)測(cè)度、產(chǎn)業(yè)關(guān)聯(lián)測(cè)度等等,所做的測(cè)度都是再測(cè)度,均不對(duì)測(cè)度本身進(jìn)行討論。查閱國(guó)外文獻(xiàn)資料(關(guān)鍵詞:measurement),也同樣存在這樣的問(wèn)題,只能收集到一些比較零散的表述。LudwikFinkelstein(1975)[1]認(rèn)為,在我們對(duì)事物或現(xiàn)象進(jìn)行描述時(shí),測(cè)度可以被定義為對(duì)現(xiàn)實(shí)世界中某一現(xiàn)象的個(gè)體屬性或特征進(jìn)行量化的過(guò)程。JamesT.Townsend和F.GregoryAshby(1984)[2]認(rèn)為,如果按照極端的觀點(diǎn),那么統(tǒng)計(jì)分析中的基本測(cè)度理論的含義仍然是存在爭(zhēng)議的。LudwikFinkelstein(2003)[3]指出,測(cè)度在那些原來(lái)尚未得到卓有成效或廣泛應(yīng)用的領(lǐng)域,也已取得了明顯的進(jìn)步,社會(huì)、政治、經(jīng)濟(jì)和行為科學(xué)正在更大程度地利用定量技術(shù);測(cè)度是現(xiàn)代思維的一種實(shí)際有效的工具,是我們借以描述世界的一種方法。GiovanniBattistaRossi(2007)[4]認(rèn)為,用以表示測(cè)度結(jié)果的,是數(shù)字或者數(shù)字符號(hào)。LucaMari(2013)[5]認(rèn)為,測(cè)度的基礎(chǔ)特征是被公認(rèn)為世界上獲取并正式表達(dá)信息的基本方法,這讓它成為一種跨學(xué)科的工具。LudwikFinkelstein(2014)[6]指出,在自然科學(xué)技術(shù)中,測(cè)度的重要性不可否認(rèn),它是科學(xué)調(diào)查和發(fā)現(xiàn)必不可少的工具,它可將宇宙中的復(fù)雜現(xiàn)象用精確、簡(jiǎn)潔和普遍的數(shù)學(xué)語(yǔ)言來(lái)描述。
那么,到底什么是統(tǒng)計(jì)測(cè)度呢?目前沒(méi)有一個(gè)統(tǒng)一的定義。本文認(rèn)為,統(tǒng)計(jì)測(cè)度具有不同于測(cè)度的意義,并且大大超越數(shù)學(xué)上的界定,即它具有數(shù)學(xué)定義的一般屬性,但又不受制于函數(shù)表現(xiàn)形式,因?yàn)榻y(tǒng)計(jì)測(cè)度所要面對(duì)的是現(xiàn)實(shí)世界,實(shí)際問(wèn)題要比理論上可以定義的問(wèn)題復(fù)雜得多。按照我們的理解,統(tǒng)計(jì)測(cè)度就是用一定的符號(hào)和數(shù)字,用一定的形式和載體,對(duì)所研究的現(xiàn)象或事物的特征進(jìn)行量化反映,表現(xiàn)為可用于統(tǒng)計(jì)分析的數(shù)據(jù)的過(guò)程。它應(yīng)該具有這樣一些屬性:以實(shí)際現(xiàn)象為測(cè)度對(duì)象,測(cè)度結(jié)果具有實(shí)際意義;以量化為目的,把信息轉(zhuǎn)化為數(shù)量,提供人們?nèi)菀桌斫獾亩拷Y(jié)論;個(gè)體特征的測(cè)度符合形成總體定量結(jié)論的要求,同時(shí)能夠體現(xiàn)個(gè)體差異??梢园l(fā)現(xiàn),統(tǒng)計(jì)測(cè)度需要借用數(shù)學(xué)工具,但更重要的是對(duì)具體測(cè)度現(xiàn)象本質(zhì)特征的認(rèn)識(shí)和掌握。
統(tǒng)計(jì)測(cè)度可以從若干不同角度進(jìn)行分類(lèi)。邱東教授(2012)[7]曾在“宏觀測(cè)度的邊界悖律及其意義”一文中,從邊界的角度對(duì)宏觀測(cè)度進(jìn)行了分類(lèi):一是因事物本身可測(cè)度性而形成的邊界,即本體論意義上的測(cè)度邊界;再一是由人的認(rèn)知能力而形成的邊界,即認(rèn)識(shí)論意義上的測(cè)度邊界;第三則是由統(tǒng)計(jì)相關(guān)性偏好和投入約束而形成的邊界,即操作意義上的測(cè)度邊界。這三條測(cè)度邊界,應(yīng)該以本體論意義的測(cè)度邊界最大,認(rèn)識(shí)論意義的測(cè)度邊界次之,而操作意義的測(cè)度邊界最小。這樣的分類(lèi),對(duì)于我們正確理解統(tǒng)計(jì)測(cè)度的內(nèi)涵很有幫助。受此啟發(fā),筆者認(rèn)為統(tǒng)計(jì)測(cè)度還可以有如下分類(lèi):
1.從測(cè)度的實(shí)現(xiàn)形式看,可以分為原始測(cè)度和再測(cè)度。原始測(cè)度也可以稱(chēng)為直接測(cè)度,它通過(guò)對(duì)測(cè)度對(duì)象進(jìn)行直接測(cè)度來(lái)獲取數(shù)據(jù),例如清點(diǎn)庫(kù)存物品數(shù)量、丈量作物播種面積、觀察培育細(xì)菌數(shù)目、檢測(cè)藥物成分等獲得的數(shù)據(jù),以及各種登記、記錄的原始數(shù)據(jù)等等。再測(cè)度也稱(chēng)為間接測(cè)度,它以其他已知的測(cè)度數(shù)據(jù)為基礎(chǔ)去計(jì)算、推算或預(yù)測(cè)所需的未知數(shù)據(jù),例如根據(jù)GDP和人口數(shù)測(cè)度人均GDP、根據(jù)人口普查分年齡人口數(shù)據(jù)測(cè)度老齡化系數(shù)和社會(huì)負(fù)擔(dān)系數(shù)、根據(jù)相關(guān)指標(biāo)數(shù)據(jù)測(cè)度CPI的變化等等。復(fù)雜的再測(cè)度則需要借助相應(yīng)的統(tǒng)計(jì)模型作為工具,因?yàn)樗鼘?shí)際上是對(duì)相關(guān)變量之間的關(guān)系進(jìn)行定量反映。從兩者關(guān)系上看,原始測(cè)度是基礎(chǔ),是根本,沒(méi)有科學(xué)的原始測(cè)度就不會(huì)有可靠的再測(cè)度;再測(cè)度則是測(cè)度功能提升的必然要求,以解決原始測(cè)度不能解決的問(wèn)題。
2.從測(cè)度的計(jì)量方式看,可以分為自然測(cè)度、物理測(cè)度、化學(xué)測(cè)度、時(shí)間測(cè)度和價(jià)值測(cè)度。自然測(cè)度是利用現(xiàn)象的自然屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如人口規(guī)模、企業(yè)數(shù)量等的測(cè)度,采用自然計(jì)量單位;物理測(cè)度是利用現(xiàn)象的物理屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如公路長(zhǎng)度、作物播種面積、天然氣產(chǎn)量等的測(cè)度,采用物理計(jì)量單位;化學(xué)測(cè)度是利用現(xiàn)象的化學(xué)屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如醫(yī)學(xué)、生物學(xué)中化學(xué)合成物的成分結(jié)構(gòu)測(cè)度,采用百分?jǐn)?shù)、千分?jǐn)?shù)或特定標(biāo)識(shí)為計(jì)量單位;時(shí)間測(cè)度是利用現(xiàn)象的時(shí)間屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如勞動(dòng)用工、閑暇時(shí)間等測(cè)度,采用時(shí)間計(jì)量單位;價(jià)值測(cè)度是利用現(xiàn)象的價(jià)值屬性所進(jìn)行的一種統(tǒng)計(jì)測(cè)度,例如勞動(dòng)報(bào)酬、經(jīng)濟(jì)活動(dòng)成果等測(cè)度,采用貨幣計(jì)量單位。在這些測(cè)度計(jì)量方式中,價(jià)值測(cè)度因最具有綜合功能而應(yīng)用最為廣泛。
3.從測(cè)度的方法看,可以分為計(jì)數(shù)測(cè)度、測(cè)量測(cè)度、實(shí)驗(yàn)測(cè)度、定義測(cè)度和模型測(cè)度。計(jì)數(shù)測(cè)度是一種通過(guò)觀測(cè)計(jì)數(shù)來(lái)獲得數(shù)據(jù)的方法,最為簡(jiǎn)單,一般用于自然測(cè)度或時(shí)間測(cè)度;測(cè)量測(cè)度是一種根據(jù)物理或化學(xué)規(guī)制對(duì)現(xiàn)象進(jìn)行測(cè)量、測(cè)算來(lái)獲得數(shù)據(jù)的方法,一般用于物理測(cè)度或化學(xué)測(cè)度;實(shí)驗(yàn)測(cè)度是一種按照科學(xué)實(shí)驗(yàn)原理、通過(guò)觀察實(shí)驗(yàn)對(duì)象在既定條件下的反應(yīng)來(lái)獲得數(shù)據(jù)的方法,一般與測(cè)量測(cè)度相結(jié)合,用于獲取科學(xué)研究數(shù)據(jù);定義測(cè)度也可以稱(chēng)之為指標(biāo)測(cè)度,是一種通過(guò)探究現(xiàn)象的本質(zhì)特征和活動(dòng)規(guī)律、歸納出表現(xiàn)其數(shù)量特征的范疇、給出統(tǒng)計(jì)指標(biāo)定義(包括內(nèi)容、口徑、計(jì)算方法和表現(xiàn)形式等)來(lái)獲取數(shù)據(jù)的方法,最常用于價(jià)值測(cè)度,也用于其他形式的測(cè)度。可以說(shuō),定義測(cè)度方法應(yīng)用最為廣泛,但也最為困難。模型測(cè)度是一種根據(jù)現(xiàn)象與現(xiàn)象之間的內(nèi)在聯(lián)系關(guān)系、或者現(xiàn)象自身的發(fā)展變化規(guī)律,通過(guò)建立一定的方程模型來(lái)獲取數(shù)據(jù)的方法。前面三種統(tǒng)計(jì)測(cè)度方法基本上都屬于直接測(cè)度,定義測(cè)度既可能是直接測(cè)度、也可能是間接測(cè)度,而模型測(cè)度都屬于間接測(cè)度方法。
4.從測(cè)度的維度看,可以分為單一測(cè)度與多維測(cè)度。單一測(cè)度是指采用單一的方式方法對(duì)所研究現(xiàn)象或事物進(jìn)行單一角度的測(cè)度,獲得單一的數(shù)據(jù)。多維測(cè)度是指對(duì)所研究現(xiàn)象或事物進(jìn)行多角度的測(cè)度,測(cè)度過(guò)程中可能需要采用多種測(cè)度方法和計(jì)量方式,例如多指標(biāo)綜合評(píng)價(jià)就需要借助統(tǒng)計(jì)指標(biāo)體系對(duì)評(píng)價(jià)對(duì)象進(jìn)行多角度的測(cè)度。顯然,單一測(cè)度是多維測(cè)度的基礎(chǔ)。
二、統(tǒng)計(jì)測(cè)度是統(tǒng)計(jì)學(xué)的立足之本
首先,從統(tǒng)計(jì)學(xué)的發(fā)展歷史看,是統(tǒng)計(jì)測(cè)度使統(tǒng)計(jì)學(xué)破繭而出。為什么主流觀點(diǎn)認(rèn)為政治算術(shù)是統(tǒng)計(jì)學(xué)的起源而不是國(guó)勢(shì)學(xué)?正是因?yàn)橥づ涞谑状尾捎媒y(tǒng)計(jì)測(cè)度的方式進(jìn)行了國(guó)家實(shí)力的統(tǒng)計(jì)分析和有關(guān)推算,得出了令人信服的結(jié)論。威廉·配第在1693年出版的《政治算術(shù)》[8]中寫(xiě)道“因?yàn)楹椭皇褂帽容^級(jí)或最高級(jí)的詞匯以及單純作思維的論證相反,我卻采用了這樣的方法(作為我很久以來(lái)就想建立的政治算術(shù)的一個(gè)范例),即用數(shù)字、重量和尺度的詞匯來(lái)表達(dá)我自己想說(shuō)的問(wèn)題,只進(jìn)行能訴諸人們的感官的論證和考察在性質(zhì)上有可見(jiàn)的根據(jù)的原因”,這一觀點(diǎn)在統(tǒng)計(jì)學(xué)的發(fā)展過(guò)程中產(chǎn)生了非常重要的影響。他的這段話(huà)雖然沒(méi)有出現(xiàn)測(cè)度一詞,但卻道出了測(cè)度的本質(zhì),即讓事物變得明白、變得有根據(jù),因?yàn)椤皵?shù)字、重量和尺度”就是測(cè)度、就是根據(jù),用“數(shù)字、重量和尺度的詞匯來(lái)表達(dá)想說(shuō)的問(wèn)題”就是一種測(cè)度的思想,盡管測(cè)度的方式方法還很簡(jiǎn)單。相反,國(guó)勢(shì)學(xué)雖然提出了歸納法這一統(tǒng)計(jì)學(xué)的基本方法并首創(chuàng)了統(tǒng)計(jì)學(xué)一詞,但由于沒(méi)有采用統(tǒng)計(jì)測(cè)度的方式進(jìn)行國(guó)勢(shì)問(wèn)題的研究而難以修成正果。正如邱東教授[7]所說(shuō):“在配第之前,統(tǒng)計(jì)學(xué)的研究對(duì)象雖然是國(guó)家的態(tài)勢(shì),但它在方法論上只是定性言說(shuō)。一個(gè)國(guó)家的財(cái)富總量在本體論意義上是可以測(cè)度的。然而只是到了配第時(shí)期,人類(lèi)才想到了要測(cè)度它,并發(fā)明了如何測(cè)度的基本方法。政治算術(shù),即開(kāi)創(chuàng)期的經(jīng)濟(jì)統(tǒng)計(jì)學(xué),實(shí)現(xiàn)了從無(wú)到有的轉(zhuǎn)變,大大擴(kuò)展了宏觀測(cè)度的認(rèn)識(shí)論邊界,因而才具有了統(tǒng)計(jì)學(xué)范式創(chuàng)新的革命性意義。”同樣,格朗特的《關(guān)于死亡表的自然觀察和政治觀察》也是人口統(tǒng)計(jì)測(cè)度方面的經(jīng)典之作,無(wú)論是原始測(cè)度還是再測(cè)度,都給后人留下了寶貴的財(cái)富。之后,統(tǒng)計(jì)學(xué)就是沿著如何更加科學(xué)、準(zhǔn)確測(cè)度世界這一主線(xiàn)而發(fā)展的。筆者曾在“從政治算術(shù)到大數(shù)據(jù)分析”一文[9],對(duì)數(shù)據(jù)的變化與統(tǒng)計(jì)分析方法的發(fā)展進(jìn)行了粗淺的歸納,其主題實(shí)際上就是統(tǒng)計(jì)測(cè)度問(wèn)題。
其次,從統(tǒng)計(jì)學(xué)的研究對(duì)象上看,統(tǒng)計(jì)測(cè)度是體現(xiàn)統(tǒng)計(jì)學(xué)數(shù)量性特征的前提條件。統(tǒng)計(jì)學(xué)的研究對(duì)象是現(xiàn)象的數(shù)量方面,或者說(shuō)統(tǒng)計(jì)學(xué)是關(guān)于如何收集和分析數(shù)據(jù)的科學(xué)。統(tǒng)計(jì)數(shù)據(jù)從何而來(lái)?從統(tǒng)計(jì)測(cè)度中來(lái)。數(shù)據(jù)不同于數(shù)字,數(shù)字是統(tǒng)計(jì)測(cè)度的符號(hào),數(shù)據(jù)是統(tǒng)計(jì)測(cè)度的結(jié)果,這也正是統(tǒng)計(jì)學(xué)區(qū)別于數(shù)學(xué)之處。所以說(shuō),數(shù)據(jù)的本質(zhì)問(wèn)題就是統(tǒng)計(jì)測(cè)度問(wèn)題,故此統(tǒng)計(jì)測(cè)度是統(tǒng)計(jì)學(xué)的基本問(wèn)題。這里重點(diǎn)討論兩個(gè)問(wèn)題:一是統(tǒng)計(jì)測(cè)度與統(tǒng)計(jì)指標(biāo)的關(guān)系,二是統(tǒng)計(jì)測(cè)度面臨的新問(wèn)題。關(guān)于第一個(gè)問(wèn)題,本文認(rèn)為統(tǒng)計(jì)測(cè)度與統(tǒng)計(jì)指標(biāo)是一個(gè)事物的兩個(gè)方面,這個(gè)事物就是數(shù)據(jù)。統(tǒng)計(jì)指標(biāo)法是統(tǒng)計(jì)學(xué)的基本方法之一,盡管前面對(duì)統(tǒng)計(jì)測(cè)度從方式方法上進(jìn)行了分類(lèi),但從廣義上說(shuō)所有統(tǒng)計(jì)測(cè)度都是定義測(cè)度,都表現(xiàn)為指標(biāo)。也就是說(shuō),任何統(tǒng)計(jì)測(cè)度———不論是直接測(cè)度還是間接測(cè)度,最終目的是獲得能夠讓人明白的數(shù)據(jù),而表現(xiàn)數(shù)據(jù)的最主要形式就是統(tǒng)計(jì)指標(biāo),其他表現(xiàn)數(shù)據(jù)的形式都是派生出來(lái)的。所以,統(tǒng)計(jì)測(cè)度就是根據(jù)所設(shè)定的統(tǒng)計(jì)指標(biāo)去獲得所需的數(shù)據(jù)。關(guān)于第二個(gè)問(wèn)題,與后文所要論及的大數(shù)據(jù)有關(guān),就是定性測(cè)度問(wèn)題。在統(tǒng)計(jì)學(xué)中,數(shù)據(jù)可以分為兩類(lèi)———定性數(shù)據(jù)與定量數(shù)據(jù),其中定性數(shù)據(jù)又包括定類(lèi)數(shù)據(jù)與定序數(shù)據(jù)兩種,它們屬于非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)。相應(yīng)地,統(tǒng)計(jì)測(cè)度也可分為定性測(cè)度與定量測(cè)度。很顯然,只有定性測(cè)度與定量測(cè)度方法得到同步發(fā)展,統(tǒng)計(jì)學(xué)才能更加完善。總體上看,定量數(shù)據(jù)的統(tǒng)計(jì)測(cè)度已經(jīng)比較完善,但定性數(shù)據(jù)的統(tǒng)計(jì)測(cè)度還有很多問(wèn)題尚待解決,難點(diǎn)就在于測(cè)度的切入點(diǎn)———如何提取有效的信息、如何最終轉(zhuǎn)化為統(tǒng)計(jì)指標(biāo)。盡管關(guān)于定性數(shù)據(jù)分析的論著已經(jīng)不少,但還沒(méi)有從理論方法上建立起定性數(shù)據(jù)統(tǒng)計(jì)測(cè)度的體系,因此統(tǒng)計(jì)學(xué)在這方面的任務(wù)依然很重。
第三,從統(tǒng)計(jì)學(xué)的永恒主題看,通過(guò)科學(xué)的數(shù)據(jù)分析、得出有效的結(jié)論是其不變的追求,而數(shù)據(jù)分析過(guò)程就是綜合的統(tǒng)計(jì)測(cè)度過(guò)程。獲得數(shù)據(jù)的目的是為了發(fā)現(xiàn)隱含其中的有價(jià)值的信息,即發(fā)現(xiàn)數(shù)據(jù)背后的數(shù)據(jù),讓數(shù)據(jù)再生數(shù)據(jù),從而滿(mǎn)足人們認(rèn)識(shí)事物、掌握規(guī)律、科學(xué)決策的需要。除了總量、結(jié)構(gòu)等基本信息外,更重要的是通過(guò)數(shù)據(jù)分析來(lái)呈現(xiàn)現(xiàn)象的變化規(guī)律與相互關(guān)系。不難發(fā)現(xiàn),這種數(shù)據(jù)分析的過(guò)程,就是不斷進(jìn)行各種統(tǒng)計(jì)測(cè)度的過(guò)程,所以最終的統(tǒng)計(jì)分析結(jié)果實(shí)際上就是各環(huán)節(jié)、各方面的各種類(lèi)型的統(tǒng)計(jì)測(cè)度的疊加結(jié)果,或者說(shuō)是統(tǒng)計(jì)測(cè)度不斷放大的過(guò)程。大量針對(duì)社會(huì)經(jīng)濟(jì)現(xiàn)象進(jìn)行分析研究的文獻(xiàn)(不論是否冠以“測(cè)度”兩字),只要有數(shù)據(jù)分析,都是如此??梢哉f(shuō),統(tǒng)計(jì)測(cè)度貫穿于統(tǒng)計(jì)數(shù)據(jù)分析的全過(guò)程。但是,為什么很多統(tǒng)計(jì)數(shù)據(jù)分析并沒(méi)有得出有效的結(jié)論呢?本文認(rèn)為原因就出在統(tǒng)計(jì)測(cè)度上,尤其是沒(méi)有首先解決好原始統(tǒng)計(jì)測(cè)度問(wèn)題。應(yīng)該說(shuō),圍繞數(shù)據(jù)分析已經(jīng)建立起一整套比較完整的統(tǒng)計(jì)方法體系,很多方法也都身經(jīng)百戰(zhàn)、行之有效,但一旦原始統(tǒng)計(jì)測(cè)度有問(wèn)題、數(shù)據(jù)不準(zhǔn)確或不真實(shí),那么任何方法都只是擺設(shè)。仔細(xì)研讀很多所謂的實(shí)證分析文獻(xiàn),其重點(diǎn)均在于構(gòu)建什么樣的模型或運(yùn)用什么樣的方法,雖然有的文獻(xiàn)也必須要討論選擇什么樣的變量(指標(biāo))這個(gè)問(wèn)題,但并不是系統(tǒng)地從測(cè)度的角度進(jìn)行闡述,因此所用的模型越來(lái)越復(fù)雜,但所得的結(jié)論卻離實(shí)際情況越來(lái)越遠(yuǎn)。學(xué)界總是有這樣一種觀念:變量越多、符號(hào)越新奇、模型越復(fù)雜的文章才越有水平,似乎這樣分析所得的結(jié)論才越可靠。殊不知,不以科學(xué)可靠的原始統(tǒng)計(jì)測(cè)度為基礎(chǔ),任何數(shù)據(jù)分析都會(huì)成為無(wú)源之水、無(wú)本之木,所得的結(jié)論也只是更精確的錯(cuò)誤而已。本文認(rèn)為,任何脫離科學(xué)統(tǒng)計(jì)測(cè)度的統(tǒng)計(jì)分析都是毫無(wú)意義的,充其量是一種數(shù)字游戲而已。應(yīng)該樹(shù)立這樣一種觀念:科學(xué)的統(tǒng)計(jì)數(shù)據(jù)分析首先取決于科學(xué)的統(tǒng)計(jì)測(cè)度,而不是首先取決于什么樣的分析模型,雖然模型也很重要。這也再一次證明,統(tǒng)計(jì)測(cè)度問(wèn)題是統(tǒng)計(jì)學(xué)的根本問(wèn)題。其實(shí),歸根結(jié)底看,在統(tǒng)計(jì)數(shù)據(jù)分析過(guò)程中,每一步分析都以前一步的測(cè)度為原始測(cè)度,每一步所用的方法都是統(tǒng)計(jì)測(cè)度方法,因此所有的統(tǒng)計(jì)分析方法都是統(tǒng)計(jì)測(cè)度方法。甚至可以說(shuō),統(tǒng)計(jì)學(xué)方法體系就是統(tǒng)計(jì)測(cè)度方法體系。
當(dāng)然,在實(shí)際的統(tǒng)計(jì)分析中,統(tǒng)計(jì)測(cè)度往往遇到一些困難,即有些指標(biāo)數(shù)據(jù)由于各種原因無(wú)法獲得,這就不得不采用替代這種途徑。例如,綠色GDP核算的概念已經(jīng)提出很多年,但為什么還沒(méi)有哪個(gè)國(guó)家真正公布綠色GDP數(shù)據(jù),原因就是自然資源價(jià)值、生態(tài)環(huán)境價(jià)值等的統(tǒng)計(jì)測(cè)度目前還面臨著很大的困難,其背后存在著一系列有待進(jìn)一步研究和解決的理論與實(shí)踐問(wèn)題,因此不少學(xué)者進(jìn)行了替代測(cè)度的探討。這一方面說(shuō)明統(tǒng)計(jì)測(cè)度的重要性,另一方面說(shuō)明統(tǒng)計(jì)測(cè)度替代的無(wú)奈性。但是,替代測(cè)度必須遵守相應(yīng)的規(guī)則與邏輯,要經(jīng)得起推敲。有的文獻(xiàn)明明知道有關(guān)變量無(wú)法測(cè)度、有關(guān)數(shù)據(jù)無(wú)法獲得,卻隨意地、不符合邏輯地進(jìn)行所謂的替代,結(jié)果是最后的結(jié)論不知替代成什么樣了,很難理解它的意義。關(guān)于替代測(cè)度的有效性問(wèn)題,邱東教授[7]已有精辟的論述,在此不再展開(kāi)討論。
三、統(tǒng)計(jì)測(cè)度是數(shù)據(jù)科學(xué)的基礎(chǔ)
籠統(tǒng)地講,數(shù)據(jù)科學(xué)就是以大數(shù)據(jù)為研究對(duì)象的科學(xué),需要多學(xué)科交叉融合、共同支撐。由于大數(shù)據(jù)是快速增長(zhǎng)的復(fù)雜數(shù)據(jù),因此大數(shù)據(jù)分析僅有統(tǒng)計(jì)思維與統(tǒng)計(jì)分析方法是不夠的,還需要強(qiáng)大的數(shù)據(jù)處理能力與計(jì)算能力。只有把統(tǒng)計(jì)思維、統(tǒng)計(jì)方法與計(jì)算技術(shù)結(jié)合起來(lái),才有可能真正挖掘出大數(shù)據(jù)中的有價(jià)值信息。本文認(rèn)為統(tǒng)計(jì)思維、統(tǒng)計(jì)方法與計(jì)算技術(shù)相結(jié)合的基礎(chǔ)就是科學(xué)的統(tǒng)計(jì)測(cè)度。
首先,大數(shù)據(jù)技術(shù)不能自行解決其計(jì)算和分析應(yīng)從何處著手的問(wèn)題?,F(xiàn)代信息技術(shù)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,使人類(lèi)進(jìn)入大數(shù)據(jù)時(shí)代,也有人說(shuō)進(jìn)入到數(shù)聯(lián)網(wǎng)時(shí)代,這意味著我們一方面被各種越來(lái)越多、越來(lái)越復(fù)雜的數(shù)據(jù)所包圍,另一方面又被數(shù)據(jù)中巨大的信息價(jià)值所吸引,想從中挖掘出可供決策之用的信息。如何挖掘大數(shù)據(jù)?人們已經(jīng)進(jìn)行了艱苦的探索,發(fā)展了很多專(zhuān)門(mén)的方法技術(shù),并已嘗到了不少甜頭,但遠(yuǎn)未達(dá)到充分利用大數(shù)據(jù)中有效信息的目的,因?yàn)橐延械拇髷?shù)據(jù)分析研究主要集中于計(jì)算機(jī)科學(xué)與技術(shù)、軟件工程、計(jì)算數(shù)學(xué)等領(lǐng)域,重點(diǎn)是計(jì)算能力與算法研究,而很少?gòu)慕y(tǒng)計(jì)學(xué)的角度進(jìn)行有針對(duì)的探討,還沒(méi)有真正進(jìn)入數(shù)據(jù)分析的深層。這里面實(shí)際上忽略了最基礎(chǔ)的統(tǒng)計(jì)測(cè)度問(wèn)題。如果說(shuō),計(jì)算技術(shù)的發(fā)展能夠解決數(shù)據(jù)儲(chǔ)存與計(jì)算的能力問(wèn)題,算法模型的改進(jìn)能夠解決大數(shù)據(jù)分析的綜合能力問(wèn)題,那么它們?nèi)匀徊荒芙鉀Q對(duì)誰(shuí)進(jìn)行計(jì)算與分析的問(wèn)題,也即從何處著手的問(wèn)題。無(wú)論是傳統(tǒng)的結(jié)構(gòu)型數(shù)據(jù),還是現(xiàn)在的包含大量非結(jié)構(gòu)型數(shù)據(jù)的大數(shù)據(jù),要對(duì)它們進(jìn)行分析都必須找到正確的切入口,即分析的基本元素是什么,或者說(shuō)需要測(cè)度什么。當(dāng)然,還有如何測(cè)度的問(wèn)題。然后,才能進(jìn)行分組、綜合和構(gòu)建模型,否則大數(shù)據(jù)分析不會(huì)達(dá)到人們的預(yù)期。
其次,大數(shù)據(jù)之所以催生數(shù)據(jù)科學(xué),就是為了通過(guò)多學(xué)科交叉融合來(lái)共同解決大數(shù)據(jù)分析中存在的問(wèn)題,其中包括統(tǒng)計(jì)測(cè)度問(wèn)題,這一點(diǎn)對(duì)于非結(jié)構(gòu)化數(shù)據(jù)尤為突出。實(shí)際上,大數(shù)據(jù)的本質(zhì)就是非結(jié)構(gòu)化數(shù)據(jù),一是體量大、比重高(超過(guò)95%),二是變化快、形式多,三是內(nèi)容雜、不確定。通過(guò)各種社交網(wǎng)絡(luò)、自媒體、富媒體,以及人機(jī)對(duì)話(huà)和機(jī)器感應(yīng)記錄等產(chǎn)生的各種非結(jié)構(gòu)化數(shù)據(jù),例如各種文字、各種表情符號(hào)、各種聲音、各種圖像,到底表示什么?綜合在一起能體現(xiàn)什么規(guī)律?如何綜合各種信息?存在著大量有待研究的問(wèn)題。其實(shí),文字的長(zhǎng)短、用詞、表達(dá)形式(敘述式、議論式、散文式、詩(shī)歌式,等)甚至字體大小與顏色,表情類(lèi)型與偏好,聲音高低、頻率與情緒,圖像顏色等等,都是有特定意義的,即在特定環(huán)境條件下的反應(yīng)。所以,一句話(huà)或一段聲音的意義并非文字本身的意思,一個(gè)表情符號(hào)的意義并非符號(hào)表征的意思,一個(gè)圖像的意義并非圖像內(nèi)容與色彩本身的意思,因?yàn)楸澈笥刑嗟奈粗?。人們?yōu)g覽檢索各種信息的習(xí)慣、收看與回復(fù)郵件等信息的習(xí)慣、參與信息網(wǎng)絡(luò)的習(xí)慣、購(gòu)物習(xí)慣與支付習(xí)慣等等,也是如此。更何況,同樣的網(wǎng)絡(luò)詞匯在不同的時(shí)間代表著不同的語(yǔ)義。這背后隱藏著的是人們的行為與社會(huì)關(guān)系,既具有個(gè)性又具有共性,極其復(fù)雜。所以對(duì)這樣的數(shù)據(jù)進(jìn)行分析,首先絕非是計(jì)算問(wèn)題,也不是用什么模型問(wèn)題,而首先是從何處著手、如何選取關(guān)鍵詞、如何選定關(guān)聯(lián)詞、可以用什么樣的指標(biāo)來(lái)綜合、可以用什么樣的表式來(lái)表現(xiàn)等問(wèn)題,一句話(huà)就是統(tǒng)計(jì)測(cè)度問(wèn)題。非結(jié)構(gòu)化數(shù)據(jù)的統(tǒng)計(jì)測(cè)度將主要是定義測(cè)度,這些問(wèn)題不解決,分析模型也是難以構(gòu)建的,或者難以得出令人信服的結(jié)論。
例如,關(guān)于《紅樓夢(mèng)》前80回與后40回是否同一作者的爭(zhēng)論,韋博成[10]進(jìn)行了綜合性的比較研究并提出了自己的觀點(diǎn),他指出已有美國(guó)威斯康辛大學(xué)華裔學(xué)者陳炳藻教授(1980)[11]、我國(guó)華東師范大學(xué)陳大康教授(1987年)[12]和復(fù)旦大學(xué)李賢平教授(1987年)[13]等學(xué)者從統(tǒng)計(jì)學(xué)的角度進(jìn)行過(guò)專(zhuān)門(mén)的研究,但卻得出了不同的結(jié)論:陳炳藻教授認(rèn)為前80回與后40回均是曹雪芹所著;陳大康教授認(rèn)為前80回與后40回為不同人所著;李賢平教授認(rèn)為前80回是曹雪芹根據(jù)《石頭記》增刪而成,后40回是曹雪芹親友搜集整理原稿加工補(bǔ)寫(xiě)而成。此外,還有其他一些學(xué)者進(jìn)行過(guò)類(lèi)似的研究,也有一些不同的結(jié)論。為什么都通過(guò)提取關(guān)聯(lián)詞和統(tǒng)計(jì)的方法卻得出不同的結(jié)論?原因就在于用以分析的關(guān)聯(lián)詞不同,即統(tǒng)計(jì)測(cè)度的切入點(diǎn)不同,當(dāng)然也有統(tǒng)計(jì)方法上的差異,但前者是根本。至少存在幾個(gè)統(tǒng)計(jì)測(cè)度上的問(wèn)題:提取單一維度的關(guān)聯(lián)詞還是多維度的關(guān)聯(lián)詞?提取什么類(lèi)型的關(guān)聯(lián)詞(例如:關(guān)聯(lián)詞是名詞、形容詞還是動(dòng)詞;是花卉、樹(shù)木、飲食、醫(yī)藥還是詩(shī)詞)?這些關(guān)聯(lián)詞可以綜合為什么樣的指標(biāo)?等等。由此可見(jiàn),原始統(tǒng)計(jì)測(cè)度代表著數(shù)據(jù)分析的方向。
相比《紅樓夢(mèng)》,大數(shù)據(jù)分析要復(fù)雜得多、困難得多。所以,數(shù)據(jù)科學(xué)除了需要數(shù)學(xué)、統(tǒng)計(jì)學(xué)、計(jì)算機(jī)科學(xué)與技術(shù)、人工智能等學(xué)科的交叉融合外,還需要與行為科學(xué)、語(yǔ)言學(xué)、社會(huì)學(xué)、經(jīng)濟(jì)學(xué)等學(xué)科相結(jié)合,以便能很好地解決作為數(shù)據(jù)分析之前提的統(tǒng)計(jì)測(cè)度問(wèn)題。
第三,數(shù)據(jù)科學(xué)將進(jìn)一步拓展統(tǒng)計(jì)測(cè)度的邊界,并提出更高的要求。伴隨著人類(lèi)認(rèn)識(shí)世界的范圍的不斷拓展,統(tǒng)計(jì)測(cè)度的范圍也不斷擴(kuò)大,從自然現(xiàn)象統(tǒng)計(jì)測(cè)度到人口現(xiàn)象、經(jīng)濟(jì)現(xiàn)象統(tǒng)計(jì)測(cè)度,再到社會(huì)現(xiàn)象、環(huán)境現(xiàn)象、政治現(xiàn)象等統(tǒng)計(jì)測(cè)度,幾乎已經(jīng)滲透到了所有可以想象到的領(lǐng)域。相應(yīng)地,統(tǒng)計(jì)數(shù)據(jù)分析也從少量數(shù)據(jù)的分析進(jìn)入到了大數(shù)據(jù)分析。大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性(王元卓等,2013)[14],意味著統(tǒng)計(jì)測(cè)度的內(nèi)容大大增加,原來(lái)一些不能測(cè)度的數(shù)據(jù)被納入到了統(tǒng)計(jì)測(cè)度的范圍,按照邱東教授的說(shuō)法就是統(tǒng)計(jì)測(cè)度的邊界大大擴(kuò)展了。統(tǒng)計(jì)測(cè)度邊界的擴(kuò)大,必須以統(tǒng)計(jì)測(cè)度能力的提升為前提,即要求統(tǒng)計(jì)學(xué)借助現(xiàn)代信息技術(shù)進(jìn)一步提升處理和分析數(shù)據(jù)的能力———對(duì)大數(shù)據(jù)“化繁為簡(jiǎn)”、“變厚為薄”的能力,這就必須以科學(xué)準(zhǔn)確的大數(shù)據(jù)統(tǒng)計(jì)測(cè)度為前提,既改變統(tǒng)計(jì)思維,又創(chuàng)新統(tǒng)計(jì)分析方法,其中就包括統(tǒng)計(jì)測(cè)度思維、統(tǒng)計(jì)測(cè)度方法與統(tǒng)計(jì)測(cè)度標(biāo)準(zhǔn)。面對(duì)大量繁雜的數(shù)據(jù),如果沒(méi)有更好的統(tǒng)計(jì)測(cè)度思路與方法,包括個(gè)體標(biāo)志定義方法、最小數(shù)據(jù)細(xì)胞分組與聚類(lèi)方法、關(guān)聯(lián)詞含義的時(shí)間影響計(jì)量方法、定性測(cè)度指標(biāo)篩選方法、再測(cè)度路徑與方法、大數(shù)據(jù)統(tǒng)計(jì)測(cè)度評(píng)價(jià)標(biāo)準(zhǔn)等,那么統(tǒng)計(jì)學(xué)在數(shù)據(jù)科學(xué)發(fā)展過(guò)程中就難以發(fā)揮應(yīng)有的作用,數(shù)據(jù)科學(xué)也將裹足不前。這就是統(tǒng)計(jì)學(xué)邁向數(shù)據(jù)科學(xué)的重要挑戰(zhàn)之一。
綜上所述,統(tǒng)計(jì)測(cè)度的基礎(chǔ)性問(wèn)題從統(tǒng)計(jì)學(xué)延伸到了數(shù)據(jù)科學(xué),是兩者的共同基礎(chǔ),并且對(duì)于數(shù)據(jù)科學(xué)而言顯得更為重要。大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性導(dǎo)致了統(tǒng)計(jì)測(cè)度的難度猛增,亟需建立面向大數(shù)據(jù)分析的統(tǒng)計(jì)測(cè)度理論與方法。要通過(guò)研究大數(shù)據(jù)的復(fù)雜性、不確定性和涌現(xiàn)性特征的基本因素,以及這些因素之間的內(nèi)在聯(lián)系、外在指標(biāo)和測(cè)度方法,進(jìn)而研究基于先進(jìn)計(jì)算技術(shù)的大數(shù)據(jù)度量模型,構(gòu)建尋找面向計(jì)算的數(shù)據(jù)內(nèi)核或者數(shù)據(jù)邊界的基本方法??傊⒂行б仔械臄?shù)據(jù)表示方法,即科學(xué)的統(tǒng)計(jì)測(cè)度方法,是數(shù)據(jù)科學(xué)必須解決的基礎(chǔ)問(wèn)題之一。
四、創(chuàng)新與完善大數(shù)據(jù)統(tǒng)計(jì)測(cè)度方法
如前所述,統(tǒng)計(jì)學(xué)研究對(duì)象已經(jīng)從結(jié)構(gòu)化數(shù)據(jù)延伸到了包括非結(jié)構(gòu)化數(shù)據(jù)在內(nèi)的一切數(shù)據(jù),統(tǒng)計(jì)測(cè)度邊界得到了大大的擴(kuò)展。按照邱東教授[7]曾經(jīng)引用過(guò)的海德格爾的話(huà):“界限并不表示某一事物的發(fā)展到此為止,而是像希臘人所認(rèn)知的那樣,界限是某種事物開(kāi)始展現(xiàn)的地方”,預(yù)示著統(tǒng)計(jì)學(xué)在數(shù)據(jù)科學(xué)發(fā)展階段的新起點(diǎn)已經(jīng)展現(xiàn)在我們面前。新的統(tǒng)計(jì)測(cè)度邊界催生統(tǒng)計(jì)測(cè)度方法的創(chuàng)新,統(tǒng)計(jì)測(cè)度方法的創(chuàng)新促進(jìn)統(tǒng)計(jì)測(cè)度邊界的拓展,兩者相輔相成,共同推動(dòng)統(tǒng)計(jì)學(xué)與數(shù)據(jù)科學(xué)的發(fā)展。為此,我們要系統(tǒng)梳理統(tǒng)計(jì)測(cè)度方法的發(fā)展歷程,面對(duì)大數(shù)據(jù)提出的新挑戰(zhàn),大膽探索統(tǒng)計(jì)測(cè)度的新思路、新理論和新方法,為數(shù)據(jù)科學(xué)奠定堅(jiān)實(shí)的統(tǒng)計(jì)學(xué)基礎(chǔ)。為此提出如下幾點(diǎn)建議:
首先,要緊密結(jié)合現(xiàn)象的本質(zhì)去探求更科學(xué)的統(tǒng)計(jì)測(cè)度方法。本質(zhì)決定一切,既然統(tǒng)計(jì)測(cè)度的目的是獲得客觀反映現(xiàn)象本質(zhì)的數(shù)據(jù),那么深入到現(xiàn)象本質(zhì)、認(rèn)識(shí)和掌握現(xiàn)象的本質(zhì),是科學(xué)統(tǒng)計(jì)測(cè)度的關(guān)鍵,也是探求新的統(tǒng)計(jì)方法的出發(fā)點(diǎn)。換句話(huà)說(shuō),科學(xué)的統(tǒng)計(jì)測(cè)度方法能夠體現(xiàn)出數(shù)據(jù)的真正意義。例如,要探求社交網(wǎng)絡(luò)數(shù)據(jù)的統(tǒng)計(jì)分析和測(cè)度方法,就必須了解社交網(wǎng)絡(luò)的產(chǎn)生背景、構(gòu)成要素、表現(xiàn)形式與基本特征,既要研究它的共性問(wèn)題,又要研究它的個(gè)性問(wèn)題與差異性,同時(shí)還要研究它的變化趨勢(shì)。只有這樣,才能掌握社交網(wǎng)絡(luò)數(shù)據(jù)的構(gòu)成要件或元素,才能建立起科學(xué)的、能有效體現(xiàn)社交網(wǎng)絡(luò)數(shù)據(jù)意義的統(tǒng)計(jì)測(cè)度方法。再如,要分析研究電子商務(wù)數(shù)據(jù),也必須先弄清楚什么是電子商務(wù),尤其是弄清楚它與傳統(tǒng)的商業(yè)模式有什么不同(包括物流、資金流與信息流)、有哪些新生事物(包括時(shí)空特征、法律監(jiān)管)等等,否則統(tǒng)計(jì)測(cè)度無(wú)從下手或者抓不住要害。同時(shí),作為一個(gè)新的研究領(lǐng)域,數(shù)據(jù)科學(xué)的理論基礎(chǔ)將與計(jì)算機(jī)科學(xué)、統(tǒng)計(jì)學(xué)、人工智能、數(shù)學(xué)、社會(huì)科學(xué)等有關(guān),離不開(kāi)對(duì)相關(guān)學(xué)科領(lǐng)域知識(shí)與研究方法的借鑒,因此對(duì)相關(guān)領(lǐng)域的知識(shí)與研究方法的學(xué)習(xí)十分重要。否則,就會(huì)嚴(yán)重扭曲統(tǒng)計(jì)測(cè)度方法,胡亂設(shè)置測(cè)度標(biāo)志,這需要引起高度關(guān)注。
其次,要緊密結(jié)合大數(shù)據(jù)的特點(diǎn)去創(chuàng)新統(tǒng)計(jì)測(cè)度方法。大數(shù)據(jù)的特點(diǎn)是復(fù)雜性、不確定性和涌現(xiàn)性并存,構(gòu)成了多維的數(shù)據(jù)空間,里面蘊(yùn)藏著豐富的信息資源,這是傳統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)不可比擬的。那么該從何處進(jìn)入這樣的數(shù)據(jù)空間?怎么進(jìn)去?又怎么出來(lái)?這歸根結(jié)底還是統(tǒng)計(jì)測(cè)度方法問(wèn)題。因此,在開(kāi)展大數(shù)據(jù)分析之前,首先要研究大數(shù)據(jù)的基礎(chǔ)性問(wèn)題,包括大數(shù)據(jù)的內(nèi)在機(jī)理(包括大數(shù)據(jù)的演化與傳播機(jī)制、生命周期),數(shù)據(jù)科學(xué)與社會(huì)學(xué)、經(jīng)濟(jì)學(xué)、行為科學(xué)等之間的互動(dòng)機(jī)制,以及大數(shù)據(jù)的結(jié)構(gòu)與效能的規(guī)律性等等,為創(chuàng)新統(tǒng)計(jì)測(cè)度方法提供導(dǎo)向。本文認(rèn)為,再?gòu)?fù)雜的數(shù)據(jù)也有共性,再不確定的數(shù)據(jù)也有規(guī)律,再涌現(xiàn)的數(shù)據(jù)也有軌跡。網(wǎng)絡(luò)大數(shù)據(jù)背后的網(wǎng)絡(luò)平均路徑長(zhǎng)度、度分布、聚集系數(shù)、核數(shù)、介數(shù)等具有共性的特征與參數(shù),是開(kāi)展復(fù)雜網(wǎng)絡(luò)數(shù)據(jù)分析的基礎(chǔ)(李國(guó)杰、程學(xué)旗,2012)[15];大數(shù)據(jù)在時(shí)空維度上的分布形式、內(nèi)在結(jié)構(gòu)、動(dòng)態(tài)變化和相關(guān)聯(lián)的規(guī)律,是找到大數(shù)據(jù)分析切入口、進(jìn)而簡(jiǎn)化大數(shù)據(jù)表征的前提;大數(shù)據(jù)的涌現(xiàn)性軌跡(包括模式涌現(xiàn)性、行為涌現(xiàn)性和智慧涌現(xiàn)性),是研究更多的社會(huì)網(wǎng)絡(luò)模型和理解網(wǎng)絡(luò)瓦解失效原因,理解人們網(wǎng)絡(luò)行為涌現(xiàn)特征(例如人們發(fā)郵件數(shù)量的時(shí)間分布特征),以及探求大量自發(fā)個(gè)體語(yǔ)義融合連接形成有特定意義的通用語(yǔ)義之過(guò)程的路徑(靳小龍等,2013)[16]。也就是說(shuō),這些共性、規(guī)律和軌跡就是統(tǒng)計(jì)測(cè)度的主要依據(jù),也是重點(diǎn)內(nèi)容。發(fā)展和創(chuàng)新能夠準(zhǔn)確發(fā)現(xiàn)大數(shù)據(jù)的共性、規(guī)律和軌跡的定量方法,其實(shí)就是發(fā)展和創(chuàng)新大數(shù)據(jù)統(tǒng)計(jì)測(cè)度方法。
第三,要緊密結(jié)合現(xiàn)代信息技術(shù)以完善統(tǒng)計(jì)測(cè)度方法。復(fù)雜、多變和不斷涌現(xiàn)的大數(shù)據(jù),不僅需要借助現(xiàn)代信息技術(shù)(包括硬件與軟件)來(lái)解決極其復(fù)雜的分析計(jì)算問(wèn)題,也需要利用現(xiàn)代信息技術(shù)來(lái)解決其繁雜多樣的統(tǒng)計(jì)測(cè)度問(wèn)題。對(duì)于大數(shù)據(jù),不論是原始統(tǒng)計(jì)測(cè)度還是再測(cè)度,其復(fù)雜性或難度都不是傳統(tǒng)的結(jié)構(gòu)化數(shù)據(jù)所能相提并論的,哪怕是基本的關(guān)聯(lián)詞計(jì)數(shù)、分類(lèi)與匯總,其工作量之大也超乎想象,不借用現(xiàn)代信息技術(shù)幾乎是不可能完成的。而事實(shí)上,有些統(tǒng)計(jì)測(cè)度的內(nèi)容與方法本身也是以數(shù)據(jù)處理能力的提升為前提的??梢哉f(shuō),脫離現(xiàn)代信息技術(shù),人們難以承受大數(shù)據(jù)的統(tǒng)計(jì)測(cè)度與分析任務(wù);要把統(tǒng)計(jì)測(cè)度思想變?yōu)榭蓪?shí)現(xiàn)的統(tǒng)計(jì)測(cè)度方法,必須借助現(xiàn)代信息技術(shù)。為此,要充分利用各種信息技術(shù)和手段,把統(tǒng)計(jì)測(cè)度與數(shù)據(jù)清洗相結(jié)合、與數(shù)據(jù)分析模型相結(jié)合、與計(jì)算方法相結(jié)合,努力建立融自動(dòng)搜索統(tǒng)計(jì)測(cè)度、動(dòng)態(tài)演化統(tǒng)計(jì)測(cè)度和自主優(yōu)選統(tǒng)計(jì)測(cè)度為一體的大數(shù)據(jù)統(tǒng)計(jì)測(cè)度方法體系。