畢業(yè)論文:高考語(yǔ)文測(cè)試?yán)砟钊笔轿?/h1>

時(shí)間:2022-04-20 04:52:00

導(dǎo)語(yǔ):畢業(yè)論文:高考語(yǔ)文測(cè)試?yán)砟钊笔轿鲆晃膩?lái)源于網(wǎng)友上傳,不代表本站觀點(diǎn),若需要原創(chuàng)文章可咨詢客服老師,歡迎參考。

畢業(yè)論文:高考語(yǔ)文測(cè)試?yán)砟钊笔轿? /></p> <p><a href=畢業(yè)論文

畢業(yè)論文

高考語(yǔ)文測(cè)試理念缺失探析

一.從一些統(tǒng)計(jì)和調(diào)查談起

(1)教師評(píng)定(前20名左右)與高考成績(jī)相關(guān)性統(tǒng)計(jì)(擬作)

(筆者以為教師的評(píng)定應(yīng)該是一個(gè)較好的效標(biāo),美國(guó)的很多大型關(guān)聯(lián)效度調(diào)查都以老師對(duì)學(xué)生一年以上的觀察作為效標(biāo))。語(yǔ)文應(yīng)該最差。

(2)學(xué)生成績(jī)波動(dòng)性調(diào)查。(擬作)

語(yǔ)文的波動(dòng)性肯定最大。

(3)對(duì)中學(xué)語(yǔ)文教師的調(diào)查采訪(擬作)

對(duì)語(yǔ)文高考命題科學(xué)性的認(rèn)識(shí)采訪一些參加過(guò)高考閱卷的老師(評(píng)卷誤差)

并調(diào)查中學(xué)語(yǔ)文教師的處境

(4)對(duì)大一新生的調(diào)查(擬作)

(主要就高考各科命題的效度進(jìn)行調(diào)查。先給學(xué)生一個(gè)通俗易懂的“效度”定義---能測(cè)量出你真實(shí)水平的程度。然后讓他們回答諸如此類的問(wèn)題:請(qǐng)你按照效度水平給高考各科排序;按成績(jī)波動(dòng)性排序.)

(5)高考成績(jī)與大學(xué)成績(jī)相關(guān)調(diào)查:

語(yǔ)文“高考成績(jī)與大學(xué)成績(jī)相關(guān)極低”,說(shuō)明語(yǔ)文“高考的預(yù)測(cè)性很差,作為一種選拔性測(cè)驗(yàn)現(xiàn)行高考是不成功的”(轉(zhuǎn)引自北師大心理系高考研究組《改革高考,更加準(zhǔn)確有效地選拔人才》第83和89頁(yè))(再查出處)

(6)歷年的高考抽樣統(tǒng)計(jì)結(jié)果

已有93、97、98(在自抄的信紙上)、2000(在小筆記本上)、2002年的,無(wú)論信度效度(好像沒(méi)有公布)標(biāo)準(zhǔn)差(反映考生成績(jī)離散程度,即試卷的區(qū)分功能,在150分的試卷中標(biāo)準(zhǔn)差20分以上說(shuō)明離散程度較好。),還是成績(jī)的正態(tài)分布曲線,語(yǔ)文都基本上是最不理想的,而且和其他科(尤其英語(yǔ)和理科各科)相去甚遠(yuǎn)(語(yǔ)言測(cè)試略低一些可以理解,低得太多,就需反思)。

官方對(duì)于低信度的解釋往往是:語(yǔ)文屬于異質(zhì)性測(cè)試(國(guó)內(nèi)的確也作過(guò)一些這方面的調(diào)查).我們不禁要問(wèn):為何國(guó)外的語(yǔ)文測(cè)試信度比我們高得多呢?為何高考英語(yǔ)試卷的信度往往是各科中最高的呢?再者,我們用來(lái)作異質(zhì)性調(diào)查研究的試題其命題和批閱質(zhì)量(尤其作文批改的誤差控制)有足夠的擔(dān)保嗎?

而且,我國(guó)每年的高考抽樣統(tǒng)計(jì)公布都缺少最重要的一項(xiàng)統(tǒng)計(jì)指標(biāo):效度.(效度測(cè)起來(lái)的確更復(fù)雜更麻煩,但并非“沒(méi)有數(shù)學(xué)方法,只能靠定性分析”.分析請(qǐng)參照后面的“實(shí)踐性缺失”一章.)

“信度比效度更容易證明,所以附在測(cè)驗(yàn)一起的技術(shù)說(shuō)明通常只報(bào)告信度數(shù)據(jù)。測(cè)驗(yàn)發(fā)表者打算通過(guò)顯示信度而暗示其效度。這種做法不好,它只是做了一半的工作?!保ǔ鲎孕」P記本-書名作者待查)

另外,許多知名專家學(xué)者不止一次對(duì)語(yǔ)文高考測(cè)試提出了嚴(yán)厲的批評(píng):

"我讀了,非常吃力,首先是弄懂題目要求就費(fèi)了極大的勁,有的至今也沒(méi)有弄得太清楚……"(錢理群評(píng)1998年高考試題)

"語(yǔ)文綜合能力強(qiáng)的學(xué)生在高考中反而得不到高分"(待查)

錢夢(mèng)龍也指出:現(xiàn)在的語(yǔ)文考試測(cè)不出學(xué)生的真實(shí)水平.

顧德希:“從十幾年來(lái)我所教的高三學(xué)生來(lái)看,每年總有不少于四分之一的學(xué)生,語(yǔ)文高考成績(jī)與平時(shí)成績(jī)存在較大反差.盡管這比十幾年前已是不小的進(jìn)步(以前誤差更大),但問(wèn)題仍然是嚴(yán)重的。”(<<中國(guó)考試>>2002年第三期<<學(xué)科能力等級(jí)研究與素質(zhì)教育>>)

“現(xiàn)在優(yōu)生得分不高差生得分不低的現(xiàn)象越來(lái)越突出…學(xué)生的積極性受到了嚴(yán)重打擊?!保ɡ钊骸堉协h(huán)《關(guān)鍵是怎樣操作》《中學(xué)語(yǔ)文教學(xué)》2003,6)…

每一個(gè)理智的語(yǔ)文工作者應(yīng)當(dāng)承認(rèn),我們的語(yǔ)文高考存在著很大的問(wèn)題,其信度和效度離語(yǔ)言測(cè)試科學(xué)化的要求尚有很大差距,迫切需要改革.

筆者于高中語(yǔ)文教學(xué)一線工作九年有余,深感執(zhí)教的困惑和艱難。我對(duì)于高考語(yǔ)文測(cè)試最大的不解在于:學(xué)生高考成績(jī)與其平時(shí)成績(jī)和能力(老師對(duì)自己起碼一半左右的學(xué)生還是十分了解的)嚴(yán)重不符-其程度遠(yuǎn)遠(yuǎn)超過(guò)其他各科,波動(dòng)幅度之大,范圍之廣怵目驚心。

反思是枚苦澀的果子,也是語(yǔ)文界同仁不得不品嘗的果子。大發(fā)牢騷沒(méi)有用,怨天尤人沒(méi)有用,擺出一幅任人宰割的架式只會(huì)使問(wèn)題更加嚴(yán)重。我們應(yīng)當(dāng)首先虛心聽(tīng)取別人的批評(píng),然后靜下心來(lái),仔細(xì)調(diào)查研究,實(shí)事求是地分析,進(jìn)而拿出改進(jìn)措施。

令人遺憾的是,五六年過(guò)去了,批斗余音猶在,認(rèn)真的反思,尤其是業(yè)內(nèi)人士的腳踏實(shí)地的分析研究寥若晨星,高考測(cè)試問(wèn)題依舊。

筆者不敢稱內(nèi)行,僅憑自己的一些體驗(yàn)和調(diào)查,試圖對(duì)高考測(cè)試信度和效度不高的原因作些反思。筆者以為,之所以出現(xiàn)這么嚴(yán)重的問(wèn)題,肯定與命題指導(dǎo)思想上的缺失,制度建設(shè)不完善,很多工作環(huán)節(jié)欠科學(xué)有關(guān)。

傳統(tǒng)偏見(jiàn)、習(xí)慣勢(shì)力、既定的規(guī)范、固有的理論、盲從的心理,把我們禁錮在狹小的天地里。本文主要就命題指導(dǎo)思想方面作些探討.

二.測(cè)試指導(dǎo)思想方面存在的問(wèn)題

以我看來(lái),主要有以下幾個(gè)方面:

(一)過(guò)于相信經(jīng)驗(yàn),測(cè)試?yán)碚撉啡?/p>

我國(guó)的高考帶有濃厚的“行政”色彩,命題人員普遍缺少足夠的系統(tǒng)的科學(xué)測(cè)試知識(shí),或是不大買測(cè)試?yán)碚摰膸?測(cè)試?yán)碚搶<彝鶎?duì)語(yǔ)言學(xué)科的特點(diǎn)又不是非常熟悉.他們依靠的主要是經(jīng)驗(yàn).

譬如,試題命制完成后的預(yù)測(cè)分析,各種標(biāo)準(zhǔn)化測(cè)試量表的研制(量化研究不可或缺的工具,其嚴(yán)謹(jǐn)?shù)木幹瞥绦蚺c信效度檢驗(yàn),使測(cè)量的品質(zhì)得以確保--邱皓政《社會(huì)與行為科學(xué)的量化研究與統(tǒng)計(jì)分析》五南圖書出版公司2000,8第一版)以及考試完成后成績(jī)的統(tǒng)計(jì)分析和解釋(“西方發(fā)達(dá)國(guó)家十分重視考試成績(jī)的研究開(kāi)發(fā)利用。如,美國(guó)每年對(duì)大學(xué)入學(xué)考試成績(jī)的統(tǒng)計(jì)分析就達(dá)幾十種甚至上百種信息資料,然后將其分送給考生畢業(yè)中學(xué)和政府有關(guān)部門,作為中學(xué)教育教學(xué)和政府制定相關(guān)政策的參考?!保R文卿劉文超著《中國(guó)高考走向》山東人民出版社2002,3,一版,121~122頁(yè))),這些環(huán)節(jié)都十分欠缺.這就使得我們很難有效地控制試題的各項(xiàng)指標(biāo),不能及時(shí)的吸取往年的教訓(xùn)并迅速的作出調(diào)整.我們的高考改革步伐緩慢,試題多少年難以改變模樣,與此有直接關(guān)系.

“我國(guó)高考工作者由于缺少教育測(cè)量學(xué)的理論與技巧,主要憑經(jīng)驗(yàn)進(jìn)行工作,在試卷編制上一般只有初步的編制計(jì)劃及按這初步計(jì)劃編寫試題的簡(jiǎn)單步驟,試卷初步編成后,不經(jīng)預(yù)測(cè)和數(shù)量化分析,只由編制人員根據(jù)經(jīng)驗(yàn)作一些主觀的討論、審核,即交付使用.致使試卷編制者本身對(duì)他的各項(xiàng)指標(biāo)心中無(wú)數(shù),造成歷年來(lái)高考難度波動(dòng)很大,甚至還有出錯(cuò)題目或出題不當(dāng)?shù)那闆r發(fā)生.”(北京師范大學(xué)心理系高考研究組《改革高考更加準(zhǔn)確有效的選拔人才》)(出處再查)

實(shí)行了十幾年的高考標(biāo)準(zhǔn)化考試竟然仍采用老掉牙的原始分相加的方法來(lái)計(jì)分,說(shuō)明我們的測(cè)試?yán)碚撌嵌嗝吹那啡?“很多實(shí)行了標(biāo)準(zhǔn)分制度的六七個(gè)省份已經(jīng)取消(山東省于2001年取消)或正在取消,據(jù)說(shuō)原因僅僅在于某些領(lǐng)導(dǎo)欠缺基本的測(cè)試知識(shí).”(馬文卿劉文超著《中國(guó)高考走向》山東人民出版社2002,3,一版,32頁(yè))“癥結(jié)主要有兩個(gè),一是統(tǒng)計(jì)測(cè)量理論沒(méi)有為高層決策者所熟悉;二是大眾對(duì)其陌生排斥。”(馬文卿劉文超著《中國(guó)高考走向》山東人民出版社2002,3,一版,118頁(yè))

國(guó)際上的語(yǔ)言測(cè)試早已發(fā)展到第三個(gè)階段--“交際測(cè)試”(communicativetesting)階段,而我國(guó)的語(yǔ)文高考測(cè)試仍停留在第二階段--心理計(jì)量-結(jié)構(gòu)主義測(cè)試(psychometric-structuralisttesting)的初期,仍然在圍繞著“要不要選擇題”“語(yǔ)文測(cè)試要不要精確量化”等本已無(wú)需再爭(zhēng)辯的問(wèn)題糾纏不休.

“交際測(cè)試”以完形填空、短文聽(tīng)寫等題型為典型特征,強(qiáng)調(diào)語(yǔ)境中運(yùn)用,側(cè)重考查學(xué)生運(yùn)用語(yǔ)言的靈活性,對(duì)能力認(rèn)識(shí)更為全面深刻。而我國(guó)的語(yǔ)言測(cè)試在這點(diǎn)上幾乎為空白.

“高揚(yáng)科學(xué)的大旗,…走出行政性評(píng)價(jià)的窠臼.…評(píng)價(jià)方式上力求創(chuàng)新,走科學(xué)評(píng)價(jià)的道路,既要做到倫理的善,更要做到邏輯的真和形式的美.”(孔祥沛《淺論傳統(tǒng)文化對(duì)我國(guó)教育評(píng)價(jià)制度的影響》《教育科學(xué)研究》年月待查)

(二)重書面表達(dá)輕聽(tīng)說(shuō)閱讀

中國(guó)古代相對(duì)封閉的社會(huì)實(shí)際以及重人文輕科學(xué)的傳統(tǒng),此外還有“以文取士”科舉制度的影響,使得“寫文章”得到了高得不能再高的社會(huì)地位,所謂“天子重英豪,文章授爾曹”,而“聽(tīng)說(shuō)”“閱讀”卻被大大的冷落了。此種偏差時(shí)至今日依然相當(dāng)嚴(yán)重,并在語(yǔ)文高考上體現(xiàn)出來(lái)。

高考試卷中一篇作文幾乎占據(jù)半壁江山(60/150),而意義非常的聽(tīng)說(shuō)測(cè)試始終不能提上議事日程。(我們的高考第二語(yǔ)言聽(tīng)說(shuō)測(cè)試早已起步,而且也積累起了不少經(jīng)驗(yàn))

這種偏頗的測(cè)試方式,遠(yuǎn)遠(yuǎn)不能滿足現(xiàn)代信息社會(huì)的需求.在現(xiàn)今社會(huì),“聽(tīng)”“說(shuō)”“讀”“寫”四種語(yǔ)言活動(dòng)中,“寫”的地位應(yīng)該是最低的,前三者的重要性遠(yuǎn)遠(yuǎn)超過(guò)后者.“據(jù)專家研究,聽(tīng)說(shuō)在一生的語(yǔ)言活動(dòng)中占到75%,而讀寫只占25%.”(吳昌順<<語(yǔ)文教學(xué)需要科學(xué)化>>,出自<<中學(xué)語(yǔ)文教學(xué)>>2000年第九期)

而傳統(tǒng)觀念里,“讀”也是從屬于“寫”的:“中國(guó)以前所謂‘讀寫結(jié)合’只不過(guò)是把讀物作為寫作的樣本,作為一種仿效的對(duì)象.所謂的‘讀’,只是揣摩作者是如何‘寫’的.閱讀教學(xué),也只是把教材作為一種寫作的模式加以分析,以便對(duì)寫作有所裨益.這種觀念,實(shí)質(zhì)上是以寫作為中心,閱讀不過(guò)是寫作的附庸.”(章熊<<中國(guó)當(dāng)作與閱讀測(cè)試>>四川教育出版社2000,10第二版47頁(yè))

國(guó)外多數(shù)國(guó)家的語(yǔ)言測(cè)試則不然,其比例很注意和社會(huì)的需求相吻合.聽(tīng)說(shuō)測(cè)試受到高度重視,而且很多國(guó)家也舉辦的非常成功.此外,閱讀測(cè)試在書面語(yǔ)言測(cè)試中的分量也遠(yuǎn)遠(yuǎn)超過(guò)寫作測(cè)試.以美國(guó)的SAT(相當(dāng)于我國(guó)的高考)為例,其閱讀領(lǐng)會(huì)能力的考查占總分的51%,閱讀短文為五篇(以前為六篇),字?jǐn)?shù)約為2500~3000字;而我國(guó)高考閱讀領(lǐng)會(huì)短文大致為兩三篇,字?jǐn)?shù)約為1000~1500字,分?jǐn)?shù)比例也低得多。我國(guó)高考各科中試題命制科學(xué)性最高(有統(tǒng)計(jì)數(shù)據(jù)為證)社會(huì)信譽(yù)最好的英語(yǔ)科試題閱讀的短文數(shù)量達(dá)七篇左右,占總分一半還多。

而且,現(xiàn)今寫作能力測(cè)試模式迫切需要改革的最重要的理由是:它是導(dǎo)致語(yǔ)文高考信效度不高的罪魁禍?zhǔn)住T蚝芎?jiǎn)單:我們的作文評(píng)閱雖經(jīng)不斷改進(jìn),但主觀誤差始終得不到有效控制。

“九十年代初,有關(guān)部門曾經(jīng)連續(xù)做過(guò)幾年研究,結(jié)果表明高考語(yǔ)文試卷中的主觀性試題(主要是作文)誤差達(dá)到總分的40%,盡管我們采取了多種方法(制定作文評(píng)分量表,計(jì)算機(jī)監(jiān)控評(píng)分等)…但誤差仍然較大。”(張偉明《高考語(yǔ)文科考試內(nèi)容與形式的改革》《中國(guó)考試》1999,1期)

作文的評(píng)分誤差巨大是個(gè)不爭(zhēng)的事實(shí),很多的調(diào)查早已給出了駭人的評(píng)分差距.但筆者認(rèn)為,在大規(guī)??荚囍?誤差還要大得多,因?yàn)檫@里面有個(gè)“動(dòng)機(jī)效應(yīng)是值得注意的。黃煜烽等人的研究中曾經(jīng)讓一位教師在不到一年的時(shí)間里兩次批閱同一篇作文。第二次批改時(shí),作文前加上‘組織教師批改這篇作文的目的旨在測(cè)試語(yǔ)文教師對(duì)學(xué)生作文水平的鑒定水平,以此作為衡量教師批改作文能力的指標(biāo)’這樣一段話作為動(dòng)機(jī)暗示。結(jié)果,第一次評(píng)85分,第二次評(píng)72分,相差13分;第一次的評(píng)語(yǔ)是‘文章結(jié)構(gòu)完整,用詞恰當(dāng),注意了旁征博引,語(yǔ)言老練、簡(jiǎn)明’第二次的評(píng)語(yǔ)是‘本文結(jié)構(gòu)欠嚴(yán)謹(jǐn)和完整,觀點(diǎn)和材料不盡統(tǒng)一,語(yǔ)言上也有毛病’,從肯定變成了否定,截然相反?!?章熊<<中國(guó)當(dāng)作與閱讀測(cè)試>>四川教育出版社2000,10第二版69頁(yè))

高考閱卷很大程度上還帶有大鍋飯性質(zhì),監(jiān)督不嚴(yán),建立老師評(píng)卷檔案等工作幾乎為空白,閱卷老師的認(rèn)真度是有限的;而應(yīng)付調(diào)查時(shí),作為調(diào)查對(duì)象,因?yàn)樘貏e在意調(diào)查結(jié)果對(duì)自己造成的影響,必然慎之又慎,再加上調(diào)查時(shí)的勞動(dòng)強(qiáng)度也無(wú)法和高考這類大規(guī)??荚囅嗵岵⒄?。

高考作文評(píng)閱存在的主要問(wèn)題是:

(1)投入少時(shí)間短,導(dǎo)致勞動(dòng)強(qiáng)度大

時(shí)間過(guò)長(zhǎng)會(huì)增大誤差,但太短更會(huì)草菅人命.由于時(shí)間太短作文批改打保險(xiǎn)分的現(xiàn)象非常嚴(yán)重

“《南方周末》曾對(duì)高考閱卷作過(guò)報(bào)道:近30萬(wàn)份作文,規(guī)定180位老師在10天內(nèi)改完,除去每天高溫休息一小時(shí),其余七小時(shí)不喝水不上廁所不與人說(shuō)話,在每篇作文上也只能停留70秒?!保ɡ钊?、張中環(huán)《關(guān)鍵是怎樣操作》《中學(xué)語(yǔ)文教學(xué)》2003,6)

“集中全日閱卷,根據(jù)各試驗(yàn)省份的經(jīng)驗(yàn),以日平均90份左右為宜”(章熊<<中國(guó)當(dāng)作與閱讀測(cè)試>>四川教育出版社2000,10第二版265頁(yè)),實(shí)際的批閱數(shù)量若干倍于此.

(2)趨中主義

.評(píng)分既不高也不低,高度集中在中部偏上的狹小區(qū)間內(nèi),既能夠保證閱卷速度,又不容易讓復(fù)查人員抓住把柄.

“據(jù)江西戴海崎、曹紹游就1987年高考試卷隨機(jī)抽取的2700人樣本統(tǒng)計(jì),二類卷和三類卷占總數(shù)的86%,一類卷和五類卷合起來(lái)僅占6.6%,四類卷占7.4%,成峰值極高的偏態(tài)分布…產(chǎn)生的原因大約有兩個(gè):一是‘打保險(xiǎn)分’,二是連續(xù)作戰(zhàn)統(tǒng)一疲勞,反應(yīng)的靈敏度降低,區(qū)分能力減弱.、據(jù)江西省1990年高考閱卷7月13日、14日和十六日三天的抽樣統(tǒng)計(jì)(樣本數(shù)一千左右),平均分從22.69分(滿分40分)上升為24.33分,標(biāo)準(zhǔn)差則從7.67降為5.97,說(shuō)明分?jǐn)?shù)的離散程度越來(lái)越小,趨中傾向越來(lái)越嚴(yán)重?!?章熊<<中國(guó)當(dāng)作與閱讀測(cè)試>>四川教育出版社2000,10第二版67~68頁(yè))

(3)思維定勢(shì):

由于閱卷強(qiáng)度過(guò)大,所以文章的書寫、篇幅、謀篇(開(kāi)頭結(jié)尾的安排受到格外重視)等外在因素很大程度上決定了考生的得分。主要由這些因素構(gòu)成的第一印象一旦確立,就很難再改變.

(4)責(zé)任心差

很大原因歸咎于制度不全監(jiān)督不力.這兒既有閱卷老師的責(zé)任心問(wèn)題,也有復(fù)查領(lǐng)導(dǎo)的責(zé)任心問(wèn)題.

“有的閱卷的研究生經(jīng)常遲到早退,‘一位女博士戴著隨身聽(tīng),一邊聽(tīng)音樂(lè)一邊改卷’;‘一高校的副研究員不知為什么年年來(lái)閱卷,它改作文判分一半有誤,有一次查他改的三篇作文,總誤差竟達(dá)三十多分’;一位老師30份作文錯(cuò)判十分以上的有三份(那一年是40分的大作文)…有一本30份的作文幾乎全是42和43兩個(gè)分?jǐn)?shù)。有個(gè)組長(zhǎng)表?yè)P(yáng)一個(gè)青年教師,說(shuō)他一天改了二十多本作文…復(fù)查能挽救幾個(gè)人呢…每次閱卷結(jié)束時(shí),心里都很沉重?!保ɡ钊?、張中環(huán)《關(guān)鍵是怎樣操作》《中學(xué)語(yǔ)文教學(xué)》2003,6)

目前的高考寫作測(cè)試模式必須改革,而且,此改革是切實(shí)可行的。國(guó)外的成功經(jīng)驗(yàn)早已證明了這一點(diǎn).

改革的方向當(dāng)然首先是增加聽(tīng)說(shuō)測(cè)試;其次,是改變大作文占分過(guò)多的局面,途徑又有二:(1)大作文題轉(zhuǎn)化為小型作文題(有兩個(gè)小作文的語(yǔ)文試卷信度效度明顯高于一個(gè)大作文題的試卷)和各種靈活的主觀題(2)使用客觀題來(lái)考查寫作能力.

圍繞是否繼續(xù)使用選擇題的爭(zhēng)論,尤其是對(duì)使用選擇題來(lái)考查寫作能力的爭(zhēng)議.美國(guó)最大的考試研究機(jī)構(gòu)教育測(cè)驗(yàn)服務(wù)中心(ETS),從1954年起進(jìn)行了長(zhǎng)達(dá)三年的試驗(yàn)研究??荚嚨挠行詷?biāo)準(zhǔn)是語(yǔ)文教師對(duì)學(xué)生作文水平一年或一年以上的觀察結(jié)論。結(jié)論是:SAT(學(xué)習(xí)能力傾向測(cè)驗(yàn),主要是客觀題)的效度最高,與語(yǔ)文教師基于長(zhǎng)期觀察對(duì)學(xué)生寫作能力作出的主觀評(píng)價(jià)最一致;其次是由客觀性試題組成的ECT(英文寫作水平考試,全為選擇題),最差的是由作文題目組成的GCT(普通寫作測(cè)驗(yàn),兩個(gè)小時(shí)的作文考試)。(D.Owen:Noneoftheabove,Rowman&LittlefieldPublishers,INC,Lanham,1999,27~29頁(yè))“正是基于這樣的研究,才使其后的40年中客觀性選擇題成為美國(guó)語(yǔ)言能力測(cè)試的主要題型.”(謝小慶《談?wù)Z言能力的考查》《中學(xué)語(yǔ)文教學(xué)》2003,6)

有人質(zhì)疑:現(xiàn)在的國(guó)際趨勢(shì)是增大主觀題的數(shù)量,特別是增大作文的分量,咱們?cè)趺茨苣鎳?guó)際潮流而動(dòng)呢?這兒有一個(gè)前提,國(guó)外主觀題的評(píng)分比我們更有保障。尤其是國(guó)外作文量化水平較高,評(píng)分的客觀化程度較高.(電子記分員的啟用明顯提高了打分的客觀性)

“美國(guó)長(zhǎng)期使用選擇題,出現(xiàn)了‘高分低能’的現(xiàn)象,轉(zhuǎn)而求助于主觀性試題.我們始終主要采用主觀性試題,結(jié)果導(dǎo)致了更加嚴(yán)重的‘高分低能’,這不能不引起我們的深思.”(于新鳳《考試學(xué)引論》遼寧人民出版社)

由此看來(lái),題型的選擇未必是測(cè)試中最重要的因素.相對(duì)而言,試題的命制水平、施測(cè)的標(biāo)準(zhǔn)化水平和客觀化水平應(yīng)該是更重要的因素.

還有人說(shuō)漢語(yǔ)和英語(yǔ)等語(yǔ)言不同.的確,我們承認(rèn)漢語(yǔ)的彈性張力模糊性是更強(qiáng),但我們同時(shí)認(rèn)為:同為語(yǔ)言,漢語(yǔ)和其他語(yǔ)言沒(méi)有質(zhì)的差別,夸大這一點(diǎn)就缺少了最起碼的科學(xué)態(tài)度;而且,作為量化集中體現(xiàn)的測(cè)試,更不宜在模糊性上大做文章,那樣只能使得試題變得更加玄乎其玄.

有人擔(dān)心,降低大作文的分值勢(shì)必影響中學(xué)作文的教學(xué).當(dāng)然,這種擔(dān)心不無(wú)道理,但審視現(xiàn)在的中學(xué)作文教學(xué),我們不僅充滿了疑惑:(1)我們的應(yīng)試作文都訓(xùn)練了些什么呢?很多中學(xué)將主要的精力都放在了‘新八股’的制造上了,形式主義泛濫,作文教學(xué)日益走向死胡同?!啊齻€(gè)一’工程”(即寫一手好字,擬一個(gè)好題目,起一個(gè)貌似不俗的開(kāi)頭)長(zhǎng)期以來(lái)風(fēng)靡全國(guó)很多地區(qū),一點(diǎn)也不令人感到奇怪.(2)看看我們學(xué)生的作文就知道我們投入了那么多精力大搞特搞的作文訓(xùn)練究竟有多大成效.以筆者看來(lái),靈活多樣的寫作能力測(cè)試方式(通過(guò)聽(tīng)說(shuō)測(cè)試、各種類型的主客觀題)對(duì)中學(xué)教學(xué)的引導(dǎo)作用或許更好.

總之,提高作文測(cè)試信度效度的途徑主要有二:(1)加快主觀題(尤其作文)評(píng)分的客觀化進(jìn)程(制定科學(xué)的評(píng)分量表;嘗試無(wú)紙化評(píng)閱-廣西在這方面已有較為成功的嘗試;啟用電子閱卷員等等)(2)主觀題型的客觀化

而且,就我國(guó)的實(shí)際情況而言,后者可能是近期內(nèi)比較可行的辦法.

(三)實(shí)踐性缺失

前面曾提到語(yǔ)言測(cè)試?yán)碚摰那啡?實(shí)際上,相對(duì)測(cè)試?yán)碚摱?我們的高考更欠缺的是實(shí)踐性.

我國(guó)傳統(tǒng)重主觀體驗(yàn),輕客觀實(shí)證,加上“官本位”和“大一統(tǒng)”思想的影響,我們的測(cè)試向來(lái)不大善于從實(shí)際出發(fā),思維行事從來(lái)就是一種“自上而下”式的,上層的官員專家多憑自己的學(xué)識(shí)和對(duì)下面有限的了解,想當(dāng)然的組織測(cè)試。

“‘德性’文化傳統(tǒng)使得評(píng)價(jià)更多的是一種人文主義的評(píng)價(jià)模式,過(guò)分強(qiáng)調(diào)了評(píng)價(jià)的民主性和倫理性,而忽視了評(píng)價(jià)以客觀事實(shí)為基礎(chǔ)的原則.”(孔祥沛《淺論傳統(tǒng)文化對(duì)我國(guó)教育評(píng)價(jià)制度的影響》《教育科學(xué)研究》年月待查)

我國(guó)政府及團(tuán)體組織的大規(guī)模實(shí)際調(diào)查與國(guó)外相比少得可憐.我們的借口總是很多,但我看主要原因是惰于實(shí)踐,譬如,關(guān)聯(lián)效度的調(diào)查研究,我們的借口總是效標(biāo)難以確定.實(shí)際的原因是懶于嘗試,怕麻煩,不敢直面現(xiàn)實(shí)改革.美國(guó)的很多大型關(guān)聯(lián)效度調(diào)查都以老師對(duì)學(xué)生一年以上的觀察作為效標(biāo).筆者也覺(jué)得,將教師綜合評(píng)估的一部分學(xué)生的平時(shí)成績(jī)(比如說(shuō)每班選二三十名,最少基于一年以上的觀察)作為效標(biāo),來(lái)衡量高考成績(jī)的有效性,可能是個(gè)不錯(cuò)的參照標(biāo)準(zhǔn)??上](méi)有人深入做調(diào)查,偶爾有人嘗試,要么淺嘗輒止,輕率結(jié)論;要么阻力重重,不得不放棄.(在我國(guó),民間性質(zhì)的調(diào)查由于種種原因更是難上加難)

1.試題內(nèi)容和測(cè)試方法忽略學(xué)生實(shí)際

(1)對(duì)課本的徹底拋棄

在我國(guó)目前這種‘一考定乾坤’的人才選拔制度下,徹底不考課本,只會(huì)導(dǎo)致拋棄課本;無(wú)本可依、見(jiàn)效緩慢(再加上成績(jī)偶然性大),只會(huì)導(dǎo)致放棄語(yǔ)文學(xué)習(xí).

多年來(lái)高考命題在內(nèi)容選擇上有一個(gè)指導(dǎo)原則:所選材料應(yīng)主要來(lái)自課外,以測(cè)試考生運(yùn)用已知知識(shí)來(lái)解決未知問(wèn)題的能力。應(yīng)當(dāng)說(shuō)這一原則是對(duì)的,但筆者認(rèn)為近些年的高考命題在這一點(diǎn)上做得有些絕對(duì),一定程度上忽略了中國(guó)的國(guó)情。“主要”不是“不出”,近十幾年的題目幾乎杜絕了課本上的內(nèi)容。這導(dǎo)致了高中生不愿意上語(yǔ)文課,不重視語(yǔ)文課文學(xué)習(xí)的現(xiàn)狀。

筆者想提醒命題者的是:語(yǔ)文考試不應(yīng)完全模仿數(shù)學(xué)類考試--定理公式是課內(nèi)的,題目完全是課外的。(這樣,只要學(xué)生學(xué)好了課本,就能考出好成績(jī).語(yǔ)文呢?課本對(duì)于考試的作用微乎其微,學(xué)與不學(xué)差不多.)語(yǔ)言的學(xué)習(xí)畢竟有它自己的一些特點(diǎn),譬如說(shuō),名言佳篇的背誦默寫就完全是考查學(xué)生的記憶情況,這往往是語(yǔ)言學(xué)習(xí)和語(yǔ)言測(cè)試所必不可少的。

語(yǔ)文學(xué)科平時(shí)的教與學(xué)缺乏一個(gè)有效的抓手和平臺(tái),由此導(dǎo)致語(yǔ)文課本使用的困惑和混亂.(有些學(xué)校甚至用一年的時(shí)間就能完成三年的任務(wù))

語(yǔ)文是應(yīng)該更開(kāi)放更靈活,但目前的國(guó)情是:大學(xué)尚不能普及,大學(xué)入學(xué)選拔只依靠?jī)H有的一次考試,全國(guó)各地發(fā)展?fàn)顩r極不平衡,高考競(jìng)爭(zhēng)依然激烈;此外,語(yǔ)文高考測(cè)試科學(xué)化水平較低,學(xué)生成績(jī)波動(dòng)太大太經(jīng)常.鑒于此,掌握好試題的開(kāi)放度和靈活度就顯得尤其重要.否則,學(xué)生必然會(huì)將語(yǔ)文學(xué)習(xí)時(shí)間轉(zhuǎn)向其他學(xué)科.

并非只有考課外才能有效地區(qū)分學(xué)生。課內(nèi)知識(shí)一定比例講究方式的考查,不僅能夠在一定程度上解決中學(xué)語(yǔ)文無(wú)本可依的尷尬,而且照樣能夠測(cè)出學(xué)生的真實(shí)水平.舉個(gè)例子,考成語(yǔ),完全可以從中學(xué)語(yǔ)文課本內(nèi)部出些題目,選學(xué)生學(xué)過(guò)的常用詞語(yǔ)的常用義項(xiàng),改變語(yǔ)境,進(jìn)行考查.

(2)遠(yuǎn)離學(xué)生實(shí)際

高考語(yǔ)文測(cè)試,既不能離開(kāi)語(yǔ)文學(xué)科的特點(diǎn),也不能脫離高中學(xué)生的實(shí)際--政治、科技、文化類已有的學(xué)科基礎(chǔ)知識(shí)以及他們生理心理的發(fā)育狀況.

我們的高考命題卻常常忽略這一點(diǎn),存在著較為嚴(yán)重的“專業(yè)化”“成人化”傾向

很多現(xiàn)代文閱讀題內(nèi)容具有明顯的專業(yè)化傾向--古文化探源、詩(shī)的哲理、基本粒子中的中微子、智力結(jié)構(gòu)模式、應(yīng)激激素和迷走神經(jīng)等等,離學(xué)生的生活太遠(yuǎn).

科技短文考查力度的確應(yīng)該加大,這符合現(xiàn)代社會(huì)的需求.但有一點(diǎn)必須要搞清楚:我們必須在平時(shí)的教材里和學(xué)生的生活中,補(bǔ)充大量的科技時(shí)文,有了這個(gè)鋪墊,學(xué)生在考試時(shí)就不會(huì)感覺(jué)到突兀.然而,我們中學(xué)的教材編排和教學(xué)活動(dòng),在這一點(diǎn)上做得很不夠.“國(guó)內(nèi)教材忽視現(xiàn)代科技時(shí)文不能不說(shuō)是個(gè)遺憾.而國(guó)外更加注重從現(xiàn)代社會(huì)的實(shí)際需要出發(fā)選文,以培養(yǎng)學(xué)生的現(xiàn)代科技意識(shí),增長(zhǎng)學(xué)生的現(xiàn)代科技知識(shí),增強(qiáng)學(xué)生對(duì)現(xiàn)代社會(huì)的適應(yīng)能力…他們的選材內(nèi)容十分廣泛,幾乎涵蓋了生活的各個(gè)方面-報(bào)刊新聞,規(guī)章條文,科技說(shuō)明文,推理小說(shuō),科幻小說(shuō)都進(jìn)入教材.例如法國(guó)有一套語(yǔ)文閱讀教材,每?jī)?cè)十幾個(gè)單元都有個(gè)中心主題,其中包括‘現(xiàn)代生活’‘科學(xué)技術(shù)’‘時(shí)代問(wèn)題’等等.而國(guó)內(nèi)僅有的說(shuō)明文大多是些實(shí)體說(shuō)明文,涉及現(xiàn)代科技的是少之又少.”(張承明《中外語(yǔ)文教育比較研究》云南教育出版社2000,10第一版)

此外,很多閱讀文段的文字表達(dá)和中學(xué)生的實(shí)際生活距離遙遠(yuǎn).“以往往往選擇二三十年代的文章,這些文章在詞語(yǔ)的用法上與現(xiàn)代人有些差別,文章中的一些背景知識(shí)學(xué)生不了解,這就增加了學(xué)生答題的難度”(張偉明《再談?wù)Z文到底考什么》《語(yǔ)文教學(xué)通訊》1999,2)

“前幾年高考中出現(xiàn)的成語(yǔ)誤用和病句,材料大多來(lái)自報(bào)刊雜志,應(yīng)該說(shuō)他們是專業(yè)編輯人員認(rèn)可或通過(guò)的東西,雖有不當(dāng)之處,但很隱蔽,一般人看不出來(lái),而且也不十分影響表達(dá),有的則完全是大學(xué)中文系語(yǔ)法教材里面的例子,拿這些東西來(lái)考涉世未深的高中生是勉為其難的…決不是要所有的學(xué)生都成為語(yǔ)言學(xué)家或語(yǔ)法學(xué)家.”(《語(yǔ)文教學(xué)通訊》2001,22期,盛華明《讓語(yǔ)文考試更貼近實(shí)際》)

作文命題“政治化”“成人化”等傾向,無(wú)意中加重了學(xué)生“說(shuō)假話”“空洞無(wú)物”的弊病,從而又在一定程度上降低了作文的區(qū)分度(都覺(jué)無(wú)話可說(shuō),都撒謊瞎編).試看下面一些題目:“毀樹(shù)容易種樹(shù)難”“致光明日?qǐng)?bào)編輯部的信”(關(guān)于環(huán)境污染問(wèn)題)“樹(shù)木·森林·氣候”“議論‘花與刺’”(關(guān)于辯證的看待事物)“‘近墨者黑’或‘近墨者未必黑’”“先天下之憂而憂,后天下之樂(lè)而樂(lè)”“看‘截肢’漫畫寫感受”(關(guān)于責(zé)任心問(wèn)題)“讀材料‘紅雨衣踢碎玻璃罐’寫感受”(關(guān)于社會(huì)公德心)“堅(jiān)韌-我追求的品格”“誠(chéng)信”“心靈的選擇”…

我們的高考作文承載了多少“政治教育”“道德說(shuō)教”的重任,承載了多少成年人對(duì)于年輕人的良苦用心!

然而,這些用意到底能產(chǎn)生多少實(shí)際效果,有誰(shuí)做過(guò)實(shí)際的調(diào)查研究呢?

看一看我們的孩子們作文時(shí)苦思冥想來(lái)適應(yīng)成年人思路的痛苦模樣,看一看高考作文試卷上幾乎千篇一律的翻來(lái)覆去重復(fù)著的空話和為了贏得高分編造出來(lái)的一個(gè)個(gè)‘凄慘’的故事,看一看孩子們“談作文色變”避之唯恐不及的神情…

我們?yōu)槭裁床蝗シ此甲陨淼膯?wèn)題,而是一味的批評(píng)孩子們沒(méi)有實(shí)際生活感受,寫作能力差呢?

2.命題對(duì)閱卷執(zhí)行實(shí)際缺乏足夠考慮

我們的閱卷情況很不理想,這是個(gè)不爭(zhēng)的事實(shí).要提高命題的科學(xué)性就必須充分考慮這一點(diǎn).

從理論上講,主觀題相對(duì)客觀題目應(yīng)該具有更高的效度,但從批閱實(shí)際角度來(lái)看則不然.既然高考試卷的首要職責(zé)是區(qū)分選拔學(xué)生,那么我們?yōu)楹畏炊浟烁径プ非蟊砻娴目茖W(xué)呢?

關(guān)于作文的問(wèn)題及改革方案,請(qǐng)參照上文.

3.制定的作文評(píng)分標(biāo)準(zhǔn)缺乏可操作性.

我們制定的作文評(píng)分標(biāo)準(zhǔn)貌似科學(xué),很難落實(shí),以至于閱卷老師們?cè)嚺鷷r(shí)或批閱之初,還按評(píng)分標(biāo)準(zhǔn)打分.之后很快就又回歸到打一個(gè)囫圇的總分的老路上去了.批閱時(shí)間短,勞動(dòng)強(qiáng)度大,制定的標(biāo)準(zhǔn)形同虛設(shè).

4.閱卷教師的選拔標(biāo)準(zhǔn)缺少實(shí)踐調(diào)查的支持,多憑想當(dāng)然.

我們?nèi)狈茖W(xué)嚴(yán)格閱卷老師資格審查制度.

“1991和1992年,河南省招辦和河南大學(xué)教育系、中文系聯(lián)合對(duì)高考閱卷人員的組成問(wèn)題進(jìn)行了大規(guī)模的調(diào)查,結(jié)果出乎一般人預(yù)料,也是令人深思的。結(jié)論是:高校教師、職稱高的老師、年齡大的老師評(píng)分誤差明顯大于中學(xué)教師、職稱低的老師、年齡小的老師。”(章熊<<中國(guó)當(dāng)作與閱讀測(cè)試>>四川教育出版社2000,10第二版70~72頁(yè))

由此可見(jiàn),我們平時(shí)想當(dāng)然的觀念里面潛藏著多少主觀臆想的成分,我們的行動(dòng)多么缺少實(shí)際調(diào)查的支持!而現(xiàn)在很多省份的高考閱卷仍然主要由一所大學(xué)承包(閱卷老師主要由大學(xué)老師及一些碩士生和博士生組成)的事實(shí),說(shuō)明了我們的有關(guān)部門是多么不重視此類的調(diào)查研究(此后沒(méi)再做類似的調(diào)查研究),改革是多么的困難!

(四)“數(shù)量”觀念匱乏

國(guó)人向來(lái)重主觀體驗(yàn)輕理性實(shí)證,重定性分析,輕定量研究,語(yǔ)文因而長(zhǎng)期停留在一種“運(yùn)用之妙,存乎一心”的撲朔迷離的狀態(tài)。語(yǔ)文的量化水平低下,語(yǔ)文效率很不理想.

葉老在20世紀(jì)80年代初就曾呼吁,對(duì)學(xué)生語(yǔ)文方面的能力“必須達(dá)到什么程度”,進(jìn)行認(rèn)真的調(diào)查研究,從而“形成一個(gè)周密的體系”.可惜的是,這種心中無(wú)數(shù)的狀況至今沒(méi)有多大改變.

無(wú)論是教學(xué)大綱,還是考試說(shuō)明,都十分缺乏量的規(guī)定.教者只能憑感覺(jué),憑大致的把握.這樣的教學(xué)也能培養(yǎng)少數(shù)的語(yǔ)文精英,卻絕不適合大批量的生產(chǎn)――我們中學(xué)語(yǔ)文教育的目的在于培養(yǎng)大批量的具有合格的聽(tīng)說(shuō)讀寫能力的現(xiàn)代青年,而不在于培養(yǎng)少數(shù)的語(yǔ)文精英.

“效率”是現(xiàn)代社會(huì)的重要特征,“量化”是“規(guī)模效益”之必需,無(wú)“規(guī)模效益”何談高效率?

自人類社會(huì)進(jìn)入信息時(shí)代以后,科技的發(fā)展更加日新月異,人們生活的節(jié)奏越來(lái)越快,辦事效率也越來(lái)越高--需要更快的處理更多的信息(尤其是高速膨脹的科技信息).語(yǔ)言的學(xué)習(xí)運(yùn)用以及測(cè)試?yán)響?yīng)緊跟時(shí)展的步伐.我們祖上傳下來(lái)的語(yǔ)言學(xué)習(xí)和運(yùn)用上的“體悟癥”“探究癖”理應(yīng)遭到信息化社會(huì)的唾棄.處理語(yǔ)言信息的敏捷性和靈活性應(yīng)該是語(yǔ)言測(cè)試的一個(gè)極其重要的目標(biāo).

顧德希說(shuō):“母語(yǔ)教學(xué)如何適應(yīng)現(xiàn)代化的問(wèn)題一直沒(méi)有解決”

“數(shù)量”這個(gè)概念,在語(yǔ)文界乃至我們整個(gè)社會(huì)都十分缺乏.鑒于此,有必要再重新認(rèn)識(shí)幾個(gè)概念.

1.再談“量”“量化”

唯物辯證法告訴我們,“質(zhì)”是一事物成為它自身并區(qū)別另一事物的內(nèi)在規(guī)定性,“量”是表示事物存在的規(guī)模、程度、速度以及構(gòu)成事物要素在空間中的排列組合等的數(shù)量的規(guī)定性.任何事物都是質(zhì)和量的統(tǒng)一.質(zhì)是具有一定量的質(zhì),量也總是一定質(zhì)的量,一定事物的值總以一定的量來(lái)表現(xiàn),世界上不能量化的質(zhì)是不存在的.因此,只有既作定性分析,又作定量分析,才能正確認(rèn)識(shí)事物.

按一般規(guī)律,社會(huì)科學(xué)的研究由定性到定量再到二者結(jié)合,是學(xué)科成熟的表現(xiàn),是其科學(xué)化的表現(xiàn).

“量化,簡(jiǎn)單的說(shuō)就是要數(shù)字化,即用數(shù)字說(shuō)明問(wèn)題.它具有客觀性,準(zhǔn)確性,廣泛性(建立在大量抽樣統(tǒng)計(jì)的基礎(chǔ)上,遠(yuǎn)勝于個(gè)案分析),深刻性(描述和解釋是基礎(chǔ)的,預(yù)測(cè)和控制才是科學(xué)研究的最高目標(biāo),這些都要借助于量化),普及性”(佟慶偉等著《教育科研中的量化方法》)

量化標(biāo)志著分析方法的科學(xué)水平,其主要功能是實(shí)證.而且,量化研究早已成為當(dāng)代社會(huì)與行為科學(xué)的強(qiáng)勢(shì)典范

“人類追求知識(shí)的活動(dòng),逐漸從啟蒙運(yùn)動(dòng)之后的唯心傳統(tǒng),配合19世紀(jì)末數(shù)學(xué)與邏輯的發(fā)展,走上一條量化、實(shí)證、非歷史、非心理的科學(xué)實(shí)證典范.以數(shù)學(xué)為基礎(chǔ)的符號(hào)邏輯思考體系,取代了亞里斯多德以來(lái)的形式邏輯概念,發(fā)展出以量化研究為主軸的科學(xué)研究典范.…實(shí)證主義下的符號(hào)邏輯思考體系,仍是當(dāng)代科學(xué)研究的主流思想,量化研究仍是學(xué)術(shù)訓(xùn)練的主要研究方法.”(邱皓政《社會(huì)與行為科學(xué)的量化研究與統(tǒng)計(jì)分析》五南圖書出版公司2000,8第一版)

桑代克和麥柯?tīng)栍袃删涿裕骸胺彩强陀^存在的事物都有其數(shù)量”“凡是有數(shù)量的事物都可以測(cè)量”(轉(zhuǎn)引自范偉達(dá)《現(xiàn)代社會(huì)研究方法》復(fù)旦大學(xué)出版社)有些事物現(xiàn)在不能量化,只能說(shuō)明量化的水平還不夠,將來(lái)某一天肯定能量化.

“馬克思說(shuō):一門科學(xué)只有成功的運(yùn)用了數(shù)學(xué)時(shí),才算真正成為科學(xué).”(孫建軍等著《定量分析方法》南京大學(xué)出版社2002,9第一版,第三頁(yè))

“科學(xué)的本質(zhì)是數(shù)”(笛卡爾)“宇宙這本書是用數(shù)學(xué)語(yǔ)言寫成的,沒(méi)有它們,人就在一個(gè)黑暗的的迷宮里勞而無(wú)功的游蕩著.”(伽利略)(轉(zhuǎn)引自郭俊義《廣義量化引論》江西高校出版社91,9第一版)

“缺乏數(shù)字處理技巧和文盲一樣,將被這個(gè)社會(huì)拋棄.透過(guò)復(fù)雜瑣碎的數(shù)字抓住問(wèn)題本質(zhì)的技巧,將鼎力助您作出英明決策.”〖(英)約翰·鮑威爾著《定量決策分析》李潔、林毓銘等譯上海遠(yuǎn)東出版社1998,8第一版第一頁(yè)〗

不重視量化是小生產(chǎn)者的狹隘眼光和傳統(tǒng)觀念.

孟子說(shuō)“權(quán)然后知輕重,度然后知長(zhǎng)短。”(轉(zhuǎn)引自范偉達(dá)《現(xiàn)代社會(huì)研究方法》復(fù)旦大學(xué)出版社)“考試既然是對(duì)人的知識(shí)與能力的測(cè)量,就必須用數(shù)量表示它的結(jié)果,有考試就有統(tǒng)計(jì)分析,甚至可以說(shuō),考試就是經(jīng)過(guò)測(cè)量所作的統(tǒng)計(jì)分析?!?/p>

2.我們的高考語(yǔ)文測(cè)試特別欠缺“數(shù)量”“效率”觀念

(1)考試題量有限,不重視對(duì)學(xué)生反應(yīng)敏捷性的考查.

一般的來(lái)講,試卷長(zhǎng),覆蓋面廣,題目多,區(qū)分度高.題量小,覆蓋面就小,這勢(shì)必會(huì)增大考試結(jié)果的偶然性.

好的命題要兼顧質(zhì)量和數(shù)量,一道題設(shè)計(jì)得再高明,也不能準(zhǔn)確測(cè)出全體學(xué)生的真實(shí)水平.

此外,思維的敏捷性作為語(yǔ)文基本能力的重要組成部分,其重要性在現(xiàn)代社會(huì)越來(lái)越凸顯.忽視這方面的考查,無(wú)疑是高考測(cè)試的一大失誤.

“伊薩克(Eysenck)說(shuō):感知及其過(guò)程的速度,實(shí)際上是重要的高級(jí)認(rèn)知技能.”〖(英國(guó))阿美·戴維斯《語(yǔ)言測(cè)試學(xué)原理》任福昌、吳平等譯,經(jīng)濟(jì)科學(xué)出版社1997,12第一版〗

先對(duì)中美語(yǔ)言測(cè)試的閱讀量作一個(gè)比較:

美國(guó)的SAT(相當(dāng)于我國(guó)的高考)言語(yǔ)部分特別注重閱讀領(lǐng)會(huì)能力(占總分的51%),要求考生通過(guò)閱讀獲取新的信息回答有關(guān)問(wèn)題。…就題量而言,新SAT言語(yǔ)部分的題量為78題,時(shí)限為75分鐘,為我國(guó)高考語(yǔ)文的兩倍?!覈?guó)高考閱讀領(lǐng)會(huì)的短文大致為2~3篇,字?jǐn)?shù)約為1000~1500字;新SAT閱讀領(lǐng)會(huì)的短文為五篇,字?jǐn)?shù)約為2500~3000字,再加上40個(gè)問(wèn)題的題干,閱讀量是我國(guó)的兩倍多。舊SAT為六篇,閱讀量更大。

再和高考英語(yǔ)試題比較一下.英語(yǔ)閱讀大概有八篇(包括聽(tīng)力,閱讀理解短文和完形填空等),其余語(yǔ)法、詞匯等客觀題的題量更為語(yǔ)文試題的若干倍,只是作文少了些.為何英語(yǔ)測(cè)試的效度和信度在各科中是名列前茅的呢?同是語(yǔ)言類學(xué)科,相去天壤,這難道不值得我們語(yǔ)文同仁反思嗎?難道僅僅是因?yàn)橛⒄Z(yǔ)在難度上要求低嗎

以數(shù)量有限的試題來(lái)區(qū)分學(xué)生,必然會(huì)在題目的“質(zhì)量”上下功夫,而這很容易導(dǎo)致“難”“偏”“怪”題泛濫.

遺憾的是,現(xiàn)在有很多人呼吁減少高考題的題量,以便讓學(xué)生有充足的時(shí)間思考,更利于水平發(fā)揮.(筆者認(rèn)為,再增加一個(gè)小時(shí),也不見(jiàn)得有多少改觀.病根在于試題難度過(guò)大,而不在于題量過(guò)大.)

(2)很多領(lǐng)域的數(shù)量指標(biāo)嚴(yán)重欠缺,各種標(biāo)準(zhǔn)化的測(cè)驗(yàn)量表亟待完善.

譬如,詞匯量表的制定.這應(yīng)該是教學(xué)和測(cè)試中量化的基礎(chǔ)一環(huán).

特定領(lǐng)域中哪些詞匯是最基本最常用的;詞義中的哪個(gè)義項(xiàng)是常用的.這些情況都要借助大規(guī)模的統(tǒng)計(jì)分析來(lái)搞清楚.否則,對(duì)詞匯量的科學(xué)考查便無(wú)從談起.我們的高考詞匯題目往往考查一些不大常用的偏僻詞匯和偏僻義項(xiàng)來(lái)區(qū)分學(xué)生,這也是這些題目屢遭詬病的主要原因之一.而英語(yǔ)測(cè)試早已解決了這一問(wèn)題.師生平時(shí)學(xué)習(xí)的目標(biāo)很明確.考試所測(cè)也主要是平時(shí)所學(xué)詞匯(當(dāng)然也有少數(shù)超綱的).學(xué)生水平區(qū)分主要體現(xiàn)在反應(yīng)的敏捷性、判斷的準(zhǔn)確性和運(yùn)用語(yǔ)言的靈活性上.所以,英語(yǔ)的教學(xué)和測(cè)試就相對(duì)實(shí)在,好把握得多,師生的怨言也少得多.

再如閱讀量表的制定.閱讀能力可以從閱讀速度、閱讀材料難易度和閱讀理解等方面來(lái)進(jìn)行定性和定量分析.前二者是可以量化的.

國(guó)外對(duì)閱讀速度的重視由來(lái)已久,也早已制定了非常完備的閱讀速度量表.“世界范圍內(nèi)的快速閱讀已從理論發(fā)展到實(shí)際訓(xùn)練階段,最近20年里,法、美、英、前蘇、日、巴西等國(guó)先后成立了全國(guó)性的閱讀指導(dǎo)組織.速讀是其指導(dǎo)的重要內(nèi)容.”(祝新華《語(yǔ)文能力發(fā)展心理學(xué)》杭州大學(xué)出版社1993版)

國(guó)內(nèi)的英語(yǔ)考試也早已制定了閱讀速度的指標(biāo).(大學(xué)四級(jí)考試要求50w.p.m,六級(jí)70w.p.m)(查高考指標(biāo))

閱讀材料易讀度(readability)的計(jì)算公式國(guó)外也有很多種。例如Flesh公式:RE=206.84-0.85wl-1.02sl(RE為易讀度指數(shù)wl為每100詞音節(jié)數(shù)sl每句平均詞數(shù))(楊惠中《語(yǔ)言能力的分級(jí)測(cè)試》,《考試研究》2002年第一輯61頁(yè))我國(guó)的英語(yǔ)考試常用Flesh公式來(lái)計(jì)算閱讀材料的難易度。易讀度只有合于一定的范疇才能入選某種類型的試題。而我們的高考閱讀考試說(shuō)明只有類似“閱讀‘淺易的…文章’”“閱讀‘一般的…作品’”這樣一些模糊的要求。

閱讀理解主要屬于定性分析。這一點(diǎn)國(guó)外也有很多成果值得我們借鑒。

此外,國(guó)外還有很多關(guān)于語(yǔ)言微技能的量化標(biāo)準(zhǔn)。

作文能力量化標(biāo)準(zhǔn)更是急需完善的一個(gè)項(xiàng)目。

譬如說(shuō),錯(cuò)別字、詞語(yǔ)誤用、病句,這些方面到底扣不扣分?達(dá)到幾個(gè)開(kāi)始扣分?扣多少分?這些一直都是糊涂帳。閱卷人員多是憑感覺(jué)來(lái)減分。然而,高溫高強(qiáng)度下的感覺(jué)又有多少準(zhǔn)確性可言呢?或許一篇不錯(cuò)的文章,因?yàn)轭}目是個(gè)病句就給槍斃了;或許無(wú)意中瞅見(jiàn)的一個(gè)非常反感的錯(cuò)別字(可能自己在教學(xué)中強(qiáng)調(diào)過(guò)幾百次了),就使得閱卷老師的情緒一下子激憤起來(lái),此作文因而失去多少分只有天知道。凡此種種,舉不勝舉。

當(dāng)然,即使有了比較科學(xué)的量化標(biāo)準(zhǔn),如果仍然采用人工高強(qiáng)度閱卷的話,這些標(biāo)準(zhǔn)仍然難以落到實(shí)處。所以,要使這些量化標(biāo)準(zhǔn)發(fā)揮作用,還得加快作文批閱的客觀化進(jìn)程,尤其要積極嘗試計(jì)算機(jī)閱卷。這在上文已經(jīng)探討過(guò)。

美國(guó)的“托?!焙虶MAT寫作評(píng)分中,共有“詞匯使用、句子結(jié)構(gòu)、文章組織、寫作邏輯、修辭、論述條理、文章內(nèi)容等諸多因素,統(tǒng)計(jì)了包括文章長(zhǎng)度、平均詞長(zhǎng)度、平均句長(zhǎng)度、詞頻率、句式結(jié)構(gòu)、標(biāo)點(diǎn)使用等在內(nèi)的共60多種可以定量分析的指標(biāo)…”(謝小慶《談?wù)Z言能力的考查》《中學(xué)語(yǔ)文教學(xué)》2003,6)

他們這些量化標(biāo)準(zhǔn)能得以很好的落實(shí),主要在于啟用了“電子評(píng)分員”。

3.令人遺憾和不解的是,時(shí)至今日,反對(duì)語(yǔ)文“量化”之聲仍不絕于耳.

“追求語(yǔ)言水平的精確量化,或試圖把人的語(yǔ)言能力發(fā)展劃分出精細(xì)的等級(jí),諸如此類的努力,其意義和價(jià)值都值得懷疑。”

“百年來(lái),語(yǔ)文教學(xué)最大的失誤是什么?是所謂‘科學(xué)化’--理性的分析研究,已經(jīng)使語(yǔ)文這個(gè)生命體沒(méi)有了生命的感覺(jué)。”

主要原因在于,一些傳統(tǒng)的獲取知識(shí)的方法在我國(guó)仍然很有市場(chǎng),對(duì)各種定量分析方法缺乏足夠的信心,同時(shí)也是過(guò)分相信充滿人類智慧的文化知識(shí)不能簡(jiǎn)化為純粹的數(shù)字的結(jié)果

.“Helmstadter(1970)指出:傳統(tǒng)的獲取知識(shí)的方法有(一)慣常法(themethodoftenacity):基于慣例、傳統(tǒng)及先入為主的印象或觀念,過(guò)去總是如此或天經(jīng)地義之事,便認(rèn)為是真實(shí)可信的。(二)權(quán)威法(themethodofauthority):權(quán)威的個(gè)人團(tuán)體或典籍。(三)直覺(jué)法(themethodofintuition):人們的觀念與知識(shí)訴諸于直觀與直覺(jué),人們相信自己的經(jīng)驗(yàn)判斷與知覺(jué),從個(gè)人的頓悟與奇想中,發(fā)現(xiàn)新的想法與概念。(四)強(qiáng)調(diào)推理或推論的可靠性,認(rèn)為只要推理或推論是對(duì)的,所得的結(jié)論便是真實(shí)或可信的?!保ㄇ耩┱渡鐣?huì)與行為科學(xué)的量化研究與統(tǒng)計(jì)分析》五南圖書出版公司2000,8第一版)

我們承認(rèn),語(yǔ)文有很多模糊難以量化的地方(例如語(yǔ)文中的文化因素、情感因素等等),這樣的地方就不妨先讓它模糊著。但不可否認(rèn),有更多的地方是可以量化也必須要量化的,尤其是中小學(xué)領(lǐng)域里的基礎(chǔ)知識(shí)和基本能力方面。

"我認(rèn)為現(xiàn)在的中學(xué)語(yǔ)文教學(xué)和測(cè)評(píng)倒不是科學(xué)主義泛濫,而是科學(xué)主義嚴(yán)重不足"(顧德?!墩Z(yǔ)文教學(xué)的病根》)

令人遺憾的是,我們的高考閱讀量很少,測(cè)試方法還深深地打著傳統(tǒng)的“體悟癥”“探究癖”(悟文析法,一切為寫作服務(wù))的痕跡.閱讀題目的設(shè)置玄玄乎乎,像擺迷魂陣.

“前幾年的高考精讀題目,任意挖壁打洞,圈圈點(diǎn)點(diǎn),條條框框,搞得面目全非。選擇項(xiàng)的設(shè)置差別微細(xì),玄玄乎乎,云里霧里…我們不禁要問(wèn):我們是否是在培養(yǎng)老學(xué)究?人們平時(shí)的閱讀是這個(gè)樣子嗎?”“1996的科技說(shuō)明文閱讀中的‘示范廠’‘小規(guī)模工廠’‘正式規(guī)模的工廠’‘小型廠’等概念,文章本身就表達(dá)不清,令人費(fèi)解…選材欠當(dāng);97年科技文中的‘顱腦’和‘腸腦’,不用說(shuō)中學(xué)生聞所未聞,就是生物老師和一般醫(yī)務(wù)人員也不太清楚,用如此專業(yè)化的東西考學(xué)生實(shí)在太離譜”(《語(yǔ)文教學(xué)通訊》2001,22盛華明《讓語(yǔ)文考試更貼近實(shí)際》)

“對(duì)效度威脅的因素之一:每個(gè)目標(biāo)的項(xiàng)目太少。有時(shí)候一個(gè)成績(jī)測(cè)驗(yàn)的是某種技能是否存在,而依靠的卻只是一兩個(gè)題目…”“一個(gè)工具需要的財(cái)力人力越多,那么如果它的信度是低的話,越是要慎重考慮是否采用?!保ǔ鲎孕」P記本-書名作者待查)

“我國(guó)學(xué)科成就考試偏重測(cè)量學(xué)科知識(shí)及其應(yīng)用,例如,我國(guó)語(yǔ)文高考強(qiáng)調(diào)常識(shí)、語(yǔ)法、文章結(jié)構(gòu)等等知識(shí);美國(guó)的SAT言語(yǔ)部分則強(qiáng)調(diào)言語(yǔ)概念的把握、詞匯量,重視概念之間的關(guān)系的揭示及邏輯推理(類推),特別注重閱讀領(lǐng)會(huì)能力(占總分的51%),要求考生通過(guò)閱讀獲取新的信息回答有關(guān)問(wèn)題?!皖}量而言,新SAT言語(yǔ)部分的題量為78題,時(shí)限為75分鐘,為我國(guó)高考語(yǔ)文的兩倍?!覈?guó)高考閱讀領(lǐng)會(huì)的短文大致為2~3篇,字?jǐn)?shù)約為1000~1500字;新SAT閱讀領(lǐng)會(huì)的短文為五篇,字?jǐn)?shù)約為2500~3000字,再加上40個(gè)問(wèn)題的題干,閱讀量是我國(guó)的兩倍多。舊SAT為六篇,閱讀量更大?!覈?guó)高考適當(dāng)降低知識(shí)難度,注重聯(lián)系實(shí)際,加強(qiáng)思維的敏捷性和靈活性。…命題周期約為18個(gè)月,每年都要準(zhǔn)備多套等值的測(cè)驗(yàn)試卷…先進(jìn)的心理計(jì)量技術(shù)…其完善性是國(guó)際測(cè)量界所公認(rèn)的。…其信度和效度均比較理想。…ETS的研究表明:完成四分之三試卷的考生比例一般都在95%以上。”

“正是基于這樣的研究,才使其后的40年中客觀性選擇題成為美國(guó)語(yǔ)言能力測(cè)試的主要題型…從上世紀(jì)90年代開(kāi)始,美國(guó)的語(yǔ)言考試逐漸開(kāi)始了作文考試。伴隨它出現(xiàn)的是借助計(jì)算機(jī)給作文評(píng)分的‘電子評(píng)分員’…用自然語(yǔ)言處理技術(shù)與信息擷取技術(shù)研究開(kāi)發(fā)的一種主要基于語(yǔ)言特征分析之上的計(jì)算機(jī)程序,考慮了詞匯使用、句子結(jié)構(gòu)、文章組織、寫作邏輯、修辭、論述條理、文章內(nèi)容等諸多因素,統(tǒng)計(jì)了包括文章長(zhǎng)度、平均詞長(zhǎng)度、平均句長(zhǎng)度、詞頻率、句式結(jié)構(gòu)、標(biāo)點(diǎn)使用等在內(nèi)的共60多種可以定量分析的指標(biāo)…”(謝小慶《談?wù)Z言能力的考查》《中學(xué)語(yǔ)文教學(xué)》2003,6)

4.適當(dāng)增加試題數(shù)量是增加考試信度效度的有效手段,這是測(cè)試學(xué)中被反復(fù)驗(yàn)證了的真理.

而加大題量的最好辦法是多出選擇題

選擇題的良好品質(zhì)早已在世界上得到公認(rèn),并早已確立了其在大規(guī)模語(yǔ)言考試中主要題型的地位,持續(xù)了半個(gè)多世紀(jì)未曾被動(dòng)搖,為什么偏偏在我們國(guó)家得不到應(yīng)有的重視呢?是由于漢語(yǔ)和其他語(yǔ)言有著本質(zhì)的區(qū)別呢,還是由于我們批閱主觀題的誤差遠(yuǎn)比別人來(lái)的小而達(dá)到了較為理想的程度呢?

自1987年語(yǔ)文大批判開(kāi)始至今,對(duì)于選擇題的批評(píng)就從來(lái)沒(méi)有停止過(guò)。雖經(jīng)許多專家闡釋糾正,仍未獲得足夠的信任。鑒于此,筆者想再就此說(shuō)幾點(diǎn)。

(1)選擇題的“天然”優(yōu)勢(shì)特別適合我國(guó)國(guó)情

(2)其命制的科學(xué)性也亟待提高

選擇題特別便于考查被試思維的敏捷性和準(zhǔn)確的判斷力。

筆者認(rèn)為,客觀題不僅不能取消,反而應(yīng)適當(dāng)加大題量.因?yàn)檫@種題型有其天然的"客觀"優(yōu)勢(shì),特別適合我國(guó)國(guó)情(主觀題很難增大題量,而且批閱的主觀誤差太大,需更多的人力物力財(cái)力)

"在一份試卷中,這樣的試題需要有一定數(shù)量。若只一道這樣的題,就有四分之一"蒙對(duì)"的可能;若夠一定數(shù)量,"蒙"就失去了意義,客觀性就可得到保證”再說(shuō),“猜測(cè)”有時(shí)也是一種能力.國(guó)外的考試很多試卷上面就有鼓勵(lì)猜測(cè)的提示語(yǔ).

其實(shí),客觀性試題的優(yōu)越性是多方面的:能根據(jù)考生的認(rèn)知實(shí)際合理設(shè)置選項(xiàng),使考查目的明確;避免受考生表達(dá)能力干擾而答題不準(zhǔn)確;考查點(diǎn)更明確、單一;在大規(guī)模測(cè)試中能做到答案唯一,保證測(cè)試的權(quán)威性。大范圍抽樣檢測(cè)發(fā)現(xiàn),高質(zhì)量客觀性試題與主觀性試題所獲分值十分吻合。這說(shuō)明客觀性試題是完全可用的,片面地否定它就可能妨害高考。至于這類試題對(duì)教學(xué)可能產(chǎn)生的負(fù)面影響,應(yīng)在教學(xué)中實(shí)事求是地加以解決。

當(dāng)然,我們的選擇題命題的科學(xué)性繼續(xù)提高.當(dāng)前亟待深入研究的課題是,如何克服漢語(yǔ)的模糊性,達(dá)到精確量化的目標(biāo),而不是什么取消選擇題的問(wèn)題。

"從學(xué)生考試的結(jié)果來(lái)看,這些客觀題起到了積極作用。因?yàn)檫@比過(guò)去高考只考一篇作文出的"冤假錯(cuò)案"要少得多。我先后送走過(guò)近30個(gè)高三畢業(yè)班,對(duì)使用"客觀題"與不使用"客觀題"的結(jié)果做過(guò)反復(fù)對(duì)比。結(jié)論是:客觀題出得好,頭腦清楚的學(xué)生少受委屈;考主觀題則要憑運(yùn)氣,主觀題的成績(jī)與學(xué)生實(shí)際水平有時(shí)出現(xiàn)極大反差。所以采用一定數(shù)量的客觀題,有利于公平選拔,相對(duì)而言是對(duì)考生比較負(fù)責(zé)的做法。"

“況且,在沒(méi)有引進(jìn)客觀題之前,語(yǔ)文教學(xué)的少慢差費(fèi)早就長(zhǎng)期存在。我們對(duì)客觀題引進(jìn)前后的語(yǔ)文教學(xué)質(zhì)量根本沒(méi)有足資憑信的對(duì)比,便斷言一種命題方法能對(duì)語(yǔ)文教學(xué)起決定性作用,而且口誅筆伐,恐怕過(guò)分輕率了。"還有一些人批判選擇題不過(guò)是為了趕世界反對(duì)科學(xué)主義的潮流。"(顧德希《語(yǔ)文教學(xué)的病根》)

美日高考全為客觀題,法國(guó)主要考大題.(康乃美等著《中外考試制度比較研究》華中師范大學(xué)出版社2002年版)

“SAT是美國(guó)最具代表性的團(tuán)體學(xué)術(shù)能力傾向測(cè)驗(yàn)之一,其功能相當(dāng)于我國(guó)的高考。它以基本的言語(yǔ)能力為核心部分。它是一種預(yù)測(cè)性測(cè)驗(yàn),注重測(cè)量與未來(lái)學(xué)習(xí)成功有關(guān)的能力測(cè)驗(yàn)時(shí)間短,題量大,對(duì)思維和反應(yīng)的敏捷性與正確性要求較高。全部采取多選一的客觀題方式。嚴(yán)格按照科學(xué)化標(biāo)準(zhǔn)化的程序編制并實(shí)施,具有較堅(jiān)實(shí)的心理計(jì)量學(xué)基礎(chǔ)。它這種學(xué)能測(cè)驗(yàn)和我們的學(xué)科測(cè)驗(yàn)只是處于同一測(cè)量連續(xù)體的不同位置。前者側(cè)重依據(jù)校內(nèi)外經(jīng)驗(yàn)而發(fā)展起來(lái)的能力,后者側(cè)重教學(xué)中發(fā)展的能力,前者可以為后者加強(qiáng)能力考查方面提供借鑒。它努力創(chuàng)設(shè)新的問(wèn)題情境或采用新的材料,力求與中學(xué)課程及教材無(wú)直接聯(lián)系。(1)各科均如此(2)體制和我們不一樣,壓力差別很大?!?/p>

現(xiàn)在該是結(jié)束爭(zhēng)執(zhí)的時(shí)候了.將精力放到…努力提高語(yǔ)文高考的科學(xué)化水平.

(一)試題難度過(guò)大,有“專家化”傾向,重學(xué)科知識(shí)的運(yùn)用,輕基本能力的考查

想對(duì)于高考其他科目而言,與文科題目的“偏”“難”“怪”是早已出了名的.學(xué)生戲稱考語(yǔ)文是"跟著感覺(jué)走"

這是高考語(yǔ)文遭受批評(píng)的焦點(diǎn)之一.

很多語(yǔ)文界專家(劉國(guó)正等)和作家(如王蒙),甚至不惜以身試法,以自己慘不忍睹的成績(jī)(嚴(yán)格的按標(biāo)準(zhǔn)答案批閱基本不及格),向語(yǔ)文高考提出了強(qiáng)有力的質(zhì)疑.

對(duì)此,有關(guān)考試官員和專家的解釋卻是:“對(duì)試題不熟悉”“沒(méi)經(jīng)過(guò)專門訓(xùn)練”“所操之術(shù)多異”…

這些托詞雖含有一點(diǎn)道理在里面,但包含著更多的狡辯,缺乏起碼的自我批評(píng)精神。我們不禁要問(wèn):連漢語(yǔ)專家都及不了格的試題其科學(xué)性又有幾何?如此考試到底是為了考查學(xué)生的語(yǔ)文基本功,還是為了顯示命題者的水平呢?

顯然,我們對(duì)“語(yǔ)文基本功”的定位出了問(wèn)題.我們?nèi)鄙僮銐虻乃絹?lái)科學(xué)的提高試題的區(qū)分度

那么,到底應(yīng)該如何來(lái)定位“語(yǔ)文基本功”呢?

“作為基礎(chǔ)教育階段的語(yǔ)文教育,對(duì)于絕大多數(shù)學(xué)生來(lái)說(shuō),無(wú)疑應(yīng)注重語(yǔ)文基本能力的培養(yǎng)”(顧德希)(<<中國(guó)考試>>2002年第三期<<學(xué)科能力等級(jí)研究與素質(zhì)教育>>)

“SAT是美國(guó)最具代表性的團(tuán)體學(xué)術(shù)能力傾向測(cè)驗(yàn)之一,其功能相當(dāng)于我國(guó)的高考。它以基本的言語(yǔ)能力為核心部分。它是一種預(yù)測(cè)性測(cè)驗(yàn),注重測(cè)量與未來(lái)學(xué)習(xí)成功有關(guān)的能力測(cè)驗(yàn)時(shí)間短,題量大,對(duì)思維和反應(yīng)的敏捷性與正確性要求較高。全部采取多選一的客觀題方式。嚴(yán)格按照科學(xué)化標(biāo)準(zhǔn)化的程序編制并實(shí)施,具有較堅(jiān)實(shí)的心理計(jì)量學(xué)基礎(chǔ)。它這種學(xué)能測(cè)驗(yàn)和我們的學(xué)科測(cè)驗(yàn)只是處于同一測(cè)量連續(xù)體的不同位置。前者側(cè)重依據(jù)校內(nèi)外經(jīng)驗(yàn)而發(fā)展起來(lái)的能力,后者側(cè)重教學(xué)中發(fā)展的能力,前者可以為后者加強(qiáng)能力考查方面提供借鑒。它努力創(chuàng)設(shè)新的問(wèn)題情境或采用新的材料,力求與中學(xué)課程及教材無(wú)直接聯(lián)系。

美國(guó)的SAT(相當(dāng)于我國(guó)的高考)言語(yǔ)部分則強(qiáng)調(diào)言語(yǔ)概念的把握、詞匯量,重視概念之間的關(guān)系的揭示及邏輯推理(類推)

“美國(guó)明顯重基本能力,輕基礎(chǔ)知識(shí)考查,內(nèi)容廣泛,體裁靈活多樣,知識(shí)覆蓋面廣,題量大.中日法則重知識(shí)掌握.”(康乃美等著《中外考試制度比較研究》華中師范大學(xué)出版社2002年版)

作文考查應(yīng)大大降低對(duì)“藝術(shù)才能”(如想象力情感力感悟力形象思維力以及思維的創(chuàng)造性和批判性;高的格調(diào)境界)的要求,-略有體現(xiàn)足矣,畢竟高考的選拔是一種基礎(chǔ)性選拔,這方面要求過(guò)高勢(shì)必會(huì)扼殺大批具有其他專長(zhǎng)的精英。確實(shí)有寫作才華的學(xué)生可以通過(guò)其他渠道破格錄取。

有很多科學(xué)家、政治家的文章,的確缺乏文采,但卻有足夠的魅力吸引人們。由此可見(jiàn),解決作文能力等級(jí)量化問(wèn)題,不能不在緯度上加以劃分。

“作文教學(xué)盡管可以提倡文采,但顯然不必以此為每個(gè)學(xué)生作文的劃一尺度。能文采飛揚(yáng),固然值得鼓勵(lì);不能的,盡可在不同方面發(fā)展。文字清楚,意思明確,作為文學(xué)刊物用稿的尺度是不行的,但作為語(yǔ)文表達(dá)能力的一種基本要求,為什么就不值得大力提倡呢?”(顧德?!秾W(xué)科能力等級(jí)研究與素質(zhì)教育》《中國(guó)考試》)

作文批閱是過(guò)于重格調(diào),重境界,也扼殺了不少敢說(shuō)真話,抒真情的性靈之作.

語(yǔ)文由于是母語(yǔ),再加上高考屬選拔性測(cè)試,所以考題必須有一定的難度,這是正確的。問(wèn)題是如何來(lái)增加難度,是不是增加難度就一定意味著將題目搞的神秘兮兮呢

“我國(guó)學(xué)科成就考試偏重測(cè)量學(xué)科知識(shí)及其應(yīng)用,例如,我國(guó)語(yǔ)文高考強(qiáng)調(diào)常識(shí)、語(yǔ)法、文章結(jié)構(gòu)等等知識(shí);美國(guó)的SAT言語(yǔ)部分則強(qiáng)調(diào)言語(yǔ)概念的把握、詞匯量,重視概念之間的關(guān)系的揭示及邏輯推理(類推),特別注重閱讀領(lǐng)會(huì)能力(占總分的51%),要求考生通過(guò)閱讀獲取新的信息回答有關(guān)問(wèn)題?!皖}量而言,新SAT言語(yǔ)部分的題量為78題,時(shí)限為75分鐘,為我國(guó)高考語(yǔ)文的兩倍?!覈?guó)高考閱讀領(lǐng)會(huì)的短文大致為2~3篇,字?jǐn)?shù)約為1000~1500字;新SAT閱讀領(lǐng)會(huì)的短文為五篇,字?jǐn)?shù)約為2500~3000字,再加上40個(gè)問(wèn)題的題干,閱讀量是我國(guó)的兩倍多。舊SAT為六篇,閱讀量更大。…我國(guó)高考適當(dāng)降低知識(shí)難度,注重聯(lián)系實(shí)際,加強(qiáng)思維的敏捷性和靈活性?!}周期約為18個(gè)月,每年都要準(zhǔn)備多套等值的測(cè)驗(yàn)試卷…先進(jìn)的心理計(jì)量技術(shù)…其完善性是國(guó)際測(cè)量界所公認(rèn)的?!湫哦群托Ф染容^理想?!璄TS的研究表明:完成四分之三試卷的考生比例一般都在95%以上。”

讓我們選擇幾個(gè)題型,來(lái)具體的看看語(yǔ)文試題的難度有多大.

應(yīng)該承認(rèn),把高考題卷上的多數(shù)題分別孤立地看,并無(wú)太大難度,但是,以整張?jiān)嚲韥?lái)看,難度是很大的。每年高考學(xué)生得分很少有上130分的(150分為滿分),而外語(yǔ)考分上140分則不為少數(shù);許多語(yǔ)文專家試做高考題也往往難以及格。語(yǔ)文專家劉國(guó)正先生有一次很認(rèn)真地答了一張高考語(yǔ)文試卷,按標(biāo)準(zhǔn)答案,嚴(yán)格計(jì)算,結(jié)果只能達(dá)到70分。王蒙稱自己很難及格.

深圳市紅嶺中學(xué)的胡立根老師曾作過(guò)一個(gè)數(shù)據(jù)統(tǒng)計(jì),是關(guān)于91年到97年高考語(yǔ)音題目中部分漢字的使用頻率的:

試題年份9193949495959697

漢字抔涔鋌捭皈帙戕殄

85年字次10439567

使用度0.55.02.21.86.53.13.74

十科分布11235333

“使用度在10以下的字,是使用度極低的字…在7000通用漢字中,至少有6500個(gè)漢字的使用度超過(guò)了0.5?!?《語(yǔ)文學(xué)習(xí)》1999年第八期)

2000年識(shí)別錯(cuò)字題考了兩個(gè)冷僻字“圜”“禎”,占總數(shù)的__分之一

前些年盛行的字音字義字形題,一道選擇題目中考查36個(gè)知識(shí)點(diǎn),且都是比較難的或者說(shuō)報(bào)章雜志都經(jīng)常錯(cuò)的,只要有一個(gè)點(diǎn)掌握不好,此題得分的可能性就和純粹猜測(cè)差不多。如此測(cè)試能公平客觀的評(píng)定、區(qū)分考生的實(shí)際水平層次嗎?這兒僅舉一個(gè)例子:

且看高考命題提高難度的手段1.合多為一法

如考卷第一題,要求辨別幾個(gè)字的讀音或字型或解釋(有時(shí)一道題目包含上述三個(gè)方面)的正誤,四個(gè)選擇肢每肢至少包含四個(gè)知識(shí)點(diǎn),這實(shí)際上是將很多道題合并到了一起.

2.避熟就生法.如考一些常用詞語(yǔ)中相對(duì)不很常用的詞語(yǔ)或熟詞生義(附統(tǒng)計(jì)結(jié)果);出一些專業(yè)性較強(qiáng)的文章(命題者稱是從語(yǔ)文角度考查,但如果文章的大概都把握不了,答題又從何說(shuō)起呢)

3.將水搞渾法.這突出表現(xiàn)在客觀題中選擇項(xiàng)的設(shè)置上.命題者唯恐考生輕易答出,于是處處設(shè)疑置絆,將選擇項(xiàng)搞的玄玄乎乎,使人如墜云里霧里.

語(yǔ)文考題中致難之因還有,這兒就不再列舉了。我們要注意的是這種"難度"的性質(zhì)與它帶來(lái)的后果,它的難不在于考及的知識(shí)如何艱深,而主要是考查的繁瑣復(fù)雜,廣布疑陣,因而使程度差的人反可籍猜測(cè)答案得分,而程度較高的人卻因錯(cuò)誤人人難免而無(wú)法得到高分。這種考試不可能有大的區(qū)分度,不利于人才的選拔。

“我國(guó)高考使用的標(biāo)準(zhǔn)化考試并不是嚴(yán)格意義上的標(biāo)準(zhǔn)化考試。第一,我們的試卷編制過(guò)程不標(biāo)準(zhǔn)。采用的還是我們老祖宗的出題方式,沒(méi)有建立題庫(kù),試卷形成后沒(méi)有預(yù)測(cè);這樣就很難保證試題的難度、區(qū)分度,以及試卷的信度和效度達(dá)到一定的指標(biāo)。第二,我們的分?jǐn)?shù)解釋沒(méi)有標(biāo)準(zhǔn)化,我國(guó)至今(在標(biāo)準(zhǔn)化考試使用了十幾年之后)基本上還在使用卷面分?jǐn)?shù)報(bào)告成績(jī),還在采用將各科的卷面成績(jī)相加來(lái)計(jì)算總分的方式。有一點(diǎn)統(tǒng)計(jì)學(xué)和測(cè)量學(xué)常識(shí)的人都知道,這種做法是錯(cuò)誤的?!保ㄓ嗝鬏x《我國(guó)中小學(xué)語(yǔ)文教學(xué)的病根到底是什么》《中學(xué)語(yǔ)文教學(xué)》2000,9)

中國(guó)傳統(tǒng)思維具有求同與封閉性特點(diǎn).“法古”“法師”“去異”

東方:宗法專制文化;西方:科學(xué)民主精神.(李宇升《教學(xué)藝術(shù)比較研究》天津大學(xué)出版社1998,第一版23頁(yè))

“‘德性’文化傳統(tǒng)使得評(píng)價(jià)更多的是一種人文主義的評(píng)價(jià)模式,過(guò)分強(qiáng)調(diào)了評(píng)價(jià)的民主性和倫理性,而忽視了評(píng)價(jià)以客觀事實(shí)為基礎(chǔ)的原則.”“科學(xué)主義的教育評(píng)價(jià)忽視了教育評(píng)價(jià)的主體性的一面,形成了單一凝固的教育價(jià)值觀及指標(biāo)體系,‘抹煞了豐富的教育活動(dòng)的多樣性和教學(xué)的藝術(shù)性’…而在教育評(píng)價(jià)的實(shí)際操作中,定性評(píng)價(jià)往往也比定量評(píng)價(jià)更容易進(jìn)行,自覺(jué)不自覺(jué)的陷入了人本主義的泥坑.…高揚(yáng)科學(xué)的大旗,,定性和定量相結(jié)合,充分利用現(xiàn)代科學(xué)技術(shù),特別是計(jì)算機(jī)技術(shù)…使評(píng)價(jià)結(jié)果是建立在大量信息基礎(chǔ)上的一種判斷,走出行政性評(píng)價(jià)的窠臼.…文化是一個(gè)民族的特質(zhì),傳統(tǒng)文化對(duì)一個(gè)民族的影響是潛意識(shí)的,揮之不去的.…我國(guó)的教育評(píng)價(jià)制度既要學(xué)習(xí)西方的先進(jìn)經(jīng)驗(yàn),又不能脫離本國(guó)的文化背景.評(píng)價(jià)主體宜具有官方的背景,評(píng)價(jià)機(jī)構(gòu)性質(zhì)宜‘半官半民’,評(píng)價(jià)方式上力求創(chuàng)新,走科學(xué)評(píng)價(jià)的道路,既要做到倫理的善,更要做到邏輯的真和形式的美.”(孔祥沛《淺論傳統(tǒng)文化對(duì)我國(guó)教育評(píng)價(jià)制度的影響》《教育科學(xué)研究》年月日待查)“中國(guó)文化是強(qiáng)調(diào)人文精神、倫理道德、中庸和諧關(guān)系的‘道德理性文化’,西方文化是注重科學(xué)主義的‘工具理性’文化.”(顧冠華沈廣斌《中國(guó)傳統(tǒng)文化與高等教育》海洋出版社1999年版,23頁(yè))

“考試機(jī)構(gòu)不宜制造一個(gè)錯(cuò)覺(jué),讓外界誤以為考試是一門精確的科學(xué),這樣的定位并不表示考試機(jī)構(gòu)自貶身價(jià),而是一種負(fù)責(zé)任和實(shí)事求是的態(tài)度.考試政策必須經(jīng)過(guò)縝密的考慮,有理有據(jù),合情合法;運(yùn)作程序的設(shè)計(jì)必須算無(wú)遺策,把人為因素減至最低,務(wù)求考生的成績(jī)得到公平、正確的處理.對(duì)于考試的局限,以坦誠(chéng)的態(tài)度處理.這樣,把有關(guān)政策和運(yùn)作程序公諸于世,不但不會(huì)削弱考試機(jī)構(gòu)的權(quán)威性,反而有助于提升其公信力.揭開(kāi)面紗,責(zé)無(wú)旁貸.”

馬克思恩格斯說(shuō)過(guò):“科學(xué)就是在于用理性的方法去整理感性材料.”(劉堯《論教育評(píng)價(jià)的科學(xué)性與科學(xué)化問(wèn)題》《教育研究》2001,6)

考試原則:科學(xué)性、客觀性、公平性、實(shí)踐性(廖平勝等著《考試學(xué)》)

命題只有少數(shù)人“入闈”突擊進(jìn)行,試題質(zhì)量缺乏科學(xué)管理的指標(biāo),對(duì)以往考試很少統(tǒng)計(jì)分析,試題水平往往不穩(wěn)定。評(píng)卷每年抽調(diào)近十萬(wàn)教師,耗資千萬(wàn),閱卷人員水平參差不齊(缺乏必要的選拔資格認(rèn)證體系),缺少控制評(píng)卷質(zhì)量的有效方法。

筆者想,我們的高考卷如果像世界上很多國(guó)家一樣可以復(fù)查(當(dāng)然這在高考競(jìng)爭(zhēng)異常激烈的時(shí)候施行起來(lái)是很困難的),肯定會(huì)輿論大嘩!但這對(duì)于增加考試的透明度,提升考試的公信力,是多么有益的事呀!我們的改革步伐好像總是如此緩慢,我們只能翹首企盼了。

從實(shí)際效果來(lái)看,筆者建議還是多聘請(qǐng)中學(xué)高水平教師批閱為宜

缺少立法?!坝捎谌鄙賹?duì)招生制度的深入細(xì)致的科學(xué)研究,沒(méi)有一個(gè)總體的規(guī)劃,缺少一個(gè)‘法’,所以多年來(lái)高考政策不穩(wěn)定,反復(fù)大,領(lǐng)導(dǎo)意志明顯。招生政策幾乎年年有變化,有時(shí)甚至今年完全推翻了去年的做法。”(馬文卿劉文超著《中國(guó)高考走向》山東人民出版社2002,3,一版,41頁(yè))

“無(wú)紙化考試在國(guó)外已很流行成熟,而我國(guó)尚處于試驗(yàn)階段.雖然西方人運(yùn)用考試的歷史比我們晚整整一千年,卻早已形成了一些更為科學(xué)的考試觀念,就像他們雖然從我們這兒學(xué)會(huì)了造紙術(shù)和印刷術(shù),今天卻向我們出口造紙和印刷的成套設(shè)備.”(《關(guān)于考試公平性的一些思考》《考試研究》2002第二輯作者待再查)

閱讀測(cè)試忽視現(xiàn)代社會(huì)實(shí)際需求

自人類社會(huì)進(jìn)入信息時(shí)代以后,科技的發(fā)展更加日新月異,人們生活的節(jié)奏越來(lái)越快,辦事效率也越來(lái)越高--需要更快的處理更多的信息(尤其是高速膨脹的科技信息).語(yǔ)言的學(xué)習(xí)運(yùn)用以及測(cè)試?yán)響?yīng)緊跟時(shí)展的步伐.我們祖上傳下來(lái)的語(yǔ)言學(xué)習(xí)和運(yùn)用上的“體悟癥”“探究癖”理應(yīng)遭到信息化社會(huì)的唾棄.處理語(yǔ)言信息的敏捷性和靈活性應(yīng)該是語(yǔ)言測(cè)試的一個(gè)極其重要的目標(biāo).

“量化研究是當(dāng)代社會(huì)與行為科學(xué)的強(qiáng)勢(shì)典范.統(tǒng)計(jì)分析則是量化研究的核心.…標(biāo)準(zhǔn)化的測(cè)驗(yàn)量表,是量化研究不可或缺的工具,其嚴(yán)謹(jǐn)?shù)木幹瞥绦蚺c信效度檢驗(yàn),使測(cè)量的品質(zhì)得以確保.”“人類追求知識(shí)的活動(dòng),逐漸從啟蒙運(yùn)動(dòng)之后的唯心傳統(tǒng),配合19世紀(jì)末數(shù)學(xué)與邏輯的發(fā)展,走上一條量化、實(shí)證、非歷史、非心理的科學(xué)實(shí)證典范.以數(shù)學(xué)為基礎(chǔ)的符號(hào)邏輯思考體系,取代了亞里斯多德以來(lái)的形式邏輯概念,發(fā)展出以量化研究為主軸的科學(xué)研究典范.…實(shí)證主義下的符號(hào)邏輯思考體系,仍是當(dāng)代科學(xué)研究的主流思想,量化研究仍是學(xué)術(shù)訓(xùn)練的主要研究方法.”)

“我國(guó)的中學(xué)生每學(xué)期只不過(guò)認(rèn)真學(xué)三十篇文章(教材規(guī)定的),而美國(guó)初中生每學(xué)期達(dá)一百篇左右,德國(guó)有近六十篇.”(張承明《中外語(yǔ)文教育比較研究》云南教育出版社2000,10第一版62頁(yè))

“思想內(nèi)容”的合理構(gòu)成又是怎樣的呢?“品德修養(yǎng)”到底應(yīng)不應(yīng)該占分?若占,占多少分?這也是個(gè)很迫切的問(wèn)題。以筆者之見(jiàn),應(yīng)弱化這方面的考查。原因如下:(一)追求“品德”的高境界,對(duì)學(xué)生抒寫真生活真情感是個(gè)極大的束縛,助長(zhǎng)了“假、大、空”的惡習(xí)。(二)紙上的“品德”是很靠不住的,言行不一的現(xiàn)象畢竟太普遍。(三)很難定位量化。而我們的命題一旦去除了背負(fù)在肩上的這份“道德教化”的額外負(fù)擔(dān),會(huì)一下子輕松許多。文言片段的選材不必再拘泥于“英雄事跡”,作文命題也可根本上避免“政治化”傾向,學(xué)生可以放開(kāi)手腳,“我手寫我口”,局面會(huì)一下子生動(dòng)活潑許多。