大學(xué)英語(yǔ)測(cè)試論文

導(dǎo)語(yǔ)：大學(xué)英語(yǔ)測(cè)試論文一文來源于網(wǎng)友上傳，不代表本站觀點(diǎn)，若需要原創(chuàng)文章可咨詢客服老師，歡迎參考。

摘要：信度和效度是評(píng)估語(yǔ)言測(cè)試最為關(guān)鍵的兩個(gè)質(zhì)量指標(biāo),但兩者在本質(zhì)上又是相互沖突的。嘗試論證在一定的約束條件下，為了使某一特定測(cè)試的總效用達(dá)到最大化，我們能夠找到效度和信度之間最佳的平衡關(guān)系，由此而為大學(xué)英語(yǔ)測(cè)試的改革實(shí)踐提供一些參考性建議。



關(guān)鍵詞：英語(yǔ)測(cè)試；效度；信度

1引言

據(jù)全國(guó)大學(xué)英語(yǔ)四、六級(jí)考試委員會(huì)與英國(guó)文化委員會(huì)的合作研究結(jié)果認(rèn)為：CET4和CET6(簡(jiǎn)稱)是一項(xiàng)信度極高的考試，每次考試客觀題的內(nèi)部信度都達(dá)0.9以上;效度相當(dāng)高，回收問卷中有92%的教師認(rèn)為CET能反映學(xué)生的實(shí)際英語(yǔ)水平。筆者以為這里所指的信度和效度的界定很模糊，就某次具體的測(cè)試而言，信度和效度是受特定條件限制的，不可能是絕對(duì)的。迄今為止，我國(guó)的高考、研究生入學(xué)考試、公共英語(yǔ)等級(jí)考試(PET)，包括CET等大規(guī)模英語(yǔ)測(cè)試還是以客觀性題型為主，主觀題只占10%或20%左右。就評(píng)分方法而言，因客觀性試題答案的唯一性，可用機(jī)器閱卷，從而保證了測(cè)試結(jié)果的客觀性和一致性，無(wú)疑具有相對(duì)較高的信度，但不足之處就是效度難以保證。同時(shí)大量采用主觀性、直接性試題的測(cè)試在閱卷信度上也令人懷疑。這樣的困惑總是或多或少存地在于考試的開發(fā)、設(shè)計(jì)和評(píng)估過程中。

我們能否使信度和效度同時(shí)最大化呢？信度和效度又應(yīng)如何整合而達(dá)到適當(dāng)?shù)?appropriate)平衡？Bachman和Palmer在其測(cè)試?yán)碚撝姓J(rèn)為可設(shè)置“可接受的最低程度”(minimumacceptablelevel)的效度或信度等質(zhì)量指標(biāo)從而使得語(yǔ)言測(cè)試的“效用性”(usefulness)原則中各特征之間達(dá)到適度平衡。由于測(cè)試總是在一定的價(jià)值判斷、測(cè)試目標(biāo)、社會(huì)環(huán)境等約束條件下進(jìn)行的，本文嘗試探索在可行性條件下，測(cè)試的總效用(overallusefulness)最大化時(shí)效度和信度之間可能存在的關(guān)系。

2效度和信度的基本概念及特點(diǎn)

如果我們想闡釋一次特定的考試成績(jī)是否正確反映了學(xué)生的語(yǔ)言能力，那么在設(shè)計(jì)和使用測(cè)試時(shí)，信度和效度是我們首要關(guān)注的特征。Bachman把信度定義為“測(cè)試的一致性”(consistencyofmeasurement)。簡(jiǎn)言之，就是測(cè)試結(jié)果的可信度、可靠度。例如，我們可以這樣來檢驗(yàn)測(cè)試的信度：使用同樣一份試卷，在兩種不同的場(chǎng)合、環(huán)境中，在較短的時(shí)間間隔內(nèi)，施與同樣的學(xué)生，如果測(cè)試結(jié)果基本吻合，那么證明該測(cè)試是有信度的。一份試卷的測(cè)試結(jié)果如果缺乏信度，就沒有使用價(jià)值，同時(shí)也減弱了考試的公正性。當(dāng)然，要完全消除不一致性(inconsistency)也是不可能的，我們能做的是盡量把影響不一致性的不利因素控制在最低程度，以便于提高測(cè)試信度。

信度所涉及的問題是個(gè)體測(cè)試成績(jī)?cè)诙啻蟪潭壬鲜怯蓽y(cè)試誤差或其它因素所影響的。效度所關(guān)注的問題是個(gè)體測(cè)試成績(jī)?cè)诙啻蟪潭壬虾蛡€(gè)體語(yǔ)言能力相關(guān)。因而，我們研究信度的目的是使測(cè)試誤差造成的影響最小化，研究效度旨在使我們想要檢測(cè)的語(yǔ)言能力的效果最大化，它們是兩個(gè)相互補(bǔ)充的目標(biāo)。一項(xiàng)測(cè)試若沒有信度，也就無(wú)所謂效度。信度是效度的前提或必要條件。權(quán)衡信度和效度，效度是首要的。然而Underhill和Heaton指出信度和效度特征在本質(zhì)上是互相沖突的。測(cè)試效度較高的試題有時(shí)測(cè)試信度較低。反之，測(cè)試信度較高的試題有時(shí)測(cè)試效度較低。Morrow也認(rèn)為想把測(cè)試任務(wù)設(shè)計(jì)得既具有可信性又具有真實(shí)性不可能的。Hughes卻說雖然測(cè)試的各種特征相互排斥，但是這并不意味著我們可以完全放棄這些特征。

3對(duì)信度和效度在理論上能達(dá)到適當(dāng)平衡的可行性研究

評(píng)價(jià)英語(yǔ)測(cè)試最重要的原則是總效用性(overallusefulness)。Bachman和Palmer(1996:18)把某一特定測(cè)試的“總效用性”看作是由六個(gè)因素構(gòu)成的，即效用性(Usefulness)=信度(Reliability)+構(gòu)想效度(Constructvalidity)+真實(shí)性(Authenticity)+互動(dòng)性(Interactiveness)+沖擊力(Impact)+適用性(Practicality)。這里需要說明的是：Bachman和Palmer之所以把“構(gòu)想效度”作為“效用性”六大特征之一，是因?yàn)闃?gòu)想效度(上節(jié)已提到)關(guān)系到我們根據(jù)測(cè)試成績(jī)所作的解釋的意義性和適切性。前五者均與測(cè)試成績(jī)的使用有關(guān)，而“適用性”與測(cè)試的方法有關(guān)，能夠在很大程度上決定測(cè)試的可行性。評(píng)價(jià)一次考試是否有效用需要綜合考察這些因素，在它們之間尋求最佳的平衡點(diǎn)，而這一平衡能否實(shí)現(xiàn)取決于適用性的大小。對(duì)于大規(guī)?？荚?，考試策劃者需在試卷設(shè)計(jì)和考試任務(wù)設(shè)置時(shí)重點(diǎn)考慮信度和效度，而對(duì)于一般學(xué)校考試，教師就應(yīng)多考慮考試任務(wù)的真實(shí)性、互動(dòng)性和對(duì)教學(xué)的沖擊力(或稱后效作用)。

4在英語(yǔ)測(cè)試實(shí)踐中把握好信度和效度的平衡關(guān)系

以上已經(jīng)大致證明：信度和效度作為評(píng)估測(cè)試質(zhì)量的兩個(gè)基本特性，兩者雖然在一定程度上是相互矛盾的，但完全可以通過相互協(xié)調(diào)使之達(dá)到適切的平衡，以保證測(cè)試的總效用性最大化。這一結(jié)論給我們的啟示是：在英語(yǔ)測(cè)試的設(shè)計(jì)和命題過程中，不能絕對(duì)、片面、盲目地追求或強(qiáng)調(diào)某一方面而以失去另一方面為代價(jià)，只有綜合平衡二者的關(guān)系才能獲得最大的總效用。

4.1考試內(nèi)容能否體現(xiàn)新的語(yǔ)言教學(xué)觀

語(yǔ)言測(cè)試隨著語(yǔ)言觀的發(fā)展而發(fā)展，也隨著教學(xué)理念、教學(xué)模式的更新而更新。八十年代中期開始流行的交際功能觀和九十年代以后興起的任務(wù)教學(xué)法(task-basedlanguageteachingapproach)都對(duì)語(yǔ)言測(cè)試的改革提出了新的要求。現(xiàn)行的四、六級(jí)考試題型還是以結(jié)構(gòu)主義語(yǔ)言測(cè)試?yán)碚摓榛A(chǔ)的多選題為主，某些語(yǔ)言項(xiàng)目的測(cè)試與實(shí)際語(yǔ)言能力的相關(guān)性不高，很難體現(xiàn)當(dāng)代語(yǔ)言教學(xué)觀提倡的英語(yǔ)交際運(yùn)用能力方面的考查。Bachman和Palmer(1996)也強(qiáng)調(diào)測(cè)試任務(wù)和目標(biāo)語(yǔ)使用任務(wù)(target-languageusetask)的一致性?？磥砀镄翪ET的試卷結(jié)構(gòu)、題型設(shè)置是關(guān)鍵。為了提高考試的效度，可以通過調(diào)整主觀題和客觀題的比例(3:2或1:1)，多采用直接測(cè)試法，增加聽力和寫作測(cè)試的權(quán)重，加大口試考核力度并設(shè)最低分，變化題型等手段。也可通過采取大題量小分值，細(xì)化評(píng)分標(biāo)準(zhǔn)，綜合使用整體評(píng)分法(holisticgrading)和分析評(píng)分法(analyticmarking)等措施來提高考試信度。

4.2能否產(chǎn)生正面反撥效應(yīng)

測(cè)試是教和學(xué)的導(dǎo)向。問題是如何提高測(cè)試的正面反撥效應(yīng)，減少負(fù)面反撥效應(yīng)。四、六級(jí)考試長(zhǎng)期以來采用固定不變的模式，客觀上造成了學(xué)生猜題、押題，教師偏向應(yīng)試教學(xué)，產(chǎn)生了不良的教學(xué)效果。Hughes提出了若干提高正面反撥效應(yīng)的建議：測(cè)試要培養(yǎng)能力;測(cè)試內(nèi)容要覆蓋面廣并具有一定的不可預(yù)測(cè)性;盡量使用直接測(cè)試法；成績(jī)測(cè)試要與教學(xué)目標(biāo)相結(jié)合，使用尺度參照等。這些建議多數(shù)涉及效度，也與信度相關(guān)。信度和效度是影響反撥效應(yīng)的重要因素，正確處理好兩者的關(guān)系能使測(cè)試產(chǎn)生積極有利的反撥效應(yīng)。

5結(jié)束語(yǔ)

測(cè)試的最終目的是服務(wù)于教學(xué)。作為教師，重視語(yǔ)言測(cè)試?yán)碚摰难芯?，掌握命題的原則，在試卷編制過程中把握好信度、效度及其它評(píng)價(jià)指標(biāo)之間最佳的平衡關(guān)系，將有利于優(yōu)化各類英語(yǔ)測(cè)試的質(zhì)量，更有效地推動(dòng)英語(yǔ)教學(xué)的發(fā)展。

參考文獻(xiàn)

［1］AmericanPsychologicalAssociation,1985,StandardsforEducationalandPsychologicalTesting［M］,Washington,DC:AmericanPsychologicalAssociation.

［2］Bachman,L.F.&A.S.Palmer,1996,LanguageTestinginPractice［M］.Oxford:OxfordUniversityPress.

［3］Weir,C.J.,1993,UnderstandingandDevelopingLanguageTests［M］.NewYork:PrenticeHall.

［4］蕭春麟，劉清華.英語(yǔ)測(cè)試教程［M］.上海：上海交通大學(xué)出版社，2001.

天天精品资源在线观看,亚洲精品在线影院,女性私人爽爽影院免费观看国产,亚洲中文字幕aⅴ天堂自拍

大學(xué)英語(yǔ)測(cè)試論文

熱門標(biāo)簽

相關(guān)文章

精品范文