前言:想要寫出一篇令人眼前一亮的文章嗎?我們特意為您整理了5篇測驗(yàn)考試總結(jié)范文,相信會為您的寫作帶來幫助,發(fā)現(xiàn)更多的寫作思路和靈感。
論文關(guān)鍵詞:項(xiàng)目反應(yīng)理論,計(jì)算機(jī)自適應(yīng)考試
1.引言
項(xiàng)目反應(yīng)理論(IRT)又稱“潛在特質(zhì)”理論,于20世紀(jì)50年代初正式成立,于20世紀(jì)60年代后期,伴隨著計(jì)算機(jī)的發(fā)展而快速發(fā)展。IRT較經(jīng)典測量理論來講,樣本獨(dú)立,可反復(fù)測量,又因?yàn)槔碚摽蚣芸茖W(xué),應(yīng)用范圍廣泛,是我國測量領(lǐng)域的熱點(diǎn)。計(jì)算機(jī)自適應(yīng)測量(CAT)是在項(xiàng)目反應(yīng)理論基礎(chǔ)上發(fā)展起來的一種新的測驗(yàn)形式。它不同于紙幣測驗(yàn),是以計(jì)算機(jī)為手段,測驗(yàn)試題的呈現(xiàn)和被試的作答是通過計(jì)算機(jī)完成,它又不同于一般計(jì)算機(jī)化測量,而是因人而異選題,根據(jù)被試能力水平自動選擇試題,及時了解被試能力水平。
2.國內(nèi)應(yīng)用研究綜述
我國著名心理學(xué)家張厚粲老師是自適應(yīng)考試的先驅(qū),她首先把IRT引入國內(nèi)。江西師大“題庫理論”組,編寫《考生智能水平的自適應(yīng)測驗(yàn)》時指出:自適應(yīng)考試可以在不損害測驗(yàn)的信效度前提下,減少試題題量,縮短測驗(yàn),提高測驗(yàn)效率。國內(nèi)最早關(guān)于編制自適應(yīng)測驗(yàn)的文獻(xiàn)是出自江西師大。他們編制的高中數(shù)學(xué)水平測驗(yàn),用于考察高中畢業(yè)生的數(shù)學(xué)智能水平。江西師大這個課題組還編制了參數(shù)估計(jì)程序和自適應(yīng)考試程序。
在計(jì)算機(jī)適應(yīng)測驗(yàn)選題策略上,2011毛秀珍,辛濤撰了全面探討,選題策略是CAT重要組成部分,關(guān)系到策略信效度,效率等。有人在Science發(fā)表文章主張謹(jǐn)慎CAT高風(fēng)險(xiǎn),原因是頻繁使用質(zhì)量較好的項(xiàng)目,會因?yàn)楸辉?ldquo;分享”而削弱了測驗(yàn)的效率,針對傳統(tǒng)的選題策略不足,2012羅芬、丁樹良、王曉慶提出了利用區(qū)間估計(jì)思想,將兩級評分推廣到多級評分以改進(jìn)最大信息量選題策略,可以有效降低測驗(yàn)長度,極大降低項(xiàng)目曝光率。制定高效并且安全的選題策略是CAT追求的目標(biāo),2011程小揚(yáng)、丁樹良、嚴(yán)深海、朱隆尹針對極大項(xiàng)信息量準(zhǔn)則(MIC)和a分層法選題策略的優(yōu)缺點(diǎn),對0-1評分下的CAT引入曝光因子的選題策略。
在我國自適應(yīng)測試的計(jì)算機(jī)軟件還是比較少,九十年代開始,全國英語四六級考試委員會,一直致力于項(xiàng)目反應(yīng)理論的研究與開發(fā)。目前IRT已成功應(yīng)用于CET分?jǐn)?shù)等值處理過程了,基于計(jì)算機(jī)自適應(yīng)測試題庫也在建設(shè)和完善中。
3.國外研究
國外對于計(jì)算機(jī)自適應(yīng)考試研究較早,計(jì)算機(jī)自適應(yīng)測驗(yàn)是從比奈的智力測驗(yàn)基礎(chǔ)上發(fā)展起來的。1971年,Lord在前人基礎(chǔ)上提出了“計(jì)算機(jī)自適應(yīng)測驗(yàn)”。美國軍方在80年代開始應(yīng)用計(jì)算機(jī)自適應(yīng)系統(tǒng)CAST(TheComputerizedAdaptiveScreenTest)。如今在美國,CAT己經(jīng)用于教育測試、職業(yè)測量、人事評測等領(lǐng)域:GRE(GraduateRecordExamination)考試、TOFEL測試、工商管理類研究生入學(xué)測試GMAT(GraduateforManagementandAdministrationTest)以及全美護(hù)士國家委員會資格測試(NurseNationalCommitteeLicenseTest)等都己經(jīng)采用了CAT測試方式。日本的職稱英語測試系統(tǒng)CASEC是普遍使用的系統(tǒng),遍布于各大公司,教育部門和政府機(jī)構(gòu)。通常CASEC測試題目不足30個,就能讓測試的結(jié)果達(dá)到90%以上,提高了測試的準(zhǔn)確率,也節(jié)約了測試時間。在歐美許多國家,CAT已成為教育測試職業(yè)測試和認(rèn)證測試的主要形式。微軟的MCSE(微軟認(rèn)證系統(tǒng)工程師)測試也采用了這一種形式。
總體來說,計(jì)算機(jī)自適應(yīng)考試系統(tǒng),在美國起步早,發(fā)展快,國外部分權(quán)威資格認(rèn)證考試都逐步采用計(jì)算機(jī)自適應(yīng)考試。
4.研究總結(jié)與展望
CAT相對傳統(tǒng)的紙筆測驗(yàn),可以施測較少項(xiàng)目就準(zhǔn)確測量被試特質(zhì),極大提高測驗(yàn)效率。目前國內(nèi)較多研究集中于CAT的選題策略上,由于測驗(yàn)的精度和安全性相互制約,如何比較,選擇最優(yōu)項(xiàng)目,有待于進(jìn)一步研究。未來研究應(yīng)進(jìn)一步提高選題策略的綜合表現(xiàn)、深入探討多級評分項(xiàng)目和認(rèn)知診斷。
我國引進(jìn)國外IRT先進(jìn)理論,堅(jiān)持獨(dú)立創(chuàng)新,應(yīng)用發(fā)展較快,但由于受IRT理論模型的局限性和我國傳統(tǒng)測試方式、教育模式等因素的影響,基于IRT理論模型的自適應(yīng)測試在我國實(shí)際教學(xué)的應(yīng)用仍處于探索階段,如何克服IRT理論模型的局限性,并結(jié)合教學(xué)的實(shí)際情況,設(shè)計(jì)出一種具有較好性能和實(shí)際可操作性的自適應(yīng)測試方法。也有待于進(jìn)一步努力。
參考文獻(xiàn)
1 羅芬,丁樹良,王曉慶,多級評分計(jì)算機(jī)化自適應(yīng)測驗(yàn)動態(tài)綜合選題策略,心理學(xué)報(bào).2012
2 毛秀珍,辛濤,計(jì)算機(jī)自適應(yīng)測驗(yàn)選題策略述評,心理科學(xué)進(jìn)展.2011年
3 程小揚(yáng),丁樹良,嚴(yán)深海,朱隆尹,引入曝光因子的計(jì)算機(jī)化自適應(yīng)測驗(yàn)選題策略,心理學(xué)報(bào).2011
4 唐小娟,丁樹良,俞宗火,計(jì)算機(jī)自適應(yīng)測驗(yàn)在認(rèn)知診斷中的應(yīng)用,心理科學(xué)進(jìn)展.2012
5 林健,閏華,武兵,計(jì)算機(jī)自適應(yīng)考試?yán)碚摲治?太原理工大學(xué)學(xué)報(bào),2004,35(2):222一223
6 曾彥鈞, 張雅媛, 郭伯臣.基于知識結(jié)構(gòu)之適性診斷測驗(yàn)系統(tǒng)的防猜選題策略.測驗(yàn)統(tǒng)計(jì)年刊.2006
一、編制化學(xué)試卷的基本要求
(1)考核內(nèi)容覆蓋全面,考核點(diǎn)分布合理,各種內(nèi)容比例適當(dāng),符合化學(xué)學(xué)科特點(diǎn),有較好的代表性,又突出重點(diǎn),注意聯(lián)系社會和生活實(shí)際。
(2)考核深度符合大綱規(guī)定,沒有過難、過易題,總體難度中等,使學(xué)習(xí)達(dá)到規(guī)定要求者都能取得合格成績。
(3)題量適當(dāng),既能保證試題覆蓋率和信度、效度要求,又能(在難度測驗(yàn)情況下)使考生有足夠的解答時間。
(4)各試題之間相互獨(dú)立,不相互提供答案或暗示。
(5)編排合理、同類型試題集中編排并冠以扼要的指導(dǎo)語,說明解答的要求和方式。在各類試題中盡量按照先易后難順序排列。解答各題需要的原子量等數(shù)據(jù)資料可集中提示,避免零亂散雜。
二、編制化學(xué)試卷的一般程序
(一)進(jìn)行總體構(gòu)思
總體構(gòu)思包括明確考試的目的(為什么考)和性質(zhì):是期前預(yù)備性(摸底、預(yù)測、分組)的,或者是期中形成性(診斷,激勵)的,還是期末總結(jié)性(評定)的,根據(jù)考試目的確定考試的內(nèi)容范圍和要求(合格標(biāo)準(zhǔn));確定考試的方法(口試、筆試還是操作法)和類型(是常模對照測驗(yàn),還是目標(biāo)對照測驗(yàn),是客觀型測驗(yàn)、論說型測驗(yàn),還是實(shí)踐型測驗(yàn),是個別測驗(yàn),還是集體測驗(yàn),等等)
(二)擬訂編制計(jì)劃
編制計(jì)劃是試卷的設(shè)計(jì)藍(lán)圖,是編選試題的依據(jù),它跟試題取樣的代表性和誤差大小有著密切的關(guān)系,對命題的科學(xué)性有著重要的影響。
試卷編制計(jì)劃主要包括兩部分內(nèi)容:一部分是試題編選和試卷編制的原則要求,具體說明考試的目標(biāo)、內(nèi)容范圍、方法、試題類型以及編選試題和編制試卷的具體要求等。另一部分是試題內(nèi)容和層次的分布規(guī)定,常常以雙向表格形式出現(xiàn)。
在擬定編題計(jì)劃時,還要根據(jù)題目的內(nèi)容、層次等因素確定適宜的題目形式。這樣,雙向細(xì)目表不但可以表明每一內(nèi)容層次的分?jǐn)?shù)比例,還可以表示相應(yīng)的題目形式和數(shù)量。
擬訂雙向細(xì)目表時,要注意層次分類合理、比例恰當(dāng)。布盧姆認(rèn)為,按照他對認(rèn)識領(lǐng)域目標(biāo)的分類,各層次適宜的比例為:知識占15%,領(lǐng)會占25%,運(yùn)用占30%,分析占15%,綜合占10%,評價(jià)占5%。我國較多的人認(rèn)為,前三個層次共應(yīng)占60%~70%,分析、綜合可占30%~40%,評價(jià)則占0%~10%。實(shí)際上,在測驗(yàn)編制時,可以有小的偏離。
(三)編選和審查試題
試題要避免跟教科書和復(fù)習(xí)資料中的習(xí)題相同,避免重復(fù)使用。在可能時,應(yīng)盡量自編,力求新穎(參見《怎樣編制化學(xué)習(xí)題和化學(xué)試題》)
試題審查的主要內(nèi)容是:是否符合考試的目的和性質(zhì)?內(nèi)容范圍和層次分布是否符合編制計(jì)劃?有沒有科學(xué)性錯誤?題文是否完整、明確、簡練、不會影響學(xué)生正常地解答?是不是跟教科書和復(fù)習(xí)資料中的習(xí)題雷同?有沒有互相暗示答案等等。審查結(jié)果大體上有4種情況:①完全合格,通過審查;②大體合格,最好稍作修改;③部分合格,必須修改;④不合格,必須淘汰。
最初入圍的試題數(shù)量應(yīng)多于編題計(jì)劃,以利篩選和編制復(fù)份。
(四)組編試卷
組編試卷工作包括
(1)選定題目;選定題目除要以編制計(jì)劃為依據(jù)外,還要考慮難度要求和區(qū)分度要求、考試時間、實(shí)驗(yàn)題的操作實(shí)施條件等。
(2)排序、編號;①把題型相同的集中編排,由簡單題型到復(fù)雜題型;②同一題型中,由易到難,由低層次到高層次,內(nèi)容相近的可相對集中;③全部試題依次統(tǒng)一編號,避免在同一試卷中出現(xiàn)相同的題號。
(3)編寫指導(dǎo)語、數(shù)據(jù)表;指導(dǎo)語應(yīng)簡明扼要地說明答題的方式、要求、分?jǐn)?shù)比例和評分辦法以及測驗(yàn)?zāi)康模瑫r間限制等。全卷指導(dǎo)語應(yīng)跟各題指導(dǎo)語分開編寫。數(shù)據(jù)表應(yīng)限定為解題必需的原子量等數(shù)據(jù),并且不得對任一題的解答直接提供答案或者有暗示作用。數(shù)據(jù)表可以集中放在卷首,也可以按題分設(shè),以方便查找和篇幅緊湊為原則。
(4)版面設(shè)計(jì);①試題之間應(yīng)留有必要的間隔;一道試題的題文應(yīng)排在一起,不要分頁。②要留有足夠的作答位置并且明確指示,也可以另外設(shè)計(jì)分離的答題紙。選擇題的題干與備選項(xiàng)不要排在一行,各備選項(xiàng)之間有必要的間隔填充題的各空格長度應(yīng)基本相同,以免暗示或誤導(dǎo)學(xué)生。③設(shè)計(jì)記分表,以便集中填寫各題得分。④設(shè)計(jì)填寫考生個人資料(姓名,班級等)的位置。⑤標(biāo)明考試名稱和時間。⑥力求美觀、緊湊,格式規(guī)范和統(tǒng)一。
(五)試做、復(fù)核、調(diào)整,編制標(biāo)準(zhǔn)答案和評分標(biāo)準(zhǔn)
試卷組編完成后,教師應(yīng)進(jìn)行試做,對試題和試卷細(xì)致地進(jìn)行檢查,并且對照考試大綱和編制計(jì)劃細(xì)致地進(jìn)行復(fù)核,針對內(nèi)容不當(dāng)、比例不當(dāng)、難度不當(dāng)或者時間過緊過松等情況作出適當(dāng)?shù)恼{(diào)整。
試卷復(fù)核、調(diào)整完成后,及時編制標(biāo)準(zhǔn)答案和評分標(biāo)準(zhǔn)。評分標(biāo)準(zhǔn)應(yīng)該利于反映考核目標(biāo)水平,根據(jù)學(xué)生的實(shí)際情況,充分估計(jì)到各種可能性,并符合編制計(jì)劃對題分的規(guī)定。
(六)編制復(fù)份
試卷常常要編制復(fù)份。復(fù)份應(yīng)該具有相同的內(nèi)容、水平、結(jié)構(gòu)以及題量、難度和區(qū)分度,即是等價(jià)的,但題目不應(yīng)重復(fù)。
編制等價(jià)復(fù)份比較困難,解決辦法最好是利用各試題的復(fù)份,也可以把所有采用的試題按難度由小到大順序編號,再按下面所示方式分組,分別編成若干份復(fù)份:
試題編號 1 2 3 4 5 6 7 8 9 10 11 12…
復(fù)份卷號 A B B A A B B A A B B A…
或
在學(xué)校教育中,定期評定學(xué)生學(xué)業(yè)成績,是教學(xué)工作的重要組成部分。過去受到“應(yīng)試教育”的思想影響,對于學(xué)生的數(shù)學(xué)成績往往只看考試的卷面分?jǐn)?shù),這種“只見分?jǐn)?shù)不見人”的做法,在“素質(zhì)教育”的要求下,已開始在轉(zhuǎn)變。為了做好這項(xiàng)十分重要的工作,聯(lián)想到與這項(xiàng)工作有關(guān)的許多名詞、術(shù)語。諸如,國家教委1992年頒布的小學(xué)初中課程計(jì)劃(試行)中第三部分叫做“考試考查”,上海中小學(xué)課程教材改革委員會1991年印發(fā)的數(shù)學(xué)學(xué)科課程標(biāo)準(zhǔn)(草案)中第七部分叫做“教學(xué)評價(jià)和成績核定”。而有些教育理論書上又稱為“學(xué)習(xí)的評定”,有些教育辭書上則稱作“學(xué)業(yè)成績考查與評定”,還有通常說的“測驗(yàn)”等等。因此,需要對于這些名詞、術(shù)語的各自含意及相互關(guān)系,作一些粗略的界定,才有利于做好這項(xiàng)工作。
從學(xué)校教育的宗旨是為國家培養(yǎng)高素質(zhì)的人才來看,要有一定的質(zhì)量要求,需要定期考核學(xué)生在德、智、體諸方面的發(fā)展與進(jìn)步。因此,學(xué)業(yè)成績評定應(yīng)是一個大概念,而考試、考查、測驗(yàn)僅僅是評定學(xué)生學(xué)業(yè)成績的一切手段。考試、測驗(yàn)著眼于客觀、正確地把學(xué)生達(dá)到教學(xué)目標(biāo)的程度加以量化,學(xué)業(yè)成績評定從測試的結(jié)果有多大價(jià)值為著眼點(diǎn),這兩者往往結(jié)合在一起使用。
學(xué)業(yè)成績評定的含義,通常是指學(xué)校根據(jù)一定的標(biāo)準(zhǔn),拿數(shù)學(xué)學(xué)科來說,則以教學(xué)大綱、教材的教學(xué)要求為標(biāo)準(zhǔn),對教學(xué)過程中學(xué)生所產(chǎn)生或者即將產(chǎn)生的思想、學(xué)業(yè)、行動和個性等方面的變化,或者變化的發(fā)展趨勢,作出恰如其人的估價(jià)。通過這樣的評價(jià),既能反饋教師的教學(xué)效果,起到診斷、調(diào)節(jié)和強(qiáng)化的作用;又能反饋學(xué)生的學(xué)業(yè)進(jìn)展,起到激發(fā)學(xué)習(xí)積極性,增強(qiáng)自信心,萌發(fā)學(xué)習(xí)成功的感受等效應(yīng),促使學(xué)生整體素質(zhì)的提高。
考試、考查和測驗(yàn),其功能都是檢查學(xué)習(xí)成績和教學(xué)效果的測定方法,是測量的數(shù)量化分析和科學(xué)推斷的手段。現(xiàn)行的課程計(jì)劃規(guī)定考試以每學(xué)期進(jìn)行一次為宜,考查著重在平時進(jìn)行。上海的課程標(biāo)準(zhǔn)規(guī)定小學(xué)數(shù)學(xué)學(xué)科對一、二年級只進(jìn)行日常性考查,三年級起采用日常性考查和考試相結(jié)合的方式,而日常性考查應(yīng)包括認(rèn)知、情感和操作三個領(lǐng)域。考試則以認(rèn)知領(lǐng)域的教學(xué)要求為主要依據(jù),采用命題解答的方式。由此可知,考試與考查的區(qū)別有三:其一是考試以認(rèn)知領(lǐng)域?yàn)橹鳎疾檫€包括情感和操作領(lǐng)域;其二是考試每學(xué)期進(jìn)行一次,考查則不限于每學(xué)期進(jìn)行幾次;其三是考試可用百分制記分,考查采用等第制,例如,用優(yōu)良、及格、不及格來表達(dá),或者用A、B、C三個等級。至于測驗(yàn)的含義跟考查是相似的(在英文里都叫test),習(xí)慣上將考查用于學(xué)生學(xué)習(xí)成績的檢查,而測驗(yàn)使用的范圍較廣,如,智力測驗(yàn)、能力測驗(yàn)、個別測驗(yàn)、目標(biāo)參照測驗(yàn)、常模參照測驗(yàn),以及潛力參照測驗(yàn)等等。
二、成績評定的分類和目標(biāo)
布盧姆(Bloom.B.S)把評定分為三類:一是配置性評定,二是形成性評定,三是總結(jié)性評定。這樣的分類在我國的教學(xué)實(shí)踐中早有運(yùn)用,通常稱為摸底評定、診斷評定和總結(jié)評定。
不論進(jìn)行哪一類評定,都必須具備明確的評定目標(biāo)。在這些目標(biāo)中,認(rèn)知領(lǐng)域的目標(biāo)依據(jù)教學(xué)大綱和教材,編制恰當(dāng)?shù)目碱},注意考題的有效性(效度)和可靠性(信度),有關(guān)這方面的理論和做法早有專著論述,不再重復(fù)。而情感領(lǐng)域和操作領(lǐng)域的目標(biāo),在數(shù)學(xué)學(xué)科中尚缺少研究,隨著時間的推移,必須著手實(shí)驗(yàn),俗話說“摸著石子過河”。為此,初步草擬了如下的內(nèi)容,作引玉之磚而已。
學(xué)生學(xué)習(xí)數(shù)學(xué)情感和操作評定目標(biāo)
1、掌握學(xué)習(xí)內(nèi)容的能力
A、等:能輕松、迅速地從教材中找出重點(diǎn)和關(guān)鍵,簡明扼要地講述中心內(nèi)容。
B、等:基本上能夠從教材中區(qū)分出重點(diǎn),但講述不清楚。
C、等:通常不能區(qū)分教材中的重點(diǎn),注意力往往集中在次要特征、屬性上。
2、完成基本技能的速度
A、等:完成基本學(xué)習(xí)技能(計(jì)算、繪圖、操作、實(shí)驗(yàn))的速度和正確率高于班中多數(shù)學(xué)生。
B、等:完成基本學(xué)習(xí)技能的速度和正確率等同于班中多數(shù)學(xué)生。
C、等:完成基本學(xué)習(xí)技能的速度和正確率低于班中多數(shù)學(xué)生。
3.學(xué)習(xí)態(tài)度和毅力
A、等:在整堂課上保持旺盛的精力,主動積極參與學(xué)習(xí)活動,不怕困難。
B、等:在整堂課上保持正常精力,有時不能主動參與學(xué)習(xí)活動,怕困難。
C、等:學(xué)習(xí)精力較差,注意力下降,不主動參與學(xué)習(xí),作業(yè)常出錯。
4、思維的獨(dú)立性
A等:能獨(dú)立思考,提出自己的見解;常提建議,善于補(bǔ)充同學(xué)的發(fā)言;能尋求創(chuàng)造性的解題方法。
B等:在旁人啟發(fā)下能獨(dú)立思考;能獨(dú)立完成習(xí)題,遇到困難仍然能進(jìn)行嘗試。
C等:不善于獨(dú)立思考,一遇困難就求助他人,經(jīng)常需要監(jiān)督性的幫助。
5、學(xué)習(xí)中的自我檢查
A等:有自我檢查的習(xí)慣;能主動運(yùn)用逆運(yùn)算檢查解題的正確性;會判定自己解題的合理性。
B等:能按教師或教材的要求,進(jìn)行自我檢查訂正。
C等:不愿意自我檢查,或者草率地檢查,錯誤仍然存在。
6、遵守學(xué)習(xí)紀(jì)律的自覺性
A等:認(rèn)識學(xué)習(xí)的目的性,自學(xué)維護(hù)集體紀(jì)律,表現(xiàn)出首創(chuàng)性和頑強(qiáng)性。
B等:認(rèn)識學(xué)習(xí)的目的性,基本上能遵守學(xué)習(xí)紀(jì)律,能按時完成作業(yè)。
C等:學(xué)習(xí)目的性不明確,常常不能做到集體要求,不能按時完成作業(yè)。
7、合作態(tài)度與競爭意識
A等:能主動積極參與小組討論;能幫助同學(xué);善于接受他人幫助;具有優(yōu)于他人的競爭意識。
B等:能參與小組討論,發(fā)表自己見解;不易接納他人意見;競爭意識不強(qiáng)。
C等:不主動參與小組討論,不愿意發(fā)表意見,缺乏競爭勇氣。
三、綜合評定與操作方法
綜合評定包括日常性考查和終結(jié)性考試,它們之間的關(guān)系如下:
綜合評定日常性考查認(rèn)知領(lǐng)域的單元測驗(yàn)(百分制或等第制均可)
情感與操作領(lǐng)域的目標(biāo)評定(等第制)
終結(jié)性考試(一、二年級用等第制三年級以上用百分制)
其中一、二年級可以全部采用等第制,從小淡化他們的分?jǐn)?shù)觀念,克服多年來為幾分之差而產(chǎn)生“失敗者的”心態(tài),三年級以上既有百分制又有等第制,可以兩者并用,即某一個學(xué)生既有終結(jié)考試的分?jǐn)?shù),又有情感、操作領(lǐng)域目標(biāo)評定的等第。也可以自定比例折合成分?jǐn)?shù)進(jìn)行綜合評定。例如,上海的課程標(biāo)準(zhǔn)就采用日常性考查占50%,其中考試占20%,期末考試占30%的權(quán)重進(jìn)行總評,用百分制的分?jǐn)?shù)表達(dá),必要時可附加評語。又規(guī)定日常考查中的等第,可按優(yōu)良為85分、及格為65分、不及格為45分折合成分?jǐn)?shù)。當(dāng)然,這只是一個地區(qū)制定的標(biāo)準(zhǔn),各地各校也可以根據(jù)實(shí)際情況自己制定標(biāo)準(zhǔn)。總之,按素質(zhì)教育的要求,不僅要評定考試分?jǐn)?shù),更要重視評定學(xué)生學(xué)習(xí)的心理素質(zhì)和意志性格。
考試評分是大家比較熟悉而又習(xí)慣的方法,對于情感、操作領(lǐng)域的目標(biāo)評定,雖有指標(biāo),畢竟模糊性較大,家長和學(xué)生應(yīng)有一個適應(yīng)的過程。為此,在具體操作上,可以廣為宣傳,讓家長和學(xué)生有所了解,宣傳的過程也是一種教育過程,可以促使每個學(xué)生積極向上爭取達(dá)到優(yōu)良(或A等),使這一改革措施起到各級作用。
四、考試命題的導(dǎo)向作用
人們常說“考試題目是指揮棒”,這個說法不無道理,只要考試還存在,就會有人把考題當(dāng)作“指揮棒”,也就是你考什么,我就教什么、練什么,甚至演變成“追題族”,短時期內(nèi)恐難改變。為此,要十分注意考題的導(dǎo)向性。
其一,不是課本上有什么就考什么,還要依據(jù)教學(xué)大綱的要求。例如,四則運(yùn)算的計(jì)算法則,課本上都有。因此有人在考題里編制一個填充題,讓學(xué)生把法則填寫完整,這就是引導(dǎo)學(xué)生去背誦、默寫計(jì)算法則,這是一個導(dǎo)向問題。數(shù)的四則運(yùn)算只要求會正確計(jì)算就行了,至于計(jì)算法則只是計(jì)算中的一種操作流程,況且操作方法很多,課本上講的只是其中的一種,要求學(xué)生去背誦法則,只能使他們頭腦僵化,不符合數(shù)學(xué)教學(xué)的目的。又如,按應(yīng)用題的數(shù)量關(guān)系繪制線段圖,也是課本上常見的,考題中不宜要求學(xué)生繪制線段圖,教學(xué)大綱也無此要求。線段圖只是幫助學(xué)生分析數(shù)量之間的關(guān)系,是解題的手段和工具,不是教學(xué)的目的。
此外,現(xiàn)行的數(shù)學(xué)課本中還編選了一些選學(xué)題、思考題、按大綱規(guī)定不是不作考試要求的,也不能編進(jìn)考試題。
研究的進(jìn)展不大,學(xué)科的成熟度不高,與我國廣泛開展的教育評價(jià)活動很不適應(yīng).我國各省市都有考試院(中心),也成立了許多評估、評價(jià)機(jī)構(gòu),廣泛展開了對教育測評估評價(jià)活動。而與此相應(yīng)的教育測驗(yàn)、教育統(tǒng)計(jì)、教育測量、教育評估、教育評價(jià)理論很不成熟.尤其值得重視的是教育評價(jià)與教育研究和發(fā)展,以及對教育評價(jià)實(shí)踐的指導(dǎo).鑒于此,本文對與教育評價(jià)相關(guān)概念進(jìn)行簡述和辨析.
一.關(guān)于教育評價(jià)相關(guān)概念簡述
教育測驗(yàn):即為考試,它是對人的知識、技能和能力以及某些心理特征的測量。考試是教育評價(jià)的一種手段。考試是個系統(tǒng),它由主考、
被考(考生)、試卷(試題的集合及其評分標(biāo)準(zhǔn))、考分四要素組成。考試的過程就是主考組織編制試題,通過試題作用于被考,將正確答案、評分標(biāo)準(zhǔn)與被考的反應(yīng)(答案)相比較,然后給出考分的過程。考試從宏觀上可分為社會考試和教育考試兩大類。教育考試又可分為校內(nèi)考試和校外考試兩類。按考試分?jǐn)?shù)的解釋與使用,可分為常模參照性考試和標(biāo)準(zhǔn)參照性考試。按考試對象分,有學(xué)業(yè)的成就考試、學(xué)術(shù)能力傾向測驗(yàn)(其目的在于測量考生學(xué)習(xí)的潛在能力、發(fā)展傾向,如音樂能力傾向測量)、人格測驗(yàn)(如測量態(tài)度、興趣、情緒、性格等).按測驗(yàn)人數(shù)分,有個別測驗(yàn)、團(tuán)體測量.接測驗(yàn)方式分,有紙筆測驗(yàn)(用筆時試卷作答)和非紙筆測驗(yàn)(如口試、實(shí)驗(yàn)操作、表演等)。其它可分為難度測驗(yàn)、速度測驗(yàn)、總結(jié)性測驗(yàn)、診斷性測驗(yàn)以及大規(guī)模測驗(yàn)(其成績的使用有權(quán)威性,要求嚴(yán)格,標(biāo)準(zhǔn)化程度高)、教師自編測驗(yàn)(即教師自編用于課堂教學(xué)的測驗(yàn))等.[1]
教育統(tǒng)計(jì)(學(xué)):運(yùn)用數(shù)理統(tǒng)計(jì)學(xué)的原理和方法研究教育現(xiàn)象中的數(shù)量關(guān)系的一門應(yīng)用學(xué)科。它通過數(shù)據(jù)的分析和處理,準(zhǔn)確地掌握教育
情況,為制定教育方針、政策提供科學(xué)依據(jù),為開展教育科學(xué)研究,探索教育規(guī)律,制定教育方案,檢查教育效率提供科學(xué)方法,也為教育管理和教育評價(jià)提供有效的工具.它分為兩大類:一是描述統(tǒng)計(jì)學(xué),研究簡縮數(shù)據(jù)和描述這些數(shù)據(jù),二是推斷統(tǒng)計(jì)學(xué),用數(shù)據(jù)進(jìn)行統(tǒng)計(jì)檢驗(yàn),統(tǒng)計(jì)分析和非參數(shù)統(tǒng)計(jì)法作出決策。前者只是分析某一樣本的特點(diǎn),而后者則是通過抽取母體的一個樣本,并以此樣本為根據(jù)來分析母體的特點(diǎn).它是在教育問題的研究中,描述樣本,分析樣本,分析樣本與總體的關(guān)系,從而進(jìn)行教育科學(xué)推論的一種原理和方法.其研究方法一般有:大量觀察法、統(tǒng)計(jì)分組法、綜合指標(biāo)計(jì)算法、統(tǒng)計(jì)資料檢驗(yàn)法、統(tǒng)計(jì)資料圖示等。[2]
教育測量(學(xué)):研究如何測量學(xué)生的學(xué)業(yè)成績、學(xué)習(xí)能力、興趣愛好、思想品德以及教育效益等問題的一門教育學(xué)科。它運(yùn)用各種測量
手段和數(shù)理統(tǒng)計(jì)方法等數(shù)學(xué)工具,根據(jù)教育目標(biāo)或教學(xué)計(jì)劃的要求,研究如何測量和評價(jià)教育效果,如何編制測量計(jì)劃,各種類型試題的優(yōu)缺點(diǎn),衡量一個學(xué)業(yè)成績測驗(yàn)好壞的數(shù)量指標(biāo),如何進(jìn)行測驗(yàn)結(jié)果的統(tǒng)計(jì)分析,測驗(yàn)分?jǐn)?shù)的解釋和評價(jià)等.其主要內(nèi)容包括:測量原理、項(xiàng)目分析、效度、信度、標(biāo)準(zhǔn)化測驗(yàn)、測驗(yàn)的設(shè)計(jì)和編制、測驗(yàn)的常模、測驗(yàn)的實(shí)施和評分、測驗(yàn)結(jié)果的解釋等。[3]
教育評估:是一種有系統(tǒng)地去尋找并搜集資料,對評估對象作預(yù)測性、估計(jì)性的評判,以便協(xié)助教育決策者從若干種可行的策略中擇一而
行的過程.在我國教育評估與教育評價(jià)不作嚴(yán)格區(qū)別,在實(shí)踐中具體運(yùn)用時,不同的范圍和場合有不同的習(xí)慣用法.如高等教育中多用評估,在督導(dǎo)部門也稱督導(dǎo)評估,而在普通教育領(lǐng)域多用教育評價(jià)不過兩個概念是有一定區(qū)別的.評估有估價(jià)的含義,較為模糊粗略,而評價(jià)相對而言是較為精確的價(jià)值判斷,評估多用于群體或單位的狀態(tài)及效果的估價(jià),而評價(jià)則既有對群體和單位的價(jià)值判斷,也有對個人的判斷.教育評估的一個重要目的就是為教育決策提供重要依據(jù),國家教育管理部門要根據(jù)教育評估的結(jié)果,及時調(diào)整教育的決策。教育評估的結(jié)果對國家、對學(xué)校都是一份咨詢材料,而不是行動綱領(lǐng).[4]
教育評價(jià)(學(xué)):以教育為對象,研究各類教育目標(biāo)與相應(yīng)的教育現(xiàn)象之間的關(guān)系,并給予一定的價(jià)值判斷的學(xué)科.它的研究范圍可劃分
為:宏觀教育評價(jià)(研究教育思想評價(jià)和教育制度評價(jià))和微觀教育評價(jià)(研究學(xué)校教育系統(tǒng)內(nèi)部各類教育思想和教育活動的評價(jià),如學(xué)校辦學(xué)思想、學(xué)校領(lǐng)導(dǎo)管理質(zhì)量、教師教育和教學(xué)質(zhì)量、學(xué)生德智體全面發(fā)展質(zhì)量的評價(jià)等)。它的基本范疇是:教育評價(jià)的對象,教育評價(jià)的范圍,教育評價(jià)的模式,教育質(zhì)的規(guī)定性評價(jià),教育量的規(guī)定性的評價(jià),教育質(zhì)和量變化的度的評價(jià),教育評價(jià)的指標(biāo)體系,教育評價(jià)的類型.其研究的基本原則有:客觀性原則、理論聯(lián)系實(shí)際原則、發(fā)展性原則和聯(lián)系性原則.其種類包括目標(biāo)評價(jià)、過程評價(jià)、條件評價(jià)、貢獻(xiàn)評價(jià)等.[5]
教育評價(jià)(學(xué)):教育評論學(xué)是研究教育評論現(xiàn)象和教育評論活動規(guī)律的科學(xué).或者說它是研究教育評論的歷史、現(xiàn)狀,教育評論現(xiàn)象的
本質(zhì)聯(lián)系,教育評論工作的性質(zhì)、任務(wù)和作用,以及教育評論工作的原則、方法的科學(xué).教育評論學(xué)是與教育理論、教育史并列的一門教育學(xué)科.要建立教育評論學(xué)的學(xué)科體系,必須解決兩大難題,即建立教育評論學(xué)的范疇體系和概念體系,并給予科學(xué)的揭示和闡述,使這些概念和范疇形成一個有機(jī)整體.同時,還要運(yùn)用這些概念、范疇及其所固有的內(nèi)在聯(lián)系,采取科學(xué)的方法論證教育評論活動中最普通、最一般的科學(xué)原理;從而揭示出整個教育評論活動及其形成和發(fā)展的基本規(guī)律。教育評論學(xué)的研究對象和任務(wù),從根本上規(guī)定了教育評論學(xué)的學(xué)科性質(zhì)和范疇.首先,教育評論活動是一種教育科研活動,它的直接結(jié)果是鑒別、評判教育文化的優(yōu)劣,進(jìn)而對教育界產(chǎn)生社會輿論導(dǎo)向作用;而教育文化本身及其所產(chǎn)生的依附于受教育者身心的精神產(chǎn)品,都屬于饈緞翁凍耄杉逃纜奐沂粲諮芯懇饈緞翁徒沂窘逃纜芻疃謀局使媛桑⑼暾慕逃纜堊аЭ鋪逑怠K裕逃纜堊б彩粲諢±礪堊Э啤T俅危逃纜堊У難芯慷韻缶齠私逃纜堊婕罷黿逃煊潁諍址岣弧R部紗硬煌詠牽攵圓煌凍虢⒍嗖棵擰⒍嗖憒蔚姆種аЭ疲ㄈ紓航逃礪燮纜堊А⒔逃菲纜堊А⒔逃姓纜堊А⒔逃移纜堊У齲越逃纜堊в質(zhì)且幻拋酆閑緣難Э芠6]
二、關(guān)于教育評價(jià)相關(guān)概念與教育評價(jià)的關(guān)系
教育評價(jià)與教育測驗(yàn)的關(guān)系:教育測驗(yàn)是對人的知識、技能和能力以及其他某些心理特征的檢測,是教育評價(jià)的一種手段,確切地說它是
教育評價(jià)獲得評價(jià)信息的工具之一.教育評價(jià)獲取信息的測驗(yàn)法就是來自于教育測驗(yàn).
教育評價(jià)與教育統(tǒng)計(jì)的關(guān)系:教育統(tǒng)計(jì)是運(yùn)用數(shù)理統(tǒng)計(jì)的原理和方法研究教育現(xiàn)象中的數(shù)量關(guān)系,通過數(shù)據(jù)的分析和處理確切地掌握教育
情況,也是教育評價(jià)的一種手段和工具。教育評價(jià)中獲取信息的統(tǒng)計(jì)法就來自于教育統(tǒng)計(jì)。
教育評價(jià)與教育測量的關(guān)系:教育測量通過對學(xué)生知識的掌握、智能的發(fā)展、思想品德的變化、體質(zhì)的狀況以及教育活動的各個方面的測
定,為教育評價(jià)提供依據(jù),是教育評價(jià)信息的主要來源.如果沒有教育測量提供的資料,教育評價(jià)將成為無源之水,失去了作價(jià)值判斷的依據(jù),其科學(xué)性、準(zhǔn)確性便無從談起。另外,教育測量的結(jié)果只有通過教育評價(jià)才能獲得實(shí)際意義,成為改進(jìn)教育工作有參考價(jià)值的信息.[7]
教育評價(jià)與教育評估的關(guān)系:教育評價(jià)與教育評估是非常相近的兩個概念,在許多場合是通用的。評價(jià)是精確的價(jià)值判斷;而評估是估計(jì)
的、預(yù)測性的價(jià)值判斷。在我國從政府的文件到學(xué)者的文章論著,以及教育實(shí)踐都把評估與評價(jià)混用。我個人傾向于把教育評估的對象限定在以宏觀、中觀的復(fù)雜教育系統(tǒng)的戰(zhàn)略性、預(yù)測性估價(jià)方面,對于微觀的較簡單的教育系統(tǒng)的過去和現(xiàn)存實(shí)態(tài)則作為教育評價(jià)的對象。
教育評價(jià)與教育評論的關(guān)系:教育評論是對教育文化的反思和展望,它的對象是以教育文化中的精神文化和制度文化為主的,以真善美作
為評論標(biāo)準(zhǔn)的觀念活動。嚴(yán)格講它與教育評價(jià)雖只一字之差,但它與教育評價(jià)分屬于教育科學(xué)的不同領(lǐng)域,有著重大區(qū)別。比如,教育評價(jià)是一種管理活動,而教育評論則為觀念活動;教育評價(jià)由評價(jià)機(jī)構(gòu)按嚴(yán)密的程序?qū)嵤逃u論則由教育評論家個人采用靈活多樣的方式方法評述;教育評價(jià)有明確的指標(biāo)體系并要求量化,而教育評論無需指標(biāo)體系更不用量化,教育評價(jià)的對象是具體的可控的,而教育評論的對象是抽象的,不可控的;教育評價(jià)的結(jié)果多用于改進(jìn)工作,而教育評論的結(jié)果則多用于改變觀念;等等。這不是說教育評價(jià)與教育評論一點(diǎn)關(guān)系都沒有,它們的關(guān)系表現(xiàn)在教育評價(jià)的結(jié)果可以成為教育評論的論據(jù)影響教育評論,而教育評論的結(jié)果可以作為教育思想觀念影響教育評價(jià)所依據(jù)的教育價(jià)值觀。
三、從價(jià)值論角度看與教育評價(jià)相關(guān)概念的區(qū)別
唯物主義的價(jià)值論認(rèn)為,價(jià)值判斷和事實(shí)判斷是人們把握客觀世界和兩種不同方式。兩者反映的對象、意義和參加的心理成份都有著質(zhì)的
區(qū)別。事實(shí)判斷是以客體的本質(zhì)和規(guī)律為對象的,它探討客體“是怎樣的“、”是什么“,探討事物的現(xiàn)象、本質(zhì)和規(guī)律等實(shí)體屬性,即以理性認(rèn)識這種抽象思維形式反映客體的本質(zhì)及其規(guī)律。而價(jià)值判斷是以客體與主體需要的關(guān)系為對象,它探討客體的價(jià)值屬性,即客體的社會意義------對社會需要意味著什么,它以多種意識形式-----認(rèn)識(價(jià)值與事實(shí)判斷)、情感(對價(jià)值的態(tài)度體驗(yàn))、意志(對價(jià)值的自覺保證)等諸種形式的綜合來反映客體與主體需要的關(guān)系。
本學(xué)期快結(jié)束了,還有七天的復(fù)習(xí)時間。在這一學(xué)期,我收獲了許多,也明白了許多道理……為了這次期末考試,我要評價(jià)一下自己,讓我順利度過期末考試,迎接漫長的寒假。
作文是我的一大優(yōu)點(diǎn),自從二年級起,作文的水平就突飛猛進(jìn),好詞好句像一只只蜜蜂一涌而上,經(jīng)常受到老師的表揚(yáng)。“作文小狀元”競賽時,只要老師一選我做代表,我不是狀元就是榜眼,因此同學(xué)們在作文這一方面都敬佩我,讓我對作文更有信心。聽說這次家長會上,老師還表揚(yáng)說我作文寫得好!
在跑步方面我也有了明顯的進(jìn)步。三年級下學(xué)期時,我最高才跑了8秒7,而四年級上學(xué)期,我居然可以跑到8秒2!看來,多跑跑步對我跑步測驗(yàn)還是有效!
不過,在做數(shù)學(xué)的計(jì)算題時,我總是出錯,真是不可思議!4次測驗(yàn)有3次我失分就是失在計(jì)算題上!我最后總結(jié):我不是不細(xì)心也不是不會做,就是沒有多練。要是我計(jì)算對的話,那我的87分就可以變成92分,94分變成98分了……