http://www.nyq.cn
 当前位置:首页 -> 教学论文 -> 政治 -> 正文

高中思想政治微观考试方案研究

作者:未知来源:网络收集时间:2013-4-18 18:22:05阅读:
字号:|

  【文字:大 小】

  高中思想政治微观考试方案研究

     在基础教育课程改革的背景下,学校从单纯考试向全面评价发展是历史的必然。目前实施的高考、会考学业水平考试等大规模教育考试的考试结果都不适宜作为教育评价的依据。应该在政策上将情感、态度、价值观方面的课程目标与学科学习的知识与技能、能力与方法的目标一起纳入教育评价的范畴。我校课题组将按照规范要求,努力开发标准参照考试,开发情感、态度、价值观的评价量表。   在新一轮基础教育课程改革过程中,我们不断听到这样的呼声:高考需要改革,高考不改革素质教育无法推进。面对这些呼声,我们需要思考的问题是:如何对高考进行改革?问题的症结在哪里?   笔者认为,问题不在高考或高考制度本身,而在于我们片面地用考试代替了复杂的教育评价;用不适当的考试的信息,作为教育价值判断的依据。产生这种问题的原因是多方面的。首先,在我国传统文化中,民众相信考试,认为只有用考试结果评价学生、学校,才有公平公正可言;其次,对教育考试与教育评价的关系缺乏清晰的认识,认为教育考试就是教育评价;第三,缺乏对考试的理论认识,对考试的类型、功能以及考试信息的使用认识模糊不清,造成普遍存在的对考试结果误用;第四,教育行政机构没有设置合适的、为教育评价服务的微观考试方案,学校和教师无法利用考试和考试结果,开展教育评价。   在基础教育课程改革的大背景下,讨论微观考试推进素质教育问题,赋予微观考试教育评价的功能,从单纯考试向全面评价发展,这是我校课题组应对课程改革的必然选择。

  一、从单纯考试到全面评价是大规模教育考试发展的必然趋势   1.教育评价的基本原则要求考试向全面评价发展   教育评价是系统地、有步骤地从数量上或从性质上描述学生的学习过程与结果,据此判断学生是否达到了所期望的教育目标。大规模教育考试就是从数量上对学生学科学习结果进行评价,它是一种定量的评价,我国习惯上将其称之为考试。大规模教育考试实际上只是评价的一种方式。   教育评价长期发展确立的一项基本原则是,评价应该促进学生的健康发展,促进教师和学校的健康发展。同时,现代教育评价必须是诊断性的、分析性的;现代教育评价要求对考试的结果做出合适的解释。   从目前的情况看,我国大规模教育考试作为一种定量的评价手段,还远远没有达到教育评价的基本要求。   首先,每次高考、会考学业水平考试后,考试机构和学校通常只向考生或教师提供每个科目的考试成绩或等第,对成绩或等第的意义不做任何解释。没有将考试结果与教育评价联系起来,只是对学生做出了事实判断,不做出价值判断。考生虽然获得了各科目的考试成绩,却不理解其蕴含的意义和本质;学校即使从学生处获得考试结果,也无法做出价值判断。   其次,现在的高考、会考学业水平考试,都没有适时地向考生、学校、甚至地方教育行政部门提供必要的考试结果信息,考生无法了解本人在学科学习方面的强项和弱项,学校无法对本校各学科教学存在的问题和优势进行有针对性的分析,无法在今后的教学中采取有针对性的措施,改善教师的教学,改善学生的学习,提高学校的整体教学质量。   考试数据得不到开发,长期尘封,直接导致一些学校或教育行政部门想方设法通过各种渠道,获取本校、本地的考试结果。他们对数据的统计分析和解释难免误读误用,无法有效地促进学生发展,促进学校和教师健康的发展。   上述状况客观上要求学校和教师要适时地参与到教育评价中,对考试结果做出合理的解释,赋予考试结果意义和价值,让学校、地方教育行政部门合理、合法地获得正确的考试结果,让考试结果为学生的发展服务,为学校的教学服务,真正发挥大规模教育考试的评价功能。   2.利用考试结果对学生进行评价是国际现代教育评价的潮流用大规模考试结果评价学生、评价学校是国际教育评价的潮流。   20世纪70年代以来,国际大规模教育考试的基本潮流之一是:由只注重常模参照考试向同时注重常模参照考试和标准参照考试转变,标准参照考试的作用引起越来越多重视。   许多国家中,由国家组织的教育评价考试都是标准参照考试。例如,法国的中学会考,英国的高级普通教育证书(A-level考试)和高级补充水平普通教育证书(A/S-level)考试,澳大利亚的中学毕业考试,日本的共同学力第一次考试等。1994年,美国五十个州中,就有三十一个州采用常模参照考试,有三十三个州采用了标准参照考试。其中采用两种考试的州有二十二个。   三个方面的原因使标准参照考试逐渐受到青睐。首先,常模参照考试几乎不能向学生、家长和学校提供有用的、关于考生学习情况的信息,这是考试测量界的通识。其次,几乎所有的教育专家都认为,评价学生是否达到课程标准规定的培养目标的要求,标准参照考试是最好的形式。第三,现代学习理论认为,在合适的学校环境下,学生能够达到培养目标规定的大部分要求。   国际大规模教育考试的基本潮流之二是:注重利用标准参照考试结果对学生的学习情况做出诊断,发现学生学习的强项和弱项,向学生提供改进学习的建议;利用学生诊断结果发现学校教学中存在的薄弱环节,对学校教学提出改进建议。因此,在西方,尤其是在美国,大规模标准参照考试已经成为提高基础教育质量的基础。例如:美国著名的StanfordEnglishLanguageProficiencyTest、OhioGraduationTest、澳大利亚NewSouthWalesHigherSchoolCertificate(HSC)。   3.新课程改革要求高中思想政治微观考试向全面评价发展   我国的新一轮高中课程改革对教育评价提出了新的要求,许多学者提出:“合格的高中毕业生和高考成功是两个概念,高中教育的基本目标是前者,应把对合格的高中毕业生的发展水平的认定与高考适度分开”(钟启泉等2003),我们课题组认为应研究在继续实施国家统一招生考试的基础上,试行普通高中学校学生综合素质评价,高中学生参加省高中学业水平测试。   然而,仅仅建立一个与课程要求相适应的学业水平考试,还不是真正意义上的全面评价。学校和教师在提供学生学科学习、学科教学方面的信息的同时,也应在学生情感、态度、价值观方面的评价有所作为,后者正是新课程标准三维目标体系中的重要一维,这也将是我校舍课题组今后研究的一个重要方面,也将是从微观考试向全面评价转变的重要标志之一。

  二、实现全面评价需要使用合适的考试,创新测量量表   目前,国内教育考试界和教育行政管理机构中的有识之士提出,应该利用高考结果,向学校提供诊断信息,实现由考试向评价的转变。由此,引出了这样的问题:是否凡是大规模教育考试都可以用来诊断学生的学习和学校的教学?回答这个问题,需要了解不同类型的考试诊断评价的适用性。   大规模教育考试可以划分为两种类型———常模参照考试和标准参照考试。两种考试的目的、内容选择方式、考试结果解释各不相同。   常模参照考试的主要目的是对学生进行排序设计常模参照考试的基本出发点是考试结果能够有效地区分出考生之间的学业水平差异,并根据这个差异,从高分到低分对考生进行排序。对常模参照考试而言,关键在于建立比较的常模,每次获得考试结果后,要将考试结果等值到常模上去,与常模进行对比。像美国CaliforniaAchievementTest(CTBMcGraw-Hill)、IowaTestofBasicSkills(Riverside)MetropolitanAchievementTest(PsychologicaCorporation)等都是这样的常模参照考试。   标准参照考试的目的是要确定学生知道什么,能够做什么,而不是对学生进行相互比较。标准参照考试根据考生在课程标准确定的目标上的表现水平来评价考生。因此,标准参照考试的内容必须与课程标准的重要学习目标保持一致,以确定考生对课程目标的达成度。   这两种考试在目的、内容选择方面的差异,导致对考试结果的解释也相应存在差异。理论上常模参照考试结果是相对于常模的表现来解释的,如某个考生的百分位分数为30,则说明该考生的表现高于或好于常模组后30%的学生,这个信息并不能说明考生对课程标准规定的学习目标的达成度,也不能提供诊断性信息。相反,标准参照考试可以详细地说明考生在考试测量的学习目标上的表现水平,可以向学生、教师、学校和家长提供更多的关于学生学习状况、学校教学绩效的信息。   常模参照考试和标准参照考试的这些基本差异,是我们分析不同类型考试用于诊断评价适应性的基础。   1.用高考结果进行评价的局限性   我国的高考是一种非典型的常模参照考试,它的基本特点是:(1)命题以课程标准规定的内容领域为依据,但测量目标与课程标准规定的学习目标不完全相同;(2)试题的难度设计是为了区分考生之间学科学业的差异,不是检查考生学业是否达到标准(3)没有事先确定的常模,考试分数的解释以每次参加考试的考生群体为常模,考试分数代表的是考生在整个群体中的位次,历年考试结果不可比较。   显然,高考结果不适合对学生进行评价,其价值在于为高校招生提供分数信息,评价信息或结论对学生、学校的发展没有实质性的益处。如果一定希望利用高考结果进行评价的话,那么只能向生源情况相同或类似的学校,提供部分信息,作为诊断学校学科教学情况的参考。   2.用标准参照的学业水平考试结果进行评价   目前,我省课改实验后的中考、高中会考已转变成学业水平考试,理论上,这些考试应该都是标准参照的,可以利用考试结果,对学生进行评价,对学校的教育教学进行诊断、评价。   然而,这些考试都不能称之为合格的标准参照考试。判断一个标准参照考试是否合格有很多方面的判据,其中最重要的判据有两条。一是作为标准参照考试,应该根据测量目标以及每个测量目标相应的行为目标,确定考生在每一个测量目标上的表现水平标准。二是考试结束后,应该按照一定的程序,采取教育测量界公认的方法,设置等第划分标准。综观国内这些考试,既没有明确这三级测量标准,也没有设置等第划分标准,都是名义上的标准参照考试,实质上与常模参照考试无异。   从这个意义上来说,无法对这些考试的分数做出有意义的解释,其结果都不能作为价值判断的依据,不能用来评价学生、评价学校。考试的基本目的是对学生的学科学习、学校的学科教学、区县的学科教育进行评价。然而,实现这个目的还需要教育行政部门放手让学校和学科教师按照教育考试理论和公认的教育测量的实践,设计、实施考试。若不然,学业水平考试依旧是不合格的考试,与国际教育考试发展的现状渐行渐远。   3.探索对学生情感、态度、价值观的评价   将学生情感、态度、价值观的评价纳入微观考试评价的范畴,是学校从单纯考试向全面评价转变的重要标志,也是新课程改革一项重要的任务。学科教师要以心理测量理论为依据,开发适当的测量量表;在适合的条件下施测;采用心理测量模型对所获得数据进行处理;按照确定的科学的、符合社会政治和文化要求的、规定的程序提供信息。这样才能对学生情感、态度、价值观做出事实判断,并根据这种事实判断,诊断学校在情感、态度、价值观的教育方面的存在问题,提出对学校教育的改进意见和建议。

  三、实现全面评价需要解决的政策和技术问题   当前我省高中思想政治微观考试研究应对新课程改革,从单纯考试走向全面评价,还需要解决若干政策层面和技术层面的问题。   1.政策层面问题   (1)将高中学生情感、态度、价值观纳入测量、评价的范畴   教育行政机构要在政策层面上,允许探索学生情感、态度、价值观方面的评价;授权考试机构开发该方面的评价量表,并施测。   考虑到结果的真实性,测量结果暂时不宜用于评价学生个体,只用于评价学校学生群体和学校教育绩效。因为将测量结果评价学生个体,受利益驱动,学生应答难免失真。   评价量表的施测可以与高中学业水平考试同场进行,即在学科测试结束后,再设半个小时左右应答时间。   (2)将设计考试的职能回归考试机构   大规模教育考试是一项科学性很强的工作。教育行政机构关于考试方面如考试项目的设置,考试基本目标和结果利用的规定等的决策,应该尽可能地超前研究和预测。至于考试如何达到这些目的,即考试设计、实施、结果的处理和报告等技术问题,应该由考试机构按照教育、心理测量的原理和国际行业通行的准则进行。   目前,国内的一些会考和学业水平考试之所以不合格,一方面源于考试机构本身对考试理论和考试实践的认识不全面,另一方面也源于教育行政机构既包揽了考试的政策制定,又包揽了考试技术规定。技术方面的种种不适当的规定直接束缚了考试的设计,影响考试结果的有效性和可靠性。例如,许多教育行政机构认为学业水平考试要求低于高考,规定学业考试题量和应答时间应少于高考。其实,这样的规定是错的。从考试理论看,标准参照考试所要求的题量应该比高考更多,考试的时间也可能需要相应地增加。至于题量、考试时间应该是多少为宜,应该根据课程标准规定的内容、目标要求,通过科学的方法加以确定。   2.技术层面问题   (1)科学地设计学业水平考试   科学地设计考试是实现科学评价的前提条件。对于标准参照的高中和初中学业水平考试,应该进行科学设计。   设计标准参照考试涉及到一系列的技术问题,包括:考试的测量目标、行为目标,以及每个行为目标的表现水平标准;考试的内容领域;每个测量目标和内容领域的题量和题型以及分值比例;设计样题;试测,确定测量误差以及对试题题型和题量的调整等。解决这些技术问题需要投入相当大的人力、物力和财力。而非聘请几个老师来命制一些题目,拼凑一张试卷这么简单。   (2)科学地设置等第标准   科学地设置等第标准是正确解释标准参照考试结果,实现评价诊断的关键。早在上世纪80到90年代,国际教育测量界就推出了若干进行等第标准设置的方法,目前,这些方法已经得到普遍认可和广泛应用。我们在设计和实施学业水平考试中,应该借鉴这些等第标准设置方法,按照严格的程序,科学地划分等第。那些随意划分等第,考试分数达到总分60%就是及格的不科学做法,再也不能继续下去了   (3)考试和评价量表数据的处理和结果报告   科学地处理考试和情感、态度、价值观评价量表数据,报道测量结果是实现全面评价的保障。无论是考试分数,还是其他测量量表的结果都只是原始数据,考试机构应该用合适的数学模型对数据进行处理,获得量表分数。量表分数误差更小,蕴含的信息内涵更加准确,更加丰富,对评价更加有用。   测量结果的报告是对学生学习、学校教学进行诊断、评价的直接依据,考试机构应分别向考生个人、学校、地方教育部门提供报告。报告提供的信息应该使:(1)考生了解其本人和同学在课程标准规定的学习目标方面的达成度;学校了解本校及同类学校在学科能力培养方面存在的问题;(2)考生了解其学科每一内容领域学习状况;学校了解其学科教学方面总体状况及存在的问题;(3)考生了解其情感态度、价值观方面的发展与同学的差距,为其自我反省、自我修正提供信息;学校了解本校学生在这方面与全市、全省同类型学校学生的差异,反思对学生情感、态度、价值观教育方面的得失,对教育行为做出改进或修正。   (4)开发情感、态度、价值观的评价量表   开发情感、态度、价值观测量量表,评价学生的发展、学校教育的状况,完成此项工作才构成全面评价。这是一项创新的工作,从制定初步的评价量表到多次试测;从量表等级划分,到效度、信度的检验和分析;从形成稳定的评价量表,到用于教育评价实践。这一系列的工作应由考试机构会同高校、科研机构、基础教育学校,以科学研究的态度和方式推动。   目前,我校高中思想政治微观考试方案研究小组正借鉴国际相关学术成果,正稳步推进学业水平微观考试的设计、等第标准设置、评价报告开发,也在较深地开展情感、态度、价值观评价的研究。对从考试向全面评价的拓展,在理论和实践上进行探索。

上一篇: 高中思想政治学科学法指导三根据   下一篇: 没有,这是最后一篇!

关于本站 | 免责声明 | 业务合作 | 广告联系 | 留言建议 | 联系方式 | 网站导航 | 管理登录
闽ICP备05030710号