但非常多局限于列国可比视角,课题总管 赵慧

作者: 在线问答  发布:2020-04-21

基础教育领域大型国际教育评价项目研究——以国际数学和科学趋势研究为个案发布时间:2017-05-04

近年来,国际基础教育评价呈现新的发展趋势。具体而言,国际基础教育评价对国家、地区教育决策的影响力逐步增强;从基于书本知识到逐步关注真实社会情景和价值观教育;评价方式从实地调查走向线上评价,质性数据愈加重要;评价主体趋向多元化,更多发展中国家参与到评价中来;更加理性地看待评价结果,评价过程也越来越被看重。此外,国家教育评估如何不危及教育的多样化,也是未来国际教育评估需要考虑的问题。

12月3日,OECD正式对外公布了新一轮PISA结果,关于PISA排名的讨论立即成为大众关注的焦点。我国北京、上海、江苏、浙江四省市作为整体参加了PISA2018,测试数据显示,我国取得全部3项科目全球第一的好成绩。四省市学生在国际评价中的排名与表现为了解我国四省市基础教育质量状况提供了重要参考;同时,也应对PISA测试结果予以更加全面和理性的反思。

NOESP

基础教育;国际评价;新动向

一、PISA排名引发的关注

全 国 教 育 科 学 规 划 课 题

摘 要:近年来,国际基础教育评价呈现新的发展趋势。具体而言,国际基础教育评价对国家、地区教育决策的影响力逐步增强;从基于书本知识到逐步关注真实社会情景和价值观教育;评价方式从实地调查走向线上评价,质性数据愈加重要;评价主体趋向多元化,更多发展中国家参与到评价中来;更加理性地看待评价结果,评价过程也越来越被看重。此外,国家教育评估如何不危及教育的多样化,也是未来国际教育评估需要考虑的问题。

PISA是经济合作与发展组织于2000年发起的对基础教育进行跨国家、跨文化的评价项目,主要是对15岁在校生的科学、数学、阅读素养等核心素养进行测评,并对影响学生素养的关键因素进行问卷测查,以科学反映学生参与未来社会生活的能力,为教育教学改进提供有效证据。随着越来越多国家的加入,加之其科学、系统的整体设计,PISA已成为当前最具规模与影响力的国际性教育监测评估项目。

成果公报

关键词:基础教育 国际评价 新动向

“比较”是PISA测试的重要特点,也是PISA产出证据的重要手段。在“比较”视角下,不可避免地就衍生出“排名”。PISA会以排名的形式呈现参测国家的测评结果,这些排名,尤其是学生在阅读、数学、科学三项关键素养上平均分的排名,确实能在一定程度上反映参测国家的总体教育质量状况,为了解各国家基础教育质量状况提供重要的参考依据。但是同时,与世界上所有大型评估项目一样,PISA测试也面临着一个重要挑战,即如何避免将评估结果仅用于对国家间进行排名。

课题批准号 GFA111015

自20世纪中期开始,基础教育评价不断发展,尤其进入21世纪以来,国际上形成了如国际学生评估项目(Programme for International Student Assessment,PISA)、国际学生阅读素养进展研究(Progress in International Reading Literacy Study,PIRLS)、国际数学与科学趋势研究(Trends in International Mathematics and Science Study,TIMSS)等为主的大规模基础教育评价项目,在教育质量的监测、教育水平的提升、教育决策的制定中发挥着越来越重要的作用。判断教育公共政策的标尺也在发生变化,评价教育体系是否完善或是否需要改进的依据不再是国家教育标准,而是在世界范围内表现最为卓越的教育评价体系。近年来,我国在制定国家教育标准、探索“管办评”分离的同时,也在借鉴国际基础教育评价项目的经验。基于此,准确把握国际基础教育评价的发展趋势,具有重要的学术价值和现实意义。

面对每一轮PISA测试结果,公众、媒体,甚至众多研究者首要关注的都是诸如“我们的学生考了多少分?”“达到各精熟度水平的学生比例占多少?”“我们在国际上处于什么位置?”等类似话题,而对于PISA所呈现的证据却缺乏关注。例如我国上海在PISA测试“两连冠”时期,国内媒体宣传与报道的内容大都是“PISA是什么”、“排名怎么样”等内容。一些教育研究者虽然开展了PISA测试相关的研究,但大都局限于国际比较视角,最后仍跳不出各国排名的藩篱;或者是关注PISA测试经验对我国教育评价改革的启示研究,而一线校长、教师、学生、家长等直接利益相关者却鲜有发声。

课题 名 称 基础教育领域大型国际教育评价项目研究以国际数学和科学趋势研究为个案

一、对国家教育决策的影响力逐步增强

在这样的氛围下,公众虽然对PISA有所关注,但无法看到PISA其他富有价值的证据,更不会基于证据对本国的教育系统进行更有深度的剖析。

课题负责人 赵慧

国际基础教育评价由于科学性、规范性、广泛性等特点,吸引了越来越多的国家参与。许多参与评估的国家以评估结果为依据,进而解决其国内的教育问题。对于宏观层面的教育决策者和中观层面的学校管理者而言,这些评估结果也有利于其增进对本领域教育的了解,从而制定更为合理的教育政策。可以说,评估结果会影响教育政策的制定、实施,从而推动一个国家教育体系的不断完善,进而顺应本国乃至国际教育的发展趋势。

二、PISA测试远不止排名

所在 单 位 上海市教育科学研究院

以德国为例,2000年,PISA评估结果显示,德国1/4的15岁学生不能顺畅阅读,也未达到经合组织成员国的平均水平,引起了德国社会的震惊。迫于压力,德国当局迅速做出调整,转变了全国的教育政策,并于2004年出台新的教育标准。与此同时,德国当局设立了教育体系质量发展研究院,并设置了教育监测体系来检验其教育达标程度。除此之外,德国政府在2006年继续对教育政策进行完善,出台了《教育监测全局战略》,建立了国际、国内评估相结合的评估体系,两年发布一次《国家教育发展报告》。实施改革以后,德国PISA成绩持续提高,从2009年PISA结果来看,德国教育发展的实际表现与期望值之间的距离缩小了很多。

由于教育系统内部的复杂性和外部环境的约束性,使得教育发展与学生发展受多方面因素的影响,仅通过成绩和排名很难反映教育系统的“全貌”,更难以揭示和解释成绩背后复杂且相互关联的影响因素。因此,我们需要关注PISA测试更深层次的内容。

填表 日 期 2016年12月6日

再如,2009年,美国学生在PISA的数学、科学和阅读项目的排名均不乐观,分别排名第17位、第23位和第31位,这在美国社会引发了一系列讨论,美国政府对此高度重视。其实,早在2008年,美国政府就发现在其他国际评估中美国教育暴露出来的短板,当年12月,美国国家管理者协会(National Governors Association,NGA)、重点州学校管理者委员会(Council of Chief State School Officers,CCSSO)和成就公司共同发布了《成功的基准:确保美国的学生获得世界一流教育》的报告,旨在确保学生获得优质的教育。针对PISA结果体现出来的教育问题,美国政府连续几年出台相关的法律,如在2010年颁布《各州共同核心标准》,确定在语言和数学领域联合制定周密的、达到国际基准的教育标准,以提升美国教育的核心竞争力。2012年,美国发布了题为《美国教育改革与国家安全》的报告,将美国教育改革提升到了关乎美国国家安全的新高度。

一方面,PISA具有鲜明的政策导向。PISA是一项以实证为本的政策研究,它以改进教育政策为评价目的。其测评框架强调在教育的背景、投入、过程、产出和结果全过程视域下对学生发展有效性及其环境状况进行全方位评价,并从学生、班级、学校等不同教育系统层面识别影响学生发展的重要因素。其评价目的在于通过测验与问卷调查探明教育系统、学校、家庭与学生因素对学生素养的影响,产出大量证据,为教育决策提供依据。

课题成果公报

许多国家和地区积极借鉴国际教育评价坚持的理念和采用的技术,将其纳入本国教育政策制定当中。比如,在德国2004年进行的教育改革中,其小学、初中、高中水平考试的州际比较在某种意义上就仿照了国际大规模教育评估,即借鉴了国际教育评估的比较方式。

另一方面,PISA重视对影响因素的测查。除了对学生基本素养进行测评外,PISA还对影响学生素养的关键因素进行问卷测查。具体而言,在学生层面,关注学生的家庭背景、阅读活动与学习实践、学习策略、自我效能感、学生幸福感等议题。在教师层面,关注教师的教育背景与教学经历、教师专业发展、教学组织安排与教学策略、课堂教学氛围等议题。在学校层面,关注学校规模、学校硬件资源配备、学校教师队伍建设、学校政策及实施情况、学校氛围等议题。在家庭层面,关注家庭背景、家庭教育资源状况、家庭学习环境、家长情感支持等议题。

上海市教育科学研究院 全国教育科学规划十二五规划2011年度教育部重点课题负责人主持完成了基础教育领域大型国际教育评价项目研究 (课题批准号:GFA111015)。课题组主要成员:丁笑炯、陈建俞、方乐,课题还有两名合作者:毛建茹、王湖滨,课题顾问为江彦桥教授。

虽然国家和政府仍是行为主体,但是在涉及世界事务,尤其是文化、教育等方面,社会各方可以参与并结成伙伴关系,参与全球治理。教育领域跨国、跨区域的评估,特别是诸如PISA等大型国际教育评估项目就是在全球治理的背景下实现的。在联合国教科文组织、经合组织等机构的牵头下,各个国家积极推动教育国际化发展,在多边合作中制定方针和协议。要了解教育治理的效果如何,各个国家就需通过国际教育评价来了解自身教育情况,从而获得适合自身发展的教育模式和路径。

因此,我国参加PISA测试的目的,不仅是在国际背景下了解我国基础教育的质量状况,明确优势、增强自信,更重要的是找出问题和不足,明确学校、教育系统和政府在哪些方面需要改进,寻找效能更高的教育政策。习近平总书记指出,要深化教育体制改革,健全立德树人落实机制,扭转不科学的教育评价导向,坚决克服“五唯”顽瘴痼疾,从根本上解决教育评价指挥棒问题。在对PISA测试结果进行分析和解读时,不能只关注分数和排名,而是要树立科学的教育质量观,以学生发展为教育质量的核心,同时考虑教育的背景性、投入性与过程性要素等关键因素,逐步摆脱单纯以学业成绩为标准的评价导向。

一、内容与方法

二、更加关注真实的社会情景和价值观教育

三、推动基于证据的科学决策研究

本研究课题在界定了相关概念以后,以研究分析国际大型教育评价项目来入手,重点聚焦国际数学和科学趋势研究,并提出我国现阶段引进国际大型教育评价项目值得思考的问题,为我国推进科学、有效的教育评价提供决策参考。主要研究内容有以下三个部分:主要的国际大型教育评价项目总体概况及分析。主要介绍TIMSS的前身、国际阅读素养研究、国际学生评估项目等国际大型教育评价项目;分析三个评价项目的相同点和主要区别,相同点主要有:1.评价项目具有明显的年级或年龄性特征;2.学科界定明确,普遍认为学生的阅读、数学、科学素养和能力是核心内容,最能体现教育质量;3.参与国家、地区以及所发挥的影响力都有不断扩大的趋势。不同点主要有:1.评价理念不同,TIMSS的理念是评估学生在基本知识和概念方面,与课程框架紧密联系的数学、科学和阅读的思维能力。PISA的理念是评估学生在日常生活情境中处理问题所需要的阅读、科学和数学素养;2.评价内容不同,TIMSS评价内容大多与学校课程有密切的联系,试图测量学生对具体知识、技能和概念的掌握程度,大量题目覆盖课程的内容,少量题目测评学生综合能力。PISA则侧重于测量广义的素养,主要是应用知识和技能解决问题的能力,以及在日常生活情境下做出良好判断和决策的能力。这些不同于且高于对学校课程所设置的学科相关知识的理解或记忆能力的考察;3.评价目的侧重点不同,TIMSS项目主要面向学校,所收集的学生背景信息侧重于反映不同国家的教师是如何进行教学的,以及这些教学对学生的成绩可能产生的影响。PISA在于衡量各国义务教育的产出,应用测试结果提供教育成效对比的有效指标,并通过收集家庭、学校等方面的相关信息,侧重点在于为国家教育政策制定和调整提供参考;4.评价对象抽样不同,TIMSS采用以年级为基础进行抽样的方式,主要报告课程成绩。PISA采用以测试时年龄在15岁3个月到16岁2个月的学生为基础进行抽样的方式,目的是描述义务教育结束时的教育成效;5.评价结果报告不同。TIMSS项目的国际平均值以所有参与国家和地区为基准,包括工业化国家、中等收入国家和发展中国家和地区。PISA以30个OECD成员国的平均值为基准,教育质量国际平均值代表了当今世界发达国家的平均水平TIMSS项目个案解析。主要包括:1.研究TIMSS的发展演变历程及趋势,从实测工具和施策目标、参与的国际和地区分布情况、历次TIMSS测试的主要结论和发现等三个方面研究分析TIMSS的发展趋势;2.最新完成的TIMSS2011测试的评价框架,分别介绍分析了TIMSS2011数学测试和TIMSS2011科学测试评价框架的维度划分和占比情况;3.施测情况及结果分析,主要结论与分析详见下文。若干有关论题的思考,主要包括:1.从分析研究TIMSS所带来的对国际大型教育评价项目的认识;2.参与国际大型教育评价项目对我们自身教育体系所发挥的价值等,具体对策建议详见下文。

国际教育评价的主要目的在于帮助学生提升解决问题的能力。2009年,PISA共收集了47万多个有效学生样本,虽然主要测试内容是阅读,但问卷更新了对学生在数学、科学等方面的评价。就题目内容来看,PISA不是孤立地对待某些领域中的知识,而是把这些知识和学生的能力相联系,关注学生对知识和经验的反思,以及在现实工作环境中的应用等。对于每一个评价领域,PISA均关注学生知识掌握的过程、对理念的理解及其在各种具体情景中的运用。

PISA提供了一个崭新的视角来审视我国基础教育发展现状与问题,有助于我们更好地理解处于全球化进程之中的中国教育,优化和完善我国的教育政策。《教育部关于加强新时代教育科学研究工作的意见》中强调,“要发挥大数据分析在政策研制中的作用,注重监测评估中的成效追踪与问题预警,切实提高教育决策科学化水平”。要加强教育科学研究,进一步推动“基于证据”的教育政策研究,促进教育科研成果的有效转化,为教育决策提供科学依据和参考。

本课题研究以教育评价学视角切入,并用国际比较、专家访谈、个案研究等研究方法,通过面上分析国际大型教育评价项目特征、运作、发展等,剖析TIMSS个案,聚焦若干值得思考的问题,为我国大规模引进国际大型教育评价项目提出建议,探索推动我国教育评价理论研究与实践发展。

在关注真实的社会情景的同时,国际基础教育评价也非常重视价值观的测评。虽然PISA、TIMSS、国际公民与公民素养教育研究(International Civic and Citizenship Education Study,ICCS)所侧重的角度有所不同,但均指向学生对于未来生活的适应能力。以ICCS为例,这个测试并非指向义务教育阶段学生所习得的基本素养,而是把目光聚焦于学生对社会现实的理解上,因而其评估的重点是学生对有关人际交往、社会以及相应政治制度的观点的把握。最初,相比数学、科学、阅读等学科的评估,很多国家对这种涉及价值观测评的国际评估并不是很感兴趣,但是,随着国际社会价值观冲突带来的一系列问题,以及国际社会民主化、现代化发展程度的提高,国际公民教育评估受到了越来越多的关注。

教育行政部门要加强对教育科研工作的宏观指导和信息服务。一是审慎运用排名,引导媒体和公众分析排名背后的证据,全面、客观地认识我国基础教育的成就与不足。二提高目标群体,包括科研机构、学校的教育科研工作者的数据使用素养,科学、客观地使用PISA数据,避免PISA结果的“误用”“滥用”现象。三是加强对教育科研的统筹规划和规范管理,稳步加大教育研究经费投入,引导广大教育科研工作者紧密结合教育改革和发展的实践诉求开展研究。四是在研究队伍建设、经费投入、激励措施、制度保障等方面给予积极支持,广泛听取意见,采纳有价值的政策建议,推动基于证据的决策。

二、结论与对策

三、更多发展中国家加入,评价主体逐渐多元化

教育研究者要结合我国实际对PISA进行本土化的深入研究。一是除了关注PISA成绩本身的统计分析外,还要对其他数据进行深入挖掘,包括教育系统、家庭、学生个人特征等方面对成绩的影响,使政策制定者能够对学生学业表现的影响因素、影响方式等做出推断,知道何以产生这样的结果,以及如何改进。二要增强问题意识和实践意识,高度关注我国基础教育改革与发展中的重大、重点问题,坚持理论与实践相联系。如PISA围绕学生课业负担、校园欺凌、学校归属感、学生生活满意度等教育热点、难点问题进行了探索,研究者要结合我国实际情况,寻求破解这些教育难题的有效策略和办法。三是采用多元研究方法,坚持理论研究与实践研究相结合、定量研究与定性研究相结合,一方面对大数据做好深入挖掘与统计分析,通过客观数据评价我国基础教育发展现状;另一方面,还要探寻与解读大数据背后的教育价值,及时总结提炼,力求发现规律,升华理论。

本研究从介绍分析主要的几个国际大型教育评价项目入手,以国际数学和科学趋势研究为研究个案,重点分析TIMSS2011项目评价进展概况,主要结论观点如下:

随着联合国教科文组织、经合组织、世界银行等国际组织对发展中国家教育的持续关注,更多的教育资源流入发展中国家,推动了发展中国家教育条件的改善。国际基础教育评价也吸引了发展中国家的广泛参与。例如,中国2009年首次参加PISA,虽然只对外公布了上海的测试结果,但是对国际基础教育评价以及中国教育本身产生了重要影响。2012年,上海再次在阅读、数学和科学三大领域同时获得了世界第一的成绩,引发了全球瞩目——“这让我们又有了当年苏联抢先将人造卫星送入太空时美国人的震撼感”,美国《纽约时报》如此评价。在中国对上海所取得的成绩自豪或反思的同时,2015年,中国的北京、广东、江苏等地也将参与PISA。随着国际教育评价的逐步发展,将会有更多的发展中国家和地区参与其中。

当今世界各国都致力于将大型监测评估项目的结果用于监测本国教育质量和改进教育政策,但时至今日,我们仍需努力使其在政策影响方面发挥更大作用。

1.新加坡、韩国、日本、中国台北、香港特别行政区等5个东亚国家/地区在TIMSS2011数学测试中持续领先世界。与学生数学学业成就具有正相关的因素有:对学生的早期培养,即早期培养对于锻炼孩子的数字技能至关重要;家庭资源保障和学校资源保障,即家庭资源保障和学校资源保障情况对学生数学学业成绩的重要影响;学校的学习氛围和学习环境,即身处在学校非常强调学术成就的环境、学校纪律和安全情况良好以及较少有欺凌行为发生的学习环境中,学生更易取得较好的数学测试成绩;教师的教学准备程度及职业满意度,即师资力量的情况与学生数学学业成就有直接影响,教师教学准备程度越充分、职业满意度越高,学生越易取得较好的数学测试成绩;学生对数学学习的态度,即学生对数学的喜欢程度、有信心程度以及重视程度与其测试成绩呈正相关;学生参与教学的情况,即师生在教学中的互动合作对于学生数学学业成绩有重要影响,学生参与教学越多、越积极,容易取得较好的数学测试成绩;学生的基本营养情况和睡眠,即学生的身体状况特征对于课堂氛围也是非常重要的,进而影响数学学业成绩,那些基本营养状况良好、能保障充足睡眠的学生更易取得较好的数学测试成绩。

之前,评价主要聚焦于学生的学业成就,但从各大教育评估项目的发展来看,也开始关注教师和校长的作用。在国际基础教育评价的初期阶段,评估的主要对象是学生,获得的数据大多显示某地区学生个体呈现的差异。随着国际基础教育评价的逐渐发展,影响评估结果的因素逐渐被考虑在其中。例如,PISA和TIMSS在调查学生学业状况之余,还利用问卷搜集学生学习的背景信息,试图从原因层面对评估的结果做深层次解释。然而,这些方面的评估仅依附于PISA和TIMSS的附加内容,学生之外的教育评估主体的主体性并未得到很好的彰显。从国际教育评估发展的趋势来看,为了更好地描述一个国家或地区的教育体系,除了更好地巩固学生主体,势必要在评估中增加评价主体,如关注教师、校长,甚至学生依赖的社会环境等。其中,以“改进校长工作,提高学生学业成就”(Leadership Improvement for Student Achievement,LISA)和教与学国际调查(Teaching and Learning International Survey,TALIS)两个项目为代表。

2.上述五个东亚国家/地区在TIMSS2011科学测试中表现突出,但没有像数学测试那样稳居前五名,其他国家,如芬兰、俄罗斯、美国等也表现不俗。国家之间成绩分布总体差异较大。TIMSS2011科学测试与前几次科学测试相比,更重视学生科学探究的表现,但结果显示,科学探究表现与学业成绩并没有相关性,TIMSS科学测试成绩名列前茅的东亚国家,学生的科学探究表现普遍不佳,而成绩排名靠后的一些国家的学生在科学探究方面的表现良好。与学生科学学业成就具有正相关的因素有:家庭资源保障和学校资源丰富程度,即家庭资源保障和学校资源保障情况对学生科学学业成绩的重要影响;学校重视学业成就的程度和学校的纪律状况,即身处在学校非常强调学术成就的环境、学校纪律和安全情况良好以及较少有欺凌行为发生的学习环境中,学生更易取得较好的科学测试成绩;教师的教学准备程度及职业满意度,即师资力量的情况与学生科学学业成就有直接影响,教师教学准备程度越充分、职业满意度越高,学生越易取得较好的科学测试成绩;学生对科学学习的态度,即学生对科学的喜欢程度、有信心程度以及重视程度与其测试成绩呈正相关;学生参与教学的情况,即师生在教学中的互动合作对于学生科学学业成绩有重要影响,学生参与教学越多、越积极,容易取得较好的科学测试成绩;学生的基本营养情况和睡眠,即学生的身体状况特征对于课堂氛围也是非常重要的,进而影响科学学业成绩,那些基本营养状况良好、能保障充足睡眠的学生更易取得较好的科学测试成绩。

LISA有利于推动整个欧洲教育体系的创新,其并非直接针对学生群体,而是瞄准了与学校管理息息相关的校长,核心问题在于了解中学校长的领导风格、态度和实践,及其在学校改进和学生学业成就提升方面所起的作用,尤其了解在PISA等国际评估项目的影响日益增大的背景下,校长在提升学生基本学习技能方面所起的作用。该测评项目由欧盟委员会教育、视听与文化执行署资助,整个测评项目被置于欧盟“终身学习计划”(The Lifelong Learning Programme,2007-2013)之下,其目的在于提高欧洲中学绩效,改善校长领导力和学生学业成就,帮助学生获得终身学习的能力。

通过以上本文对以TIMSS为代表的大型国际教育评价项目的研究与分析,对大型国际教育评价项目的认识以及对于参与国的启示主要有以下方面:

教师及其有效教学也是提高学生学业成就的重要因素,因此,2007年,OECD发起了TALIS,该项目又被称为“教师版的PISA”,旨在为世界范围内的教师评价提供指导。该项目始于2008年,主要测评了24个国家中学教育中的教师和学校领导。期间,测评主要关注教师的工作环境、教学条件,及其对学校和教师效能的影响。2013年,参与该项目的国家或地区增加到34个,此时期的调查侧重于教师培训、教师评价及反馈、学校领导力、教师的教学信念以及实际的教学活动。虽然被称为“教师版的PISA”,但是TALIS更倾向于获取教师的态度和声音,针对教师的所思所想进行阐释、分析与评价,进而将评估结果反馈给校园,以这些指导性的意见来指导教师的实际教学,推动其专业发展,进而促进学生学业成就的提升。

1.关于教育质量测评的研究与认识。一方面是进行大规模的教育质量测评很有必要,这主要源于国际上对教育质量的越来越关注并相应地对教育质量的研究也越发深入,通过各种教育评价体系检验国家和学校的教育质量成为一种主要举措;第二方面是文化因素非常重要,已经有越来越多的研究者和实践者认识到文化因素在教育质量评测体系中有着较大的影响作用。但遗憾的是,文化因素在教育质量测评体系中常常被忽略且无法测试,本研究认为这也是国际大型教育评价项目改进完善的一个方向。

2.参与大规模国际教育评价项目的思考,主要包括三个方面:一是通过数据可以有针对性的开展大量的改良工作,国际比较的结果不仅仅是一张排行榜,通过这些数据可以有针对性地开展大量的改良工作,也可以对学校结构性与教学结构性条件。如班级规模、课时量、社会身份、移民背景,以及对制定学校发展纲要、教师合作等方面,进行广泛而深入的探究,从而为学校发展、教育领导以及学生成绩的改进提供必要数据;二是参加测试可以聚焦比较,发现优势与不足;比如中国台北在 TIMSS2011表现非凡,很大程度上仰仗于TIMSS测试内容与官方课程高度吻合,或者说,官方课程的国际化程度颇高,这可以说中国台北在课程内容的国际化方面是一个优势。同时,在测试中成绩居后的一些发达国家也逐渐认识到本国教育体系中存在的某些不足,激发他们对TIMSS进行深入细致的研究,例如美国的政府相关部门、教育研究机构及个人对TIMSS进行多方面、多层次的研究分析,这些分析和研究结果在很大程度上推动了美国近十多年基础教育的改革发展;三是参考数据信息制定合适自身教育系统的政策。对于参与国际大规模教育评估的教育体系来说,评估数据可以用于诊断甚至缓解教育体系现存的问题与不足,并向教育政策制定者和学校发展研究者提供线索,以便制定合适自身教育系统的政策。比如新加坡在TIMSS项目测试中成绩名列前茅,但TIMSS测评信息也反映出新加坡教育体系一些不足,比如强调科学探究精神不够、以教师为中心重视知识传授等,基于此,新加坡政府希望能够在创造能力和创新精神方面有更高的发展,因此致力于改变现有的教育体系,要培养年青一代能够独立思考,以便于下一代和将来的年轻人能够找到解决问题的方法,而无论他们遇到什么样的问题。提出建立思考的学校,学习的国家,成为新加坡学校教育改革的大目标,而批判性与创造性思维成为新加坡教育体系实施的重大革新举措之一。

三、成果与影响

威尼斯国际平台app,本项目在课题组的协作研究和共同努力下,现已达到课题结题所规定的成果发表要求,由课题负责人赵慧在北大核心期刊《外国中小学教育》上公开发表论文三篇,分别是:1.TIMSS2011科学教育评价框架及运行研究,刊登于《外国中小学教育》2014年第9期;2.TIMSS2011数学教育评价框架及运行研究,刊登于《外国中小学教育》2015年第2期;3.TIMSS2011四年级调查问卷的设计研究,刊登于《外国中小学教育》2015年第9期。为深化研究,作者及课题组成员撰写了4篇相关的专题研究报告,分别是:1.大型国际教育评价项目的现状与发展方向;2.关于教育质量测评的研究和认识;3.TIMSS2011项目的设计与实施;4.我国跨区域大型教育评价项目的设计与运作研究。这4篇专题研究报告从不同的视角对TIMSS项目进行了更深入的分析和研究。

本研究课题的论文发表产生了较好的反响,文章TIMSS2011科学教育评价框架及运行研究和TIMSS2011数学教育评价框架及运行研究为基础教育领域的教育行政管理者、教育研究者、中小学校的校长、教师等认识TIMSS这一国际教育评价项目提供了详实的数据信息、深入的研究分析,为他们了解外国同行提供多维度的渠道和线索,为他们将自身情况进行国际比较和借鉴提供实证信息和研究支撑。其中刊登于《外国中小学教育》2015年第2期的论文TIMSS2011数学教育评价框架及运行研究被中国人民大学复印报刊资料全文转载,刊登于《初中数学教与学》2015年第6期。文章TIMSS2011四年级调查问卷的设计研究则是从问卷调查的角度对TIMSS项目测试进行深入分析,问卷调查在我们的研究工作常常处于一个不太受重视的状态,而TIMSS项目却是包含大量的问卷调查,非常注重问卷调查内容的深刻性以及问卷调查设计的精细化,本论文深刻剖析了TIMSS调查问卷的科学性和专业化特征,这对于我们设计研究项目的调查问卷有重要的借鉴意义。

四、改进与完善

虽然本研究课题已经公开发表若干篇研究论文,并完成研究总报告的撰写,但是由于课题组对本课题的研究认识水平的局限性以及研究计划规定的时间要求等诸多原因,本课题仍有一些需要改进和完善的地方,主要有以下几个方面:

1.国际大型教育评价项目本身有需要改进的空间。目前有越来越多的国家和地区参加国际大型教育评价项目,并将评价结果作为调整本国或本地区教育政策的重要依据之一,但是本研究认为,任何一项国际大型教育评价项目都有其可取之处,也都有缺憾,TIMSS不例外,在本研究中就指出文化因素非常重要,也的的确确在学生的学业成绩中具有重要影响,但在质量测评体系中却无法体现,这可能是包括TIMSS在内的大多数国际教育评价项目所共有的缺陷。除了文化因素以外,TIMSS是不是还有其他的不足,这需要进一步的研究探讨。

2.本课题组对项目的研究水平存在局限性。主要有两个方面:一是从课题组成员构成来看,本课题组成员大多是从事教育研究的科研人员,对于学术理论的把握、数据资料分析、国际比较、研究方法的使用等方面具有较大的优势,但是对于教育实践缺乏亲身体验和了解,这是本研究存在局限性的一个因素。另外一个方面在于TIMSS项目并没有在中国正式测试过,仅在2003年的部分地区2547名学生参加了高三年级数学素养测试,小范围的试点不具有典型意义。这使得本课题组无法从TIMSS的中国实践中得出更多、更有启发的建议和意见,为弥补这一缺憾,课题组研究其他国家、尤其是和我们具有相同文化背景的东亚国家运用TIMSS测试结果进行教育改革的具体实践和举措,经过提炼概括变成具有普遍意义的建议,但毕竟国情不同,教育体系也有很大差别,在政策建议这一方面本研究仍有改进完善的空间。同时本课题组对TIMSS调查问卷最具独特性的课程问卷单独拿出来作为模板并经过适当改造,特请上海有关课程专业研究人员进行问卷回答,据此结果分析了上海基础教育数学和科学课程的实施情况,并提出政策建议。

五、成果统计一览表

课题组成果统计一览表

序号

作者

成果形式

成果名称

出版单位/发表刊物

刊物级别

(CSSCI/核心)

出版时间/刊物期号

转载

获奖情况

决策采纳

1

赵慧

论文

TIMSS2011科学教育评价框架及运行研究

外国中小学教育

全国中文核心期刊

2014年第9期

2

赵慧

论文

TIMSS2011数学教育评价框架及运行研究

外国中小学教育

全国中文核心期刊

2015年第2期

中国人民大学复印报刊资料《初中数学教与学》2015年第6期

3

赵慧

论文

TIMSS2011四年级调查问卷的设计研究

外国中小学教育

全国中文核心期刊

2015年第9期

4

赵慧

专题报告

大型国际教育评价项目的现状与发展方向

5

赵慧

专题报告

关于教育质量测评的研究和认识

6

赵慧

陈建俞

专题报告

TIMSS2011项目的设计与实施

7

赵慧

方乐

专题报告

我国跨区域大型教育评价项目的设计与运作研究

1.成果形式请注明为论文、编著、专著或教材

2.获奖情况请填写政府颁发的、省部级二等奖以上的奖励,奖项名称应与课题名称对应。

3.决策采纳指被省部级以上党政领导机关完整采纳吸收,并附有基本材料和相关证明。

本文由威尼斯官方网站平台发布于在线问答,转载请注明出处:但非常多局限于列国可比视角,课题总管 赵慧

关键词: