您好,欢迎来到知库网。
搜索
您的当前位置:首页正文

从TIMSS和PISA看国际数学教育评价趋势

来源:知库网
龙源期刊网 http://www.qikan.com.cn

从TIMSS和PISA看国际数学教育评价趋势

作者:江春莲 胡玲

来源:《新课程研究·基础教育》2013年第01期

TIMSS

TIMSS是由国际教育成就评价协会(the International Association for the Evaluation of Educational Achievement ,简称IEA)发起和组织的国际教育评价研究和评测活动。

成立于1959年的IEA曾经在60年代初组织了有十多个国家参加的第一次国际数学评测和第一次国际科学评测。70年代末、80年代初,IEA又组织了第二次国际数学评测和第二次国际科学评测。

1994年,国际教育成就评价协会IEA在美国国家教育统计中心NCES(National Center for Education Statistics)和国家科学基金会NSF(National Science Foundation)的财政支持下,发起并组织了第三次国际数学和科学评测(Third International Mathematics and Science Study)这次活动被简称为TIMSS,1999年,这项活动继续进行,并被称为TIMSS-R或TIMSS-REPEAT。

2003年,为了更好地延续这项有意义的研究活动,TIMSS成为国际数学和科学评测趋势(The Trends in International Mathematics and Science Study)的缩写,从而使1995年、1999年、2003年的三次测试有了统一的名称。这三次测试是当代青少年数学教育和科学教育的重要的国际比较研究,对我国的数学教育和科学教育有一定的启发和借鉴意义。 PISA

PISA(Programme for International Student Assessment)(国际学生评估项目的缩写)是一项由经济合作与发展组织(Organization for Economic Co-operation and Development,OECD)统筹的学生能力国际评估计划。主要对接近完成基础教育的15岁学生进行评估,测试学生们能否掌握参与社会所需要的知识与技能。

评估内容:第一次PISA评估于2000年首次举办,此后每3年举行一次。评估主要分为3个领域:阅读素养、数学素养及科学素养,由这3项组成评估循环核心,在每一个评核周期里,有2/3的时间会对其中一项领域进行深入评估,其他两项则进行综合评测。

评估方式:PISA会在各个国家中抽取4500到10000名初三与高一为主的15岁学生担任调查对象,以测试学生是否能够掌握社会所需的知识与技能。因此,试题着重于应用及情境化。受测学生必须灵活运用学科知识与认知技能,针对情境化的问题自行建构答案,因此能深

龙源期刊网 http://www.qikan.com.cn

入检视学生的基础素养。经合组织不久前公布了有40多个国家25万名中学生参加的2004年PISA测试。结果显示,芬兰学生在历次测试中名列第一。上海学生日前参加由经济合作与发展组织(OECD)进行的2009年第四次国际学生评估项目(PISA)测试中取得阅读数学科学素养第一的佳绩,引发外界持续关注。PISA测试的重点是看学生全面参与社会的知识和技能,对学生阅读、数学和科学能力的考察并不限于书本知识,还包括成年人生活中需要的知识和技能。

一、关于TIMSS

TIMSS原为Third International Mathematics and Science Study(第三届国际数学与科学研究)的缩写,其系统地研究了不同国家四年级、八年级学生数学学习的情况,其每隔四年的重复研究可以看到同一国家学生从四年级到八年级数学学习的变化情况(因为经过4年,四年级的学生刚好就是八年级的学生),体现出国际数学与科学研究的趋势,所以现为Trends in International Mathematics and Science Study的缩写。它是由国际教育成就评价协会(International Association for the Evaluation of Educational Achievement,简写为IEA)组织的。自1995年起已相继进行了五次的调查研究,第五次在2011年进行的,相关的报告还没有出来,所以下面对TIMSS的介绍将以2007年的报告为基础,我曾写过系列文章介绍中学八年级部分[1-6],因为我们现在召开的是第三届小学数学教育峰会,所以这里将主要介绍其中的小学部分。我国台湾和香港参加了前面几次的研究,但大陆和澳门一直没有参加。我们习惯上将这些研究依次称为TIMSS1995,TIMSS 1999,TIMSS2003等。它的研究报告以及部分的调查问卷可以在网站http://timss.bc.edu上免费阅读和下载。参与TIMSS 2007小学四年级测试的国家有37个,学生达183150之多,分别就读于三、四年级。其涵盖的数学内容四年级包括数(代数入门概念包括其中)、几何图形和测量、数据表示。其所测评的认知能力包括了解(Knowing)、应用(Applying)和说理(Reasoning)。

1. TIMSS 2007小学四年级数学测试的内容框架。TIMSS 2007从数、几何图形与测量和数据表示三个方面对学生的能力进行测评,具体内容见表1。

2. TIMSS 2007数学测试的认知层面。TIMSS 2007从对基本事实、过程和概念的了解,运用知识和概念性理解解决问题及超出常规问题的不熟悉的情境、复杂情境和多步骤问题的解决中的说理三个不同的认知水平对学生的能力进行测评,下面对具体的要求进行说明。 (1)了解。基本事实包括基本的数学语言、形成数学思维基础的主要数学事实和性质方面的事实性知识。过程是基础知识和运用数学解决常规问题(特别是来自日常生活问题)的桥梁。从本质上来说,过程知识的熟练应用指对一系列操作的回忆和具体实施。学生应该既能快速准确地使用各种计算过程和工具,又能理解某些特定的过程可以用来解决一类问题而不是个别的问题。这一认知水平主要包括如下的行为:①回忆:回忆定义、专用名词、数的性质、几何性质和符号表示(如ab表示a×b)等。②识别:识别数学对象、图形、数和表达式;识别在数学关系上等价的数学实体(如相等的常见的分数、小数和百分数)。③计算:整数、分数、小数的加减乘除运算及混合计算,取近似数进行估算,实施常规的代数运算。④检索:能从图

龙源期刊网 http://www.qikan.com.cn

像、表格和其他资源中获取信息,会读简单的比例尺。⑤测量:会运用数学测量工具、恰当地选择测量单位,并对测度进行估计。⑥分类和排序:会根据共性对对象、图形、数和表达式进行分类,对某个对象是否属于某一类做出正确的判断,会根据属性对数和对象进行排序。 (2)应用。问题解决是数学教学的核心目的和手段。学生需要应用数学知识的事实、技能和过程或对数学概念的理解去创建表征和解决问题。这一认知水平主要包括如下的行为:①选择:选择一个有效或恰当的运算、方法或策略解决有已知解法的问题;②表征:用图表(Diagrams、tables、graphs、charts)来表示数学信息和数据,从一个给定的数学实体或关系生成与其等价的表征。③模型化:生成恰当的模型(如方程或图形等)解决常规问题。④执行:遵循并执行一系列的数学指示;根据详述,做出图表和图形。⑤解决常规问题:解决类似于学生在课堂内所接触到的问题,如运用几何性质解决问题。

(3)说理。数学说理指逻辑、条理的思考能力,包括能用于解决非常规问题的基于模式和规律的直觉和演绎推理。非常规问题指的是对学生来说可能不熟悉的问题,尽管学生可能已经学过相关的知识和技能,相对于常规性问题,这类问题需要的认知能力更高。这一认知水平主要包括如下的行为:①分析。对数学情境中的变量和对象间的关系的确定、描述和运用;运用比例思维;将几何图形进行分解以简化问题的解决;画出给定的不熟悉的立体图、想象三维图形的变换;对同一数据的不同表征进行比较和匹配;从给定的信息做出合理的推断。②一般化。通过以更一般的方式和更广泛应用的术语重述一个结果,将数学思考和问题解决的结果从一个领域推广到另一个领域。③综合/整合。合并某些数学过程得到新的更进一步的结果,建立知识及其相关表征等不同元素之间的联系,建立相关数学概念之间的联系。④证明。根据数学结果或性质证明一个陈述的真假。⑤解决非常规问题。解决来自数学或现实生活情境、对学生来说不大可能见到的问题,应用数学过程于一个不熟悉或复杂的情境;利用几何性质解决非常规问题。

这三个水平层次是逐步增加的,这也是各国数学课程标准或数学教学大纲中对学生能力的要求。在四年级的测试中,在前面所述的三个内容方面所花时间所占的百分比依次是:50%,35%,15%。在三个认知水平所花的时间所占的百分比依次是:40%,40%,20%。

3. 部分国家和地区在TIMSS各次测试中的数学总成绩。TIMSS 1999没有测试四年级的学生,只有16个国家和地区连续参加了四年级的三次测试,在这里我们从东西方各选4个国家和地区进行比较,选取的国家及其学生在四年级测试中的数学总成绩见表2。

注:中国·台北和俄共体没有参加TIMSS1995。澳大利亚不符合TIMSS1995样本参与率的要求,所以排名无法准确确定。

表2数据表明,四个亚洲国家或地区四年级学生的数学成绩高于四个西方国家或地区。同时也表明从1995到2007的12年时间里,除日本四年级学生的数学成绩变化较小外,其余国家四年级的学生均取得了显著的进步。

龙源期刊网 http://www.qikan.com.cn

部分国家和地区四年级男、女生在TIMISS各次测试中的数学总成绩:由于男女生大脑结构的不同、兴趣爱好的不同,男女生在数学学习方面的差异普遍地受到关注,如在第10届国际数学教育大会(ICME-10)的29个研究专题中就有一个是与性别差异相关的,即“性别与数学教育”,所以TIMSS系列研究也十分关注男女生在数学学习方面的差异。表3列出了上述八个国家和地区四年级男女生在TIMSS各次研究中的数学总成绩。 注:中国·台北和俄共体没有参加TIMSS 1995。

4. 基于TIMSS数学国际水平标准的成绩比较。TIMSS系列研究还基于各国汇总的数据形成了一个国际水平标准以提供一个学生学习表现的更确切的描述,即不同水平学生了解的和能做的数学。位于波士顿学院(Boston College)的国际研究中心先确定出那些能区分较邻近分数的题目,即那些在某个水平的学生能正确回答而处于一个较低一点水平的学生却极有可能不能准确回答的问题;然后请一个学科问题专家组分析这些问题的特点及其对学生在知识和理解上的要求,并总结出同一个水平层次问题对学生在知识和理解能力上的总的特点以形成水平标准的准确描述。下面,我们将对TIMSS 2007中四年级学生数学的四个不同的国际水平标准分别进行描述。

(1)先进(Advanced)水平标准(625分)。达到这一水平的学生能在各种相对复杂的情境中运用他们的理解和知识并且能解释他们的推理过程;能在多种情境中运用比例性思考,展示对分数和小数概念的理解的发展;能形成或选择一个法则来表示一个关系;能在各种情境中运用二维和三维图形的几何知识;能组织、解释和呈现数据来解决问题。这里举一个统计的例子说明。

Class A and B each have 40 students.

There are more girls in Class A than in Class B. How many more?

翻译如下,A、B两班各有40名学生。A班比B班的女生对,多多少?对这一问题上述八个国家和地区学生得满分的人数的百分比一次为:63%,63%,47%,41%,38%,40%,36%,42%。而国际平均为32%。

(2)高级(High)水平标准(550分)。达到这一水平的学生能够运用他们的知识和理解去解决问题。学生能够解答包含正整数运算的多步骤文字题;能在一系列问题情境中使用除法;能展现出对位值制和简单分数的理解;能够扩充模式得到一些后续的项和确定按一定顺序排列的数对之间的关系;能展现出一些基础的几何知识;能解释和使用以图表呈现的数据来解决问题。

This graph shows the points obtained by 4 drivers in the car racing championship. Montoya is in the first place. Alonso is in the third place. Draw a bar which shows how many points Alonso has scored.(翻译:表格五表示了4位选手在赛车锦标赛的得分。Montoya排第一,Alonso排第三,画一个柱形表示Alonso的得分多少。)

龙源期刊网 http://www.qikan.com.cn

对这一问题,上述八个国家和地区学生得满分的人数的百分比依次为:70%,77%,72%,71%,51%,52%,52%,50%。而国际平均为38%。

(3)中级(Intermediate)水平标准(475分)。达到这一水平的学生能够在一些直接的情境中运用基本数学知识;能展现出对正整数的理解;能拓展简单的数值和几何模式;对一系列的二维图形较为熟悉;能够阅读和解释相同数据的不同表征方式。

Here are two sides of a rectangle. Draw the other two sides.(翻译:下图画出了一个长方形的两个边,请画出它的另外两个边。)

对这一问题,上述八个国家和地区学生得满分的人数的百分比依次为:69%,90%,77%,78%,55%,70%,68%,75%。而国际平均为54%。

(4)低级(Low)水平标准(400分)。这一水平的学生只有一些很基础的数学知识,她们能表现出对正整数加减法的理解;对三角形和非正式的坐标系统的熟悉;能从简单的柱状图或表格中的阅读一些信息。

The square is cut into 7 pieces. Put an X on each of the 2 triangles that are the same size and shape. (翻译:下图中的正方形被分成7块。找出两个大小和形状相同的三角形,并在他们上面画X。)

对这一问题,上述8个国家和地区学生得满分的人数的百分比依次为:88%,91%,81%,87%,85%,88%,85%,81%。而国际平均为72%。

上述八个国家和地区达到TIMSS 2007这四个不同的国际水平标准的学生百分比见表4。一般地,测试成绩较好的国家就有更多百分比的学生达到这些水平,而测试成绩较差的国家其百分比则较低。新加坡、香港有约三分之一或更多的学生达到国际先进水平,约四分之三到五分之四的学生达到高级水平,90%以上的达到中级水平,几乎所有的达到了低级水平标准。成绩较差的国家几乎没有学生达到先进水平,只有0~3%的达到高级水平,少于20%的达到中级水平,约半数甚至更少的达到低级水平标准。将前面两次的与2007年的结果相比较,同一个国家在不同的水平表示出类似的趋势。如与1995年的测试结果比较,2007年香港四年级的学生成绩有所上升,所以在先进、高级、中级和低级四个水平上的人数的百分比都有所上升。表4数据也表明尽管4个西方国家达到先进水平的学生在2007年不到20%,却有超过90%的学生达到了低级水平。这表明这些西方发达国家很好的进行了大众数学教育(Mathematics for All)工作。

表4 部分国家和地区达到TIMSS 2007,TIMSS2003和TIMSS1995数学国际水平标准(四年级)的学生百分数

注:↑表示在2007年的测试中,该百分比有显著性的提高,↓表示在2007年的测试该

龙源期刊网 http://www.qikan.com.cn

百分比有显著性的降低。

中国·台北和俄共体没有参加TIMSS 1995。

5. 基于TIMSS各学科内容的比较。如前所述,TIMSS对三个方面的数学内容进行了测试。同一个国家的课程对不同数学内容的重视程度可能不一样,不同的国家和地区对同一个数学内容的处理方式也可能不同,所以,通过比较学生在不同数学内容上的表现,我们可能会找到处理数学教学内容的更有效的方法。如果将该三个方面的四年级学生的数学国际平均换算成467分的话,我们可以得到上述八个国家和地区在三个数学学科内容上的成绩(表5)。结果表明,除了澳大利亚在数方面的成绩低于国际平均水平外,这些国家和地区在三个数学内容方面均显著性地高于国际平均成绩。但同一国家确实在不同的数学内容上有不同的表现,如澳大利亚学生在数方面就低于三个方面的平均成绩,而在几何图形和测量以及数据的呈现上就高于三个方面的平均成绩。

TIMSS也对各国男女生在这三个数学内容上的成绩进行了比较,上述八个国家和地区的结果见表6。有趣的是,在数方面男生的表现比女生显著性地好;而在几何图形和测量以及数据的表征方面,女生得表现比男生显著性地好。在数方面,有24个国家或地区男生的表现比女生的表现要好,只有3个国家或地区的女生比男生表现要好。在几何图形和测量方面,有12个国家或地区女生的表现比男生要好,而只有2个国家或地区男生的表现比女生要好。在数据的表征方面,有15个国家或地区女生的表现比男生要好,只有4个国家或地区男生的表现比女生要好。

注:画横线的数字表明该分值显著性地高于另一性别的学生的分值。

TIMSS系列研究还收集到了很多教育背景方面的信息,如数学课程、学校、数学教师及其培训、数学课堂活动和特征以及学生等。这些方面的具体内容和研究结果将另撰文加以介绍。

龙源期刊网 http://www.qikan.com.cn

龙源期刊网 http://www.qikan.com.cn

龙源期刊网 http://www.qikan.com.cn

龙源期刊网 http://www.qikan.com.cn

龙源期刊网 http://www.qikan.com.cn

因篇幅问题不能全部显示,请点此查看更多更全内容

Top