摘要:改革开放以来,我国基础教育质量监测与评价体系经历了以督导评估为依托的萌芽期(1978—2001)、开展教育质量监测的探索和试点期(2002—2014)和监测与评价体系的建设和完善期(2015至今)三个阶段。尽管在价值定位、监测内容、组织实施、结果应用、运行体系等方面取得了一些基本经验,但同时在监测与评价体系建设中也存在一些问题和挑战。基于对历史演进、基本经验和现存问题的分析,基础教育质量监测与评价体系的未来走向需要全面体现和贯彻党的教育方针、宏观调控教育督导定位以发挥监测职能、从监测机构设立走向各级监测体系的内涵建设,并推动信息技术与监测评价的深度融合。
关键词: 基础教育 ; 教育质量 ; 监测与评价体系 ; 演变发展
作者简介:
陈慧娟,北京师范大学中国基础教育质量监测协同创新中心博士、博士后。
辛涛,通信作者,北京师范大学中国基础教育质量监测协同创新中心常务副主任,教授,博士生导师,长江学者特聘教授,国家督学。
目录概览
一、改革开放以来基础教育质量监测与评价体系的发展历程
二、我国基础教育质量监测与评价体系建设的基本经验
三、我国基础教育质量监测与评价体系的现存问题
四、我国基础教育质量监测与评价体系的未来走向
建立健全基础教育质量监测与评价体系是新时代背景下完善与创新教育制度、深化教育评价改革的重要内容。基于对欧盟各国教育监测体系的研究,有学者指出教育监测体系可分为三个层面:学校外部评估、学校内部评估和学生学业成就评估(俞可,陈丹,赵帅,2017)。不同于对学生学习、教师教学等的过程性学校内部评估,也不同于中高考等学生学业成就评价活动,基础教育质量监测与评价指向宏观的教育质量管理,是根据国家制定的有关方针、政策、法令和法规,定期对基础教育质量进行评估与判断,利用数据了解并改进基础教育的外部评估活动。教育监测与评价通常或由各国政府建立,有国家强制力和相应的政策法规做保障,或由著名国际组织倡议组织,具有较强的专业实力和国际影响,其实施主体多为政府或其他评估机构,其目的是推动教育质量的提升而非学生个体的学习改进或升学(杨涛,李曙光,姜宇,2015;辛涛,李峰,李凌艳,2007)。因而,教育质量监测与评价具有较强的行政管理导向,在我国教育管理体制下往往更能够发挥制度优势,以促进基础教育质量的整体提升。
一、改革开放以来基础教育质量监测与评价体系的发展历程
通过对与基础教育质量监测与评价相关的机构设置、制度建设、监测评估内容与实施等的梳理,并结合重大政策的产生过程进行考察,可以发现,改革开放至今,我国基础教育质量监测与评价体系的发展历程可以划分为以督导评估为依托的萌芽期(1978—2001)、开展教育质量监测的探索和试点期(2002—2014)、监测与评价体系的建设和完善期(2015至今)三个阶段。
(一)以督导评估为依托的萌芽期(1978—2001)
改革开放后直到新世纪之初,基础教育质量监测与评价活动实质上以教育督导评估的方式开展。伴随着督导机构和督导评估制度的逐渐恢复,以推进“两基”(即基本实施九年义务教育和基本扫除青壮年文盲)的检查验收为工作主线,努力实现普及教育,推进素质教育,保证适龄儿童“有学上”。这一阶段,在督导评估的重建与发展中,教育质量监测的思想也开始萌芽。
机构的变迁主要表现为国家及各级督导机构的恢复与重建。恢复我国教育督导机构的设想始于1977年邓小平同志同教育部负责人的谈话:“要健全教育部的机构。要找一些四十岁左右的人,天天到学校里去跑……到班里听听课,了解情况,监督计划、政策等的执行,然后回来报告。”在这一思想的基础上,1984年,国务院批准教育部设视导室,之后几经调整,2000年设立为“国家教育督导团”。期间,1988年9月,原国家教委、原人事部联合发出《关于建立教育督导机构问题的通知》,有力促进了全国省、市、县三级教育督导机构的建设。到1988年底,全国各省、市、自治区(除西藏外)都建立了教育督导机构。从国家到地方多级督导机构的设置和职责的明确,有效推动了督导部门对基础教育“督政”和“督学”实践的开展。
制度建设的进程则表现为督导制度的不断完善与监测制度的萌芽。1985年国务院在《关于第七个五年计划的报告》中指出“要加强教育事业的管理,逐步建立系统的教育评估和监督制度”。1991年,国家教育委员会颁布了《教育督导暂行规定》,这是我国教育督导制度的第一个法规性文件,标志着教育督导制度开始建立。1992 年,《中华人民共和国义务教育法实施细则》提出“县级以上政府应当建立对实施义务教育工作进行监督、指导、检查的制度”,这是义务教育监测制度的思想首次被提出(杨令平,司晓宏,魏平西,2018)。同期,我国开始建设社会主义市场经济体制,从而引起教育体制改革以及教育评价作用的变化。1995年,《中华人民共和国教育法》规定“国家实行教育督导制度和学校及其他教育机构教育评估制度”,确立了我国教育督导评估制度的法律地位。
评估的内容与实施则以学校办学条件的督导检查为侧重,并体现出向素质教育和提高教育质量转变的方向。1992年党的十四大吹响“两基”工作的号角,并于1993年正式提出建立“普九”验收制度,督导内容的重点在于对义务教育实施情况(如危房、教室和课桌凳等基本办学条件)进行监测评估。1993年中共中央、国务院颁布的《中国教育改革和发展纲要》和1994年国务院发布的《关于〈中国教育改革和发展纲要〉的实施意见》提出要“研究制定各级各类学校的基本办学条件标准和质量标准”,“组织对各类学校教育质量的检查和评估”,表明在坚持基本办学条件标准的基础上,对中小学的评估同时开始重视教育质量的提升。而从1997年教育部下发《关于印发〈普通中小学校督导评估工作指导纲要(修订稿)〉的通知》提出“构建以素质教育为目标,全面科学评估学校办学水平的机制”,到1999年中共中央、国务院《关于深化教育改革全面推进素质教育的决定》要求“把保障实施素质教育作为教育督导工作的重要任务”,再到2001年《国务院关于基础教育改革与发展的决定》要求“建立对地区和学校实施素质教育的评价机制”,对素质教育实施的督导评价逐步成为工作重点。
2001年9月,国家教育督导团下发《关于加强基础教育督导工作的意见》,规定“建立符合素质教育要求的督导评估机制,保证素质教育顺利实施”,并提出,“将在全国选择一部分不同发展水平的县(市、区),开展义务教育实施水平监测工作。各省(自治区、直辖市)也要开展此项监测工作,监测结果作为决策依据,必要时发表监测公报”。这是国家层面计划进行义务教育质量监测的信号,代表了国家基础教育质量监测进入探索阶段。
(二)国家基础教育质量监测的探索和试点期(2002—2014)
为了贯彻落实《国务院关于基础教育改革与发展的决定》,在2002年度全国教育督导工作会议上时任教育部副部长王湛提出“国家教育督导团将建立义务教育监测制度”,从而拉开了国家基础教育质量监测探索和试点的序幕。这一时期我国教育监测评估在依托督导评估实现监测评价功能的基础上,逐步实现了教育质量监测机构的设置,从而促进了监测内容全面性和实施规范性的转向,推动了教育督导中评估监测职能的明确。
2002年,为督促各级政府继续落实“两基”工作,教育部督导办启动“全国义务教育监测项目”,在全国确定60个项目县(市、区),对义务教育的普及程度、师资水平、教育经费、办学条件及热点难点问题进行监测评估。经过设计监测指标体系、开发监测软件、建立监测工作保障体系等实施步骤,在2003—2005年陆续完成了初中学生辍学情况、中小学生均公用经费、中小学生变动情况、学校办学条件等专题监测。这一项目推进了监测理念和实施程序的探索,但其侧重点在于对义务教育实施水平的监测,其实质仍是对学校办学水平的督导评估。
随着2002年《教育部关于加强基础教育办学管理若干问题的通知》提出要“积极推进义务教育阶段学校均衡发展”,我国义务教育走进均衡发展阶段,评估各地义务教育均衡发展状况也成为教育督导的重要任务。与此同时,2001年新一轮课程改革的逐步实施凸显出监控课程教学和学习质量的重要性,2004年,国务院批转了教育部《2003—2007年教育振兴行动计划》,明确提出“深化基础教育课程改革。建立国家和省、市两级新课程的跟踪、监测、评估、反馈机制,加强对基础教育质量的监测”。由此,我国基础教育进入切实促进教育均衡与公平、提升教育质量的推进阶段。
建立国家基础教育质量监测体系是推进课程改革、实施素质教育、提升教育质量的重要保障和关键环节(崔允漷,2006)。教育部2006年工作要点指出“要建立国家教育质量监测和评估体系”。2007年,经中编办批准,教育部基础教育质量监测中心在北师大挂牌成立,标志着我国基础教育质量监测工作开始启动。从2007年至2014年,监测中心开展了八轮义务教育质量试点监测,开发了大量监测工具,建立了规范的数据采集技术和实施流程,每年对1—2门学科或领域及与学生发展相关的影响因素进行监测,监测省市从2007年的3个,发展到2012年的覆盖全国31个省(自治区、直辖市)及新疆生产建设兵团。八年的试点探索不断厘清了对“教育质量”的理解,无论在监测内容的全面性上,还是实施程序的规范性上,都为监测与评价体系的构建打下了坚实基础。一些省市也陆续通过独立设置或挂靠科研院所等方式,成立省级基础教育质量监测机构,如2008年成立的江苏省基础教育质量监测中心、2009年成立的重庆市教育评估院、2011年成立的贵州省基础教育质量监测中心等。省级机构的成立,为全省范围内基础教育质量监测工作机构体系的设立打下了良好基础(向帮华,2013)。
随着基础教育质量监测探索和试点工作的逐渐深入,监测评估在教育督导体系中的重要功能也愈发得到体现。2012年,国务院成立国务院教育督导委员会,并审议通过《教育督导条例》,教育督导从体制机制和法律法规两方面取得了重要突破。2014年,国务院教育督导委员会办公室印发《深化教育督导改革转变教育管理方式的意见》,明确提出“形成督政、督学、评估监测三位一体的教育督导体系”,自此,建立科学评价教育教学质量的评估监测体系成为教育督导的一项重要职能明确下来。
(三)国家基础教育质量监测与评价体系的建设和完善期(2015至今)
2015年,国务院教育督导委员会印发《国家义务教育质量监测方案》(下称《方案》),决定从2015年起在全国开展义务教育质量监测工作。《方案》明确了监测工作以引导树立正确的教育质量观、纠正以升学率作为评价学校和学生的唯一标准为根本目的,确定了以语文、数学、科学、体育、艺术、德育六个学科领域以及影响学业水平的相关因素为主要监测内容,提出国家统筹指导、省级县级政府督导部门组织实施的基本程序,并对监测对象、周期、时间、样本等做出了具体规定。《方案》的印发标志着我国义务教育质量监测制度正式建立。通过义务教育质量监测的持续探索和实施,在机构设置、制度建设和实施程序上,国家基础教育质量监测与评价体系已有了基本雏形,进入体系建设和完善阶段。
与此同时,随着义务教育均衡发展水平的逐渐提升,我国基础教育的推进重点进入到从外延转向内涵发展、从注重规模“有学上”到重视质量“上好学”的新阶段。尤其是到2017年,教育部印发了《县域义务教育优质均衡发展督导评估办法》,更体现出对于“有质量的公平”的诉求。在这一背景下,从国家到地方在建立健全国家基础教育质量监测与评价体系上做出了许多积极的努力和探索。
在机构体系设置上,初步形成了从国家、省市到县区的工作体系。截至2020年5月,除西藏、宁夏和新疆生产建设兵团外,全国共有29个省(自治区、直辖市)成立了省级监测机构;据不完全统计,28个地市级、90余个县区级监测机构也已正式建立。这些监测机构除了每年承担国家层面质量监测的组织实施、结果应用等工作外,还有不少开展了本省(市)监测,为基于监测促进全面质量提升做出了有益探索。多级监测工作网络的初步形成为国家监测与评价体系的构建提供了重要组织保障。
监测制度的完善则更加深入地体现出从监测到改进的闭环推进。首先是监测报告发布制度的逐渐落地。按照《方案》向社会公开发布国家监测报告的要求,2018年7月,首份《中国义务教育质量监测报告》正式发布,对学生德智体美和学校教育教学等状况作出呈现并提出相关建议。2019年,又首次分学科发布了“数学”和“体育与健康”的监测结果报告。报告的定期发布意味着我国基础教育质量监测从监测内容和工具研制、到数据采集和组织实施、再到结果发布等环节的制度建设初步成型。其次是监测结果应用制度的建设。除了监测结果反馈的力度不断加强之外,2018年,覆盖30个省市(自治区)的35个县市区被确定为“国家义务教育质量监测结果应用实验区”,以在实验区先行先试,积累经验,为全国提供范本。2019年,首次以国务院督导办的名义对各地政府办公厅印发关于监测结果的函件,实现政府和专业监测机构协同,在工作机制上初步形成了“监测–反馈–整改–提升”的闭环,监测开始走向结果应用。
二、我国基础教育质量监测与评价体系建设的基本经验
通过对改革开放以来基础教育质量监测与评价体系发展历程的分析可以发现,我国基础教育背景下的教育监测与评价体系建设取得了以下基本经验。
(一)在价值定位上,为国家战略和教育发展服务,引领正确教育价值观
回顾监测与评价体系的发展历程可以发现,我国监测与评价体系的建设与国家战略和教育发展的进程相伴相生,通过推动数个重大战略任务的完成,实现了监测与评价体系的建设与自我完善。如,根据多个国家教育事业发展规划和重大政策文件,1992年起,逐步完成“两基”评估验收,提高教育普及水平;1997年起,建立全面科学评估学校水平的机制,保障素质教育实施;2002年起,评估各地义务教育均衡发展状况,推进教育公平;2007年起,开展国家义务教育质量监测,关注全面发展,提升教育质量。事实上,国际上许多国家都表现出类似的定位取向,重视基础教育质量监测与评价对国家战略发展的重要作用。以美国为例,1983年,美国发布《国家处于危难之中——教育改革势在必行》报告,希望通过建立标准、评估和问责体系,有针对性地解决美国公立学校质量较低的问题,提高美国中小学生学业水平,并将“公平和高质量”作为改革目标。2002年1月发布《不让一个孩子落后法案》(No Child Left Behind Act of 2001,NCLB Act),提出每个孩子都应该接受好的教育,力争不让一个孩子掉队,全面提高教育质量,之后,美国国家教育进步评价州评价由原来的自愿参与变成了强制性参与(Coleman,2018)。
我国基础教育质量监测工作开展过程中也持续通过引领教育发展和监控教育发展两个视角不断践行这一价值定位。从引领教育发展的角度看,作为国家教育质量监测机构,教育部基础教育质量监测中心面向全社会持续发布基于监测结果的国家义务教育质量年度系列报告。在这个过程中,监测评价引领社会树立正确的教育价值观,引领学生德智体美全面发展,在“培养什么人”“如何培养人”等方面发挥“指挥棒”的功能(李勉,刘春晖,2016)。从监控教育发展的角度看,一方面通过构建涵盖教育投入–过程–产出的大规模基础教育质量数据库和大数据处理平台,监控义务教育发展状况,针对国家教育改革的重点、难点、热点问题及时作出基于实证数据的快速高效反应,并针对监测和评估结果发现的重点现象,比如学生课业负担、义务教育均衡发展等,向教育部及各省提交政策咨询报告,为制定和完善国家和地方教育发展相关政策提供决策参考;另一方面将重要监测指标的测量用于服务国家重大督导评估需求,如在《县域义务教育优质均衡发展督导评估办法》中,将国家义务教育质量监测学业水平结果数据作为重要指标,监控各县域义务教育优质均衡发展状况。
(二)在监测内容上,基于学科领域素养,坚持全面发展的综合质量导向
一直以来,以学生成绩和升学率作为评价学校教育教学质量的最重要甚至唯一指标的现象始终存在,为扭转这一不科学的教育评价导向,从2007年试点监测开始,国家教育质量监测就重视在监测内容设计中落实对能力和素养的测查。在监测学科领域中,基于对学科领域课程标准的研究和落实,研制了义务教育阶段六大领域的监测标准,并相继经教育部审定通过,成为我国基础教育质量监测工作的基本依据。六个领域中不仅包含国际大规模测试中测查较多的数学、语文和科学三大学科,还结合党和国家对学生德智体美劳全面发展的重要倡导,创新性地对“德”–德育、“体”–体育、“美”–艺术三个领域进行了测量,并且对影响学生发展结果的相关因素进行了探索;在具体监测评价的框架和内容上,也以学生应知应会的内容为考查点,考虑地区教学差异,力求全面而有针对性地考查学生的综合能力(李燕芳,李红菊,陈福美,肖菱,甄巍,2017)。事实上,作为国家层面的教育质量监测,有时监测内容的导向比监测内容的多少更为重要。基于学科领域对学生能力和素养进行测查也是国际上的通行做法,如国际学生评估项目PISA(Program for International Student Assessment)以阅读、数学、科学三大核心领域为主,测试学生是否具有现实生活和终身学习所必需的知识、技能等基本素养,并由此分析学生成绩与教育背景、学校因素以及情感态度价值观之间的关系,其评估结果对多国的教育改革产生了影响(Scerbina,Deussing,O'Grady,2019)。
除了多学科领域和测量指标的设置外,教育质量监测对全面发展的贯彻引导还体现在监测内容背后的实际质量提升中。如体育和艺术监测结果发现,体育与艺术教育资源在偏远及薄弱学校匮乏,相当部分学校存在体育和艺术课时不足、教师专业素养不高、活动内容单一等问题。针对体育和美育工作薄弱的现状,教育部基础教育质量监测中心成立了“高参小”项目,助力区域和学校体育和美育发展。例如开发音乐、篮球等特色课程,指导学校和老师建立丰富多彩的艺术社团和年级主题授课制的课程模式,以校歌创作、全员运动会等多种方式综合呈现学校体育和艺术育人成效,等等,对加强学校体育和艺术教育、促进学生全面发展和综合能力提升起到了切实的引导和促进作用。
(三)在组织实施上,坚持标准化规范化,确保准确把握教育质量状况
作为教育评价活动的一种,基础教育质量监测与评价的一个基本功能就是要提供学生能力及相关因素监测的高质量数据,全面准确把握我国基础教育质量的现状,科学分析和诊断我国基础教育发展过程中存在的问题,为教育管理和教育决策提供科学、准确、有效的依据(陈小娅,2010;董奇,2007;周济,2008)。但作为面向全国范围内数十万师生的评价活动,想要达到准确性和有效性,必须在全部监测环节的组织实施上进行标准化和规范化的把握。为此,自试点探索阶段(2007—2014)开始,监测与评价体系的构建过程就以教育部基础教育质量监测中心为主体,在组织实施的标准化和规范化上进行了大量探索。这一过程中大量借鉴、吸收了国际及各国监测项目的有益经验,邀请了全球知名的相关专家参与研发和咨询,并结合我国教育管理体系的运行特点及实践需求,形成了我国基础教育质量监测的整体工作环节和各环节的具体流程。
整体来看,我国基础教育质量监测工作共包含八个环节(见图1),每个环节都已形成了标准化和规范化的工作流程。“监测标准研制”共包含六个程序:明确指标体系确立的依据,大规模国内外调研与分析,基本框架的构建与论证,监测指标的界定与论证,教科书比较分析,监测指标体系的论证、修订与完善。“监测工具研发”严格遵循工具整体设计、命题团队初步编制、多轮磨题审题、实施预试、工具修订、形成正式工具等环节,保证工具研制的质量,以获取全面反映教育质量的信息和数据(边玉芳,梁丽婵,2015)。“监测抽样”按照依次抽取县(市、区)、学校、学生的三阶段不等概率分层抽样方法进行,确保抽样结果具有全国和省域代表性。“监测数据采集”由于涉及多省、县、学校的具体实施工作,因而编制了具体的操作手册和演示视频,包含组织工作、现场操作、演唱测试系统操作手册和程序流程等,确保实施工作的可操作性和有效性。在“数据扫描、录入与审核”及“数据清理与分析”环节,形成了编码与数据录入规范与审核程序、数据核查流程与规范、数据清理步骤与技术标准、变量合成流程与规范、常模制定方法与技术、权重使用的规范及操作程序,同时在监测数据分析过程中,综合运用多种统计分析方法,充分考虑权重、效应值、缺失值、抽样误差等因素,确保试卷和问卷清理分析的科学规范。“监测报告撰写”则遵循初拟框架并撰写样书、形成国家报告初稿并由教育部督导局审阅、多次研讨修改、撰写省和区县报告模板、广泛征求意见、修改完善定稿等流程。在“报告反馈与结果应用”环节,定期向社会公布国家监测报告,并将各级监测报告分级分类反馈给各省、区县,组织专家现场反馈,指导各省进行结果应用。通过对八个环节标准化规范化的实施操作,确保能基于监测准确把握我国基础教育质量的状况。
(四)在结果应用上,指向发展,兼顾问责,旨在改进提升
从监测与评价体系建设的历史经验来看,国家教育质量监测与评价在结果使用上以促进教育发展为根本导向,同时兼顾一定的问责性。
为实现利用质量监测的信息推动教育发展的功能,在监测结果使用上,从国家到区域层面不断探索尝试,积累了许多宝贵经验。在基于监测报告促进质量提升方面,国家教育质量监测充分重视对监测大数据进行科学全面地分析,形成国家、省、区县分层报告,以及各类专项分析报告,每年选派专家赴各省及部分区县进行监测结果解读,为各省、区县掌握整体教育质量状况、进行教育管理改进提供科学依据。在指导地方应用监测结果方面,基于多年实践经验,厘清了区域监测结果运用的途径与方法,包括:1. 解读报告、分析数据、发现优劣;2. 专项调研、充实证据、归纳问题;3. 分析原因、质量互证、分层反馈;4. 制定措施、落实责任、采取行动;5. 阶段反思、检验成效、持续推进(李凌艳,苏怡,陈慧娟,2019)。不少地区在此基础上提出了提升教育质量的相关政策,比如北京市基于课业负担监测结果制定了“史上最严减负令”,提出严格控制作业量、禁止违规补课等具体措施;浙江省基于睡眠时间和吃早餐比例相关监测结果,经调研后由省教育厅出台《关于在小学施行早上推迟上学工作的指导意见》。在地方教育质量督导能力建设方面,监测与评价体系建设十分重视对各级监测机构专家队伍的培养,帮助扶持29个省建立本省监测体系及专业监测机构,培训全国32个省级单位的3万余名督导和监测人员,通过培育地方专家进行科学的结果解读和方法运用,更大范围实现基于监测结果促进教育发展的功能。
同时,国家教育质量监测结果的使用还应具备一定的问责性,但基于监测的问责并非面向学生、教师、学校等个体。国家质量监测不允许任何人公开透露有关学生个体和教师、学校等的成绩状况,也不允许以此评价学生、教师和学校。问责的目的在于督促各级政府履职,在这一方面地方和国家近两年采取了一些有针对性的举措,如广东省作为先行者,由省人民政府教育督导室印发了《市县级人民政府2018年度履行教育职责评价实施细则》,将“义务教育教育质量监测结果应用情况”纳入市县级人民政府履行教育职责评价指标体系中。国家层面,在2019年11月,首次以国务院教育督导委员会办公室的名义对各省人民政府办公厅印发了关于监测结果的函件,对各省基于监测发现的主要问题进行了说明,并提出整改要求,督促政府履行教育职责。
(五)在运行体系上,促进多元主体共同参与,推进教育治理现代化
国家教育质量监测与评价体系的建设与运行对于推进教育治理体系和治理能力现代化也有着重要的促进性功能。教育治理是指国家机关、社会组织、利益群体和公民个体,通过一定的制度安排进行合作互动、共同管理教育公共事务的过程(褚宏启,2014)。在新时代背景下,教育管理逐步向教育治理转变,监测与评价体系建设和运行的过程也体现出对教育治理体系和治理能力现代化的推进。
现代教育治理体系的核心是多元主体共同治理,监测与评价运行体系在纵向和横向建设中均体现出多元主体共同治理的特质。从纵向运行体系来看,由于我国基础教育规模巨大,单一部门难以实现对基础教育质量的有效监测,必须要建立从国家到县的监测网络,形成由国家提供监测标准和技术、省市负责本地规划、县区负责监测实施的格局(董奇,2007)。目前,我国已初步形成了涵盖国家、省市、区县的各级监测网络,国务院教育督导委员会办公室负责监测的统筹规划和制度指导,教育部基础教育质量监测中心负责监测工作的日常组织管理以及从标准研发到形成报告的各项专业活动,省市、区县各级教育督导系统及相关部门机构负责本地协调和操作执行。从各级监测机构的关系来看,上级机构对下级机构并无实际行政隶属关系,只存在业务指导关系,这种机构之间的专业联系方式避免了官僚化,有利于监测机构的专业化和监测工作的公平公正。从横向运行体系来看,教育质量监测与评价的主体主要包括各级政府机构、第三方监测专业机构和社会公众等(杨令平,司晓宏,魏平西,2018)。监测与评价体系的运行能够促使政府转变职能,发挥“元治理者”角色,其中除了教育督导系统外,教研、基教、人事等其他系统的联动也在监测实施和结果改进上发挥着重要功能。第三方监测专业机构承担专业治理角色,充分发挥专业职能,社会公众则在其中起到民主监督的作用。
此外,监测大数据也为推进教育治理现代化提供了有效的实现路径。面对复杂的治理环境、多元的治理主体、动态的治理过程及具有不确定性的治理结果(王振兴,韩伊静,李云新,2019),大数据有利于捕捉和传递来自多层次的丰富数据,使决策更具前瞻性、科学性和统筹性(杨昌勇,奚洁人,2020)。同时,监测数据和报告的反馈与发布,也有利于消除各主体间的信息差以及因信息不对称而产生的政府与公众的权力差,使多元主体以平等的地位共同参与社会决策(陈潭,2016)。因此,监测所产生的大数据可以成为推进教育治理体系及治理能力现代化的重要工具。
三、我国基础教育质量监测与评价体系的现存问题
改革开放以来,我国基础教育取得了举世瞩目的成就,基础教育质量监测与评价体系也逐渐开始建设和完善。但当前,监测和评价体系的功能尚未得到充分发挥,仍存在诸多现实问题和挑战。
首先,在价值定位和监测内容上,新时代对教育质量和教育评价提出了新要求,面对新时代、新定位、新要求,当前教育质量监测与评价体系在价值导向标准和内容领域等方面仍存在一些不足。
在价值导向和标准的引领上,由于监测与评价体系中缺乏对新时代基础教育质量的共识解读和评价标准的澄清,也少有对监测与评价理论模型的系统构建,导致当前监测评价中存在价值导向不明确、理论基础不扎实、具体要求不系统等问题,对于党的全面教育方针如何落实、落实情况如何,也较难做出准确判断。这其中存在的问题突出体现在对教育结果的理解上。尽管监测始终坚持全面发展的导向,但由于主要结果变量以学生学业素养为主,未充分考虑到系统(国家、社会)、学校(课堂、教师)、家庭和学生个体层面的因素对学生发展的影响,过程性监测指标也较为缺乏,导致在落实党的全面教育方针上缺乏有力抓手,一些地方甚至出现基础教育监测评价“唯分数论”或成为地方教育行政部门的政绩工具等问题(范涌峰,廖其发,2013),从而在监测导向上带来了不良的引导和影响。
在监测内容领域的设置上,仍需结合对新时代教育质量的解读对更多学科领域、更多学段的监测框架进行研究。从学科领域来看,习近平总书记2018年9月在全国教育大会的讲话中特别强调“要培养德智体美劳全面发展的社会主义建设者和接班人”,将劳动教育在学生全面发展中的重要性再度凸显。2020年印发的《关于全面加强新时代大中小学劳动教育的意见》也进一步提出要“把劳动教育纳入教育督导体系,完善督导办法”,“开展劳动教育质量监测,强化反馈和指导”,而在现有的监测框架中关于劳动教育的内容则有所缺失,因此有必要进行进一步拓展。除此之外,包括近年来愈发受到重视的学生心理健康等相关部分的内容,也有必要在整体内容框架中进行考虑。从监测学段来看,虽然自2007年便已开始开展教育质量监测,但监测学段一直仅覆盖到义务教育阶段的四、八年级学生。随着社会和教育的发展,学生家长对高质量教育的需要日益增长,学前教育和高中教育也逐渐得到普及,而在这两个阶段尚缺乏有效的监测数据支撑。因此,从服务国家教育发展需求的角度考虑,学段向两端延伸已成为监测与评价体系面临的重要命题。
其次,在机构职能发挥上,评估监测已经与督政、督学并列成为我国教育督导的重要职能,众多监测工作的开展都会受到教育督导机制建设、职责定位、专业力量等方面的影响,但当前,我国教育督导在发展过程中展露出诸多问题,对监测工作的有效开展也起到一定的阻碍作用。
在教育督导机构的设置上,虽设立了相关部门,但事实上多地存在督导机构削弱的现象。省级层面,除北京、天津、辽宁、宁夏等四省份由教委或厅领导担任(兼任)督导室负责人,行政级别为厅级外,其余各省市均为处级。如河北省教育督导机构原为省政府教育督导室,属省政府直属单位,挂靠在河北省教育厅,机构改革后调整为教育督导处。市、县级层面也被削弱,如吉林省市、县两级教育督导机构中有22个与其他科室合并,江苏省有29个县级政府没有独立设置教育督导机构,等等。教育督导机构削弱后,更加难以独立行使职能。在教育督导的职责定位上,存在督导部门和其他教育行政部门的职责边界不清、工作内容杂乱等问题。比如,在一些地区,教育部门的主管责任和督导部门的监督指导责任边界不清,督导部门常常既当“裁判员”又当“运动员”,难以独立履责;此外,很多区县大量法制建设、政务公开、部门综合考核等管理性和事务性的工作也由督导部门承担,导致他们难以将精力聚焦在督导事务上来。同时,教育督导的专业力量也比较薄弱,教育督导工作人员严重不足。从省级单位来看,辽宁、上海、陕西等12省份的督导机构人员,以及广东、浙江、湖北等8省的监测机构人员均处于缺编状态,很多地区的工作人员借调比例超过一半,部分区域甚至全部为借调人员,人员稳定性不足,而其中具有监测评估相关专业能力的人员则少之又少。
事实上,在机构设置、干部安排和职责定位上,教育督导工作并没有得到真正重视。不少省份的教育督导并未纳入工作重点,教育督导分管领导未进入领导班子,但在暴露出问题时,却又常常将原因归结为教育督导部门“应检”不力。而由于评估监测职能的发挥根植于督导体系,督导定位不清进一步带来对评估监测发现的问题整改效果不明显或不整改等现象,阻碍评估监测职能的有效发挥。
再次,在监测运行体系上,通过各级监测机构的设立,我国部分地区已初步探索形成了涵盖国家、省市、区县的监测评价工作网络。但是,在实践运行中,这一监测工作体系仍然暴露出以下诸多现实问题。
一是各级监测职能存在定位模糊、权责义务和工作任务划分不清的现象。这一点尤为明显地体现在省市和区县层面,如一些地区虽然成立了各级监测机构,但主要明确了机构、人员、经费层面的安排,在整体层面对各级监测工作的机制建设、机构职能划分、运行保障机制等内部设计尚不清晰。比如,部分地区的学校和师生同一学年内既接受国家监测,同时省、地市和区县督导评估机构也各自自行开展监测数据采集,从而造成多头评价与重复评价,既浪费资源,给学校、教师和学生造成了较大负担,也不利于对监测结果的有效应用。二是由于各地对教育质量监测与评价的认识不清晰、不一致,出现了以“监测”之名行“统考”之实的现象(李凌艳,任晓琼,江照富,2017)。例如,某些地市监测机构虽说也进行了周期性的监测数据采集,但仔细询问监测内容,会发现这些监测大多只是聚焦于学生主要科目的学业成绩,并不关心学生的全面发展及其相关影响因素,从而导致监测实际上成为另一种形式的区域统考,未能真正发挥监测提升教育质量的职能。三是许多地方的监测队伍还相当薄弱,专业保障制度不足(范涌峰,廖其发,2013)。教育质量监测作为教育评价活动的一种,在抽样设计、工具内容研发、数据分析等多环节都具备一定的专业性,但许多省市相关监测专业力量严重不足,同时也未设立与专业机构、高校等的合作机制,进而导致在监测开展中既不知道监测的科学性可靠性如何,也不知道结果出来后应该由谁改、怎么改。这些现实问题严重制约了教育质量监测评价工作的系统开展和基于监测的教育质量提升。
因而,尽管从机构设立上已经初步形成了各级监测工作网络,但在各级监测机构的职能定位与内涵建设、价值与共识引领、专业力量与保障机制建设等方面,仍有许多亟待探索完善的地方。
最后,在技术方法上,大数据、云计算、人工智能等技术和教育质量监测与评价的深度融合应是监测与评价体系实现系统化蜕变的关键。当前,国家也日益重视将前沿信息技术应用于监测工作,包括搭建题库、信息上报及抽样、报告自动化系统等教育评价云平台,形成演唱测试、作文自动化评分等解决方案,将智能语音技术应用于学生音乐素养的测评,等等。但目前二者融合仍处于探索阶段。
一方面,当前有关探索和尝试多是在国家监测层面进行。从各级监测实践来看,大部分省、市、区县在监测和督导评估中,层层数据填报、问卷调查、座谈访谈等传统手段仍然在数据采集中占据主导地位,信息化手段、工具和方法还相对缺乏,信息化整体水平还相对较低,大数据、互联网+等工具尚未得到广泛应用。而由于技术手段的限制,包括过程性督导评估在内的一些监测方式也较难实现。即使在国家层面,很多有关信息化技术与监测评价融合的研究也更多停留在理念探讨、个别经验总结等层面,诸多问题需要在实践中进行研究和应用。比如,亟需在信息技术情境下进行新的监测评价工具的开发,通过游戏操作情境等实现一般测试较难实现的学生高阶思维能力的测量;应实现对教学质量的实时评价,在技术情境下对学与教实时动态互动模式进行精准刻画,推动教育评价方式变革和教育教学改进。另一方面,当前各级监测督导平台的建设标准并不统一,相互之间数据壁垒现象严重,这就导致虽然经过长期的监测与评价实践采集了诸多教育结果与教育过程的测量数据,形成了大量的监测与评价数据库,但多样的数据资源散落在各个平台,未能形成互通互联和资源共享,从而既造成了大量数据资源的浪费,也在一定程度上阻碍了基于监测评价大数据推动教育改进的应用机会。
总之,尽管信息化技术与监测评价的融合已有了一些初步探索,但对于究竟怎样从信息化要求的全面自动化、流程化和标准化的角度理解基础教育质量监测的全过程及各级监测体系,如何有效运用信息技术更有效地开展教育质量监测、推动教学方式改进和教育质量提升,仍欠缺深入研究,距离真正实现信息技术的融合和应用也仍有很长距离。
四、我国基础教育质量监测与评价体系的未来走向
进入新时代以来,党和国家高度重视教育监测与评价工作,对深入改革教育评价体系提出了新要求。基于此,新时代我国基础教育质量监测与评价体系应在以下四方面有所突破。
(一)从结果到过程,全面体现和贯彻党的教育方针
在新时代如何贯彻落实党和国家的教育方针,促进学生的全面发展,应成为未来一段时期内监测体系建设的重点任务。要达成这一目标,首先要对党的教育方针下“教育质量”的内涵进行解析,明确教育质量的根本是学生的全面发展,不仅要关注学生全面发展的结果,还要系统而全面地关注教育过程因素。学生发展的结果是其家庭因素、学校因素和个人因素共同作用的函数,因而,质量监测既要关注发展结果,更要辨析学校因素对学生发展的贡献率。在学校教育过程因素中,可以在宏观层面关注课程和教材对特定学习内容的覆盖情况,在中观层面关注教师教学能力和教学过程,在微观层面关注学生真实的学习过程和课堂经历。其次要形成评价学生全面发展和教育过程因素的标准框架,并完善监测内容与工具,推进德智体美劳全面发展的落地。在学生全面发展的结果上,国家义务教育质量监测已经通过对六大学科领域及结果相关因素的监测进行了一些探索。未来要基于新时代的要求和标准对全面发展的结果进行丰富和完善,实现学科领域和学段的拓展,在学科领域上,扩展劳动教育、心理健康等领域的监测,在学段上逐渐向两端延伸,包括在幼儿园办学行为督导评估数据的基础上开展学前教育监测,并逐渐探索开展高中阶段的质量监测;同时要重点关注如何从宏观、中观、微观多个层面,系统而全面地对教育过程因素进行监测。
(二)宏观调控教育督导定位,确保发挥评估监测职能
从更好地发挥评估监测职能的角度出发,需要国家在宏观层面着力调控和明确教育督导定位。一是要厘清教育督导部门本身的职责定位和工作边界。教育督导部门不能既当“裁判员”,又当“运动员”,要确保各级教育督导机构能够独立行使督政、督学和评估监测职能,切实通过发现问题、诊断问题,完成对政府履职、学校办学、质量提升的督导评估。2020年2月中共中央办公厅、国务院办公厅印发的《关于深化新时代教育督导体制机制改革的意见》也在这一方面提出了重要举措,提出要深化教育督导管理体制改革,完善教育督导机构设置,全面落实教育督导职能,加强对下一级政府履行教育职责的督导。二是要切实明确督导评估在问责改进中的定位。教育督导和监测应既是教育质量提升的“促进者”,同时也要在教育质量监控中“长牙齿”。一方面,在督导评估或质量监测结束后,应面向社会公众和利益相关主体分级进行报告公开和发布,使多方主体都能参与到教育治理过程中,促进教育治理能力提升;另一方面,针对存在的问题和薄弱环节,要提出整改建议,对于整改不到位不及时、对存在的问题不重视的现象,要明确所负责任,强化落实,屡不作为的,则要严肃问责,使督导开展的督政、督学和评估监测职能真正落地。
(三)从监测机构设立走向各级监测体系的内涵建设
未来一段时期,监测与评价体系的建设不能仅停留在建立起监测机构的“形”上,而要在建立机构的基础上,着重于各级监测体系的内涵建设。首先要明晰国家、省市、县区各级监测机构的权责义务和工作标准,区分各级监测机构的“为”与“不为”。例如,国家层面应侧重于模型和标准的制定,要加强建立监测工作规范,建立国家常模和国家数据库,加强数据和评价结果向省市和区县层面的反馈。省市层面应在国家统一的质量标准指导下,减少教育质量监测在评价指标和评价工具研发上的投入,增强对本地教育特点的研究,深入分析当前存在的问题并制定整体性的质量提升工作方案。区县层面则应将侧重点放在基于国家、省市监测结果的改进上,通过各部门联动,有针对性地采取措施帮助学校、教师改进学校管理和教育教学等。其次要加强各级监测机构的专业力量。一方面在人员队伍建设与培养上,应明确评估监测从业人员的专业标准和操作技能,形成专职和兼职人员并行的人员选拔机制。在招聘专业技术人员的基础上,可聘任一些校长、教研员、中小学学科带头人等作为兼职研究人员。同时,应与大学和科研机构建立合作关系,为开展监测工作、培养专业人员提供咨询和支持。另一方面要加强对评估监测领域的研究,教育监测与评价是一个系统工程,需要强大的理论性、基础性研究的支持,因此,政府可在此方面进行制度性引导与财政支持,引入和借鉴国外专业资源,建立起国际间、区域间常规性的交流合作机制。
(四)基础教育质量监测与评价走向信息技术深度融合时代
在信息化背景下,基础教育质量监测与评价体系应逐步走向全面自动化、流程化和标准化,并在以下方面有所突破:一是借助信息化手段,从整体上加强教育监测的信息化建设。通过智能化数据管理机制、数据共享与应用的权限以及数据的保密和安全体系建设,整合构建国家主导、分级共享的教育监测信息化管理平台,带动各级监测机构的信息化建设水平,实现互通互联。二是利用人工智能技术,进一步实现监测评价的精准化,并推动基于监测结果的个性化提升方案。如依托题库建设和知识图谱等技术,结合历史测评数据,搭建有针对性的智能组题工具,使监测题目更加科学;依托声纹识别和图像识别等技术,搭建评价对象识别、评价过程跟踪、评价结果定位与个性化提升方案工具等,实现过程性精准评价和个性化的诊断分析。三是基于大数据技术打破数据壁垒,推进各级监测结果的运用。结合各级监测体系在结果应用中的侧重点,采用大数据技术及深度学习技术建立各级数据分析模型,形成监测与评价结果智能诊断及预警分析,为区域提供自动化优劣势预警服务,并运用智能技术实现数据模型的精准推送,辅助各级单位有效开展监测结果运用工作。