土耳其职前教师评估观念的双因素结构:集中式教育系统中的测量等值性研究
《Scientific Reports》:Factor structure and measurement invariance of the Turkish COA-IIIA among pre-service teachers in a centralized education system
【字体:
大
中
小
】
时间:2025年12月04日
来源:Scientific Reports 3.9
编辑推荐:
本研究针对土耳其集中式考试驱动教育体系下职前教师评估观念的结构与测量等值性(MI)问题,对土耳其版评估观念简表III(COA-IIIA)进行了验证。研究发现,原始四因子模型不适用,而问责与改进(Accountability & Improvement)及无关性(Irrelevance)双因子模型拟合更优且理论清晰。多组分析证实了该模型在性别、年级、学科分支及是否完成测量评估课程等分组上具有形态、度量和标量等值性,支持进行有效的潜在均值比较。结果表明,课程完成者和高年级学生问责与改进观念更强,男性无关性观念更低。研究揭示了土耳其职前教师将评估视为形成性与问责性功能的交织体,反映了高利害考试文化塑造的政策驱动观念,为跨文化验证COA-IIIA及理解评估信念的语境依赖性提供了重要依据。
在教育领域,评估(Assessment)是教学与学习的基石,它不仅关乎对学生学业成就的判断,更是改进教学、制定政策的重要依据。然而,教师们如何看待评估——是将其视为促进学生学习的工具(形成性评估,Formative Assessment),还是主要用于评级和问责的手段(总结性评估,Summative Assessment)——深刻影响着他们的教学实践。这种深植于内心的观念,即“评估观念”(Conceptions of Assessment),受到教师个人经历、文化背景以及所处教育系统的强烈影响。在像土耳其这样拥有高度集中、考试驱动型教育体系的国家,理解职前教师(Pre-service Teachers)的评估观念显得尤为重要,因为他们正处于形成其专业实践观的关键时期。
目前存在的问题是,用于测量评估观念的工具,其有效性和普适性并非放之四海而皆准。同一个测量工具在不同群体(如不同性别、专业背景的学生)中是否测量的是同一个心理构念?这个问题被称为测量等值性(Measurement Invariance, MI)。如果缺乏测量等值性,那么观察到的群体间差异可能并非真实的观念差异,而是源于工具本身在不同群体中的理解或反应方式不同,这将导致研究结论产生偏差,甚至误导教师教育项目的设计。特别是在土耳其的语境下,职前教师在接受教师教育期间会修读一门名为“测量与评估”(Measurement and Evaluation)的必修课,但此课程往往偏重理论,与实践有所脱节。同时,土耳其高等教育委员会(YOK)与国家教育部(MoNE)在政策上可能存在不一致,加之全国性的高风险考试(High-stakes Testing)文化盛行,使得职前教师的评估观念形成过程尤为复杂。因此,迫切需要一个经过严格验证、适用于土耳其本土语境并能进行跨组比较的评估观念测量工具。
为了解决上述问题,研究人员Coskun Erdag和Savas Karagoz开展了一项研究,旨在检验土耳其版评估观念简表III(COA-IIIA-TR)在土耳其职前教师中的因子结构和测量等值性。他们的研究成果发表在《Scientific Reports》期刊上。
为了回答研究问题,研究人员主要采用了问卷调查法和一系列高级统计分析方法。研究数据来源于土耳其中部一所国立大学的594名职前教师。研究所用的核心工具是经过翻译和文化适应的COA-IIIA-TR量表。数据分析主要分为三个阶段:首先,通过验证性因子分析(CFA)和探索性因子分析(EFA)来确立最适配的因子结构模型;其次,使用多组验证性因子分析(MG-CFA)来检验量表在不同人口学分组(包括性别、是否完成测量评估课程、教学学科分支、年级)上的测量等值性,即形态等值(Configural Invariance)、度量等值(Metric Invariance)和标量等值(Scalar Invariance);最后,在确立等值性的基础上,比较不同组别在潜在因子(即评估观念维度)上的均值差异。统计分析中特别关注了模型拟合指数(如CFI, RMSEA, SRMR)以及等值性检验的标准(如ΔCFI, ΔRMSEA的变化值)。
初步的验证性因子分析显示,COA-IIIA原始的四因子(学生问责Student Accountability、学校问责School Accountability、改进Improvement、无关Irrelevance)模型在土耳其样本中是不可接受的(inadmissible),因为“学生问责”、“学校问责”和“改进”这三个因子之间存在过高的相关性(r > .90甚至超过1),表明这些因子在土耳其职前教师的概念中难以区分。随后进行的探索性因子分析支持了一个更为简洁明了的双因子模型。这两个因子被命名为“问责与改进”(Accountability & Improvement,包含原量表中属于改进、学生问责和学校问责的大部分条目)和“无关”(Irrelevance,保留原含义)。该双因子模型显示了良好的拟合优度(RMSEA = .053, CFI = .989),两个因子共解释了57.05%的总方差,且因子间的相关系数为r = -.30。量表的信度(ORION reliability)很高(问责与改进: .963;无关: .908)。
多组分析结果表明,COA-IIIA-TR的双因子模型在所有考察的分组(性别、课程完成状态、教学学科分支、年级)中均建立了形态等值、度量等值和标量等值。这意味着该量表在不同群体中具有相同的因子结构、因子负荷、阈值和截距,从而确保了在不同群体间比较潜在均值是有效且有意义的。具体而言,所有比较组的模型拟合指数变化(如ΔCFI, ΔRMSEA)均符合等值性成立的标准(例如,ΔCFI ≥ -0.01)。
在确立了测量等值性的基础上,研究人员比较了不同组别在“问责与改进”和“无关”这两个潜在因子上的得分差异。
- •性别: 男性和女性职前教师在“问责与改进”观念上无显著差异。然而,男性在“无关”观念上的得分显著低于女性(d = 0.19),表明男性更不倾向于认为评估是无关紧要的。
- •课程完成状态: 已经完成“测量与评估”课程的职前教师,其“问责与改进”观念的得分显著高于未完成课程者,尽管效应量较小(d = 0.18)。两组在“无关”观念上无显著差异。
- •教学学科分支: 与科学教育分支的职前教师相比,土耳其语言教育、数学教育和社会科学教育分支的职前教师显示出更高的“问责与改进”观念得分(效应量从中到小不等)。所有分支的职前教师在“无关”观念上的得分均低于科学教育分支,其中社会科学教育分支的差异效应量较大(d = -0.71)。
- •年级: 四年级(毕业班)职前教师的“问责与改进”观念得分显著高于一年级学生,效应量为中等(d = 0.64)。在“无关”观念上,三年级和四年级学生的得分略低于一年级学生,但差异仅达到边际显著水平。
本研究最重要的发现是,在土耳其的集中式、考试驱动的教育背景下,职前教师的评估观念呈现出一种独特的双因素结构,即“问责与改进”与“无关”,而非国际研究中常见的四因素结构。这表明,土耳其的职前教师并非将评估的改进功能和问责功能视为截然不同的概念,而是倾向于将它们融合理解,认为评估是一个同时服务于教学改进和系统问责的统一机制。这种“概念融合”现象与香港、以色列等其他政策驱动型、高风险考试文化浓厚的教育体系中的研究发现相呼应。在这些体系中,评估的形塑性目的常常在政策压力下与总结性目的相结合。相反,在新西兰、芬兰等低风险、更注重形成性评估的体系中,改进和问责通常被区分得更清楚。
“无关”因子的独立存在且与“问责与改进”因子呈负相关,则揭示了部分职前教师对评估价值持怀疑态度的一面。这可能源于他们对评估被视为官僚化、形式化或与真实学习脱节的经验感知。这种积极观念与消极观念的并存,反映了在问责压力大的系统中,教师可能产生的认知失调。
测量等值性在所有关键分组上的确立,强有力地证明了COA-IIIA-TR量表在土耳其职前教师群体中具有良好的心理测量学特性,其测量结果是稳定、可靠的,支持进行有意义的跨组比较。观察到的组间差异(如高年级学生和已完成评估课程者更认同评估的积极价值,男性更不认为评估无关紧要)因此可以被解释为真实的观念差异,而非测量偏差。
本研究具有重要的理论意义和实践意义。在理论层面,它扩展了教师评估观念(TCoA)框架的跨文化验证,并明确展示了评估观念的维度结构是语境依赖的,受到特定教育政策和文化的深刻塑造。在实践层面,研究结果对土耳其的教师教育提出了明确启示:教师培养项目需要超越传统的理论传授,更多地融入基于实践的、反思性的评估素养训练,帮助职前教师在实际课堂情境中理解和运用形成性评估策略,从而在强大的问责文化中仍能坚守评估促进学习的核心价值。同时,研究也暗示了政策协调的重要性,呼吁国家层面(MoNE, YOK)、机构层面(大学)和实践层面(中小学)更好地协同,共同营造一个既重视问责更珍视改进的评估文化。
研究的局限性包括样本来自单一机构,可能影响结果的普适性,以及横断面设计无法推断因果关系。未来的研究可以开展纵向追踪,或进行跨国比较,以更深入地揭示评估观念的形成与演变机制。
总之,这项研究成功地验证了COA-IIIA-TR在土耳其职前教师中的有效性和可靠性,揭示了其评估观念在特定教育生态下呈现出的独特双因素结构。研究不仅为在土耳其背景下准确测量评估观念提供了有效的工具,也为了解政策文化如何塑造教师信念提供了宝贵的见解,为改进教师教育、促进更健康的教育评估文化指明了方向。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号