单题项评估外观满意度的有效性研究：基于三项研究的心理测量学分析

《Journal of Eating Disorders》：Is one item enough? Testing the potential utility of single-item assessments of appearance satisfaction across three studies

【字体：大中小】 时间：2025年11月24日 来源：Journal of Eating Disorders 4.5

编辑推荐：

　　本刊推荐：为应对长问卷带来的参与者负担，研究人员开展了一项关于单题项外观满意度评估工具效用的研究。通过分析ALSPAC、STORY和COVID三项研究数据，发现单题项测量在无进食障碍的女性人群中表现出良好的同时效度（与BESAA的r = -0.83）、收敛效度（与EDE-QS的r = 0.69-0.76）和可接受的重测信度（r = 0.79-0.84），为大型队列研究和密集纵向评估提供了高效替代方案。

在心理学和健康研究领域，评估个体对身体外观的感受——即身体意象（body image）——是一个至关重要的课题。特别是对外观满意度（appearance satisfaction）的评估，不仅关系到个体的心理健康，更是预测进食障碍（eating disorders）等严重问题的重要风险因子。传统上，研究人员依赖多题项量表（如包含10个题项的身体自尊量表BESAA）来精确测量这一复杂构念。然而，在实际研究场景中，特别是在大型人口队列研究或需要频繁评估的临床研究中，冗长的问卷往往成为制约数据收集的瓶颈。那么，一个迫切的科学问题随之产生：我们能否用单个问题来有效评估个体的外观满意度？这种“极简”的测量方式，其科学性和可靠性究竟如何？

为了回答这个关键问题，由Marie-Christine Opitz领衔的研究团队在《Journal of Eating Disorders》上发表了一项开创性研究。他们系统性地检验了两种高度相似的单题项外观满意度评估工具的心理测量学特性，其创新之处在于综合利用了三项独立研究的二手数据，涵盖了从青春期到成年早期的不同发展阶段，并且包括了健康人群和临床高风险（进食障碍）人群，使得研究结论具有更广泛的代表性和适用性。

研究人员开展此项研究主要运用了几个关键的技术方法。首先是利用大型出生队列研究（ALSPAC）的横断面数据，分析了近6000名14岁青少年的单题项评分与多题项身体不满意量表（Body Dissatisfaction Scale）及母亲报告数据之间的关联（即同时效度）。其次，在STORY研究中，他们采用横断面设计，在242名16-25岁的青少年（其中68%经进食障碍诊断量表EDDS评估为疑似进食障碍）中，考察了单题项与进食障碍检查问卷（EDE-Q）、进食障碍-15（ED-15）及患者健康问卷（PHQ-8）等效标工具的关系（即收敛效度）。最后，在COVID研究中，他们利用了一项针对18-30岁新兴成年人（emerging adults）的纵向研究数据（N=201，四个时间点，间隔两月），首次评估了单题项工具的重测信度，并将其与“金标准”多题项量表BESAA的性能进行了直接比较。数据分析主要采用SPSS软件，通过计算皮尔逊相关系数（Pearson correlation coefficient）来评估效度和信度，并使用多重插补（multiple imputation）和期望最大化（Expectation Maximization）等方法处理缺失数据。

研究结果部分通过三个独立研究层层递进地揭示了单题项工具的效用。

研究1结果：青少年群体中的同时效度

在ALSPAC青少年样本中，单题项（“在过去一年里，你对自己身体外观的满意程度如何？”）表现出显著的性别差异。女孩的外观满意度（M=2.64, SD=0.86）显著低于男孩（M=2.95, SD=0.81），效应量d=0.38。更重要的是，该单题项与多题项的身体不满意量表（Body Dissatisfaction Scale）显示了良好的同时效度，尤其在女孩中相关性更强（r = -0.59），男孩中为中等程度相关（r = -0.40）。此外，单题项与母亲报告的女儿身体不满意程度也呈现了中等但显著的相关（r = -0.33），这为单题项的有效性提供了来自外部观察者的证据。

研究2结果：进食障碍风险人群中的收敛效度

在STORY研究的女性样本中，单题项（1-7分评分）再次显示出区分能力。疑似进食障碍组的女孩报告的外观满意度（M=5.64）显著差于非进食障碍组（M=4.02）。在收敛效度方面，单题项与EDE-Q总分、EDE-Q体重/体型关注分量表、ED-15总分及其体重/体型关注分量表均呈现出可接受至良好的相关性（r = 0.49 至 0.67）。值得注意的是，这些相关性在非进食障碍社区样本中甚至更强（r = 0.76 至 0.82），提示单题项在非临床人群中可能具有更优的测量精度。

研究3结果：纵向背景下的效度与信度

COVID研究提供了最全面的证据。在女性参与者中，无论是自我报告有进食障碍史的子样本还是无进食障碍史的子样本，单题项与BESAA外观分量表均表现出高度显著的同时效度（平均r ≈ -0.81 至 -0.83）。其与进食障碍症状（EDE-QS）和心理困扰（PHQ-4）的收敛效度也与BESAA的表现相当，置信区间存在大量重叠。最关键的是重测信度分析：在两个月的时间间隔下，单题项在进食障碍子样本中表现出良好的稳定性（平均r = 0.84），在非进食障碍子样本中为可接受的稳定性（平均r = 0.79）。尽管在非进食障碍样本中，BESAA的重测信度（r = 0.91）显著优于单题项，但单题项的整体信度指标仍达到了方法学上可接受的标准。

综合三项研究的结果，可以得出明确的研究结论：对于女性，尤其是没有进食障碍的女性群体，使用单题项来评估外观满意度是一种心理测量学上合理且高效的方法。该研究为单题项测量在身体意象研究中的应用提供了初步的实证支持。其重要意义在于，它极大地促进了利用现有大型数据库（如ALSPAC、MCS）进行身体意象相关研究的能力，因为这些数据库往往由于研究设计的限制只包含了单题项测量。同时，它为未来需要进行高频率、低负担评估的研究（例如，生态瞬时评估EMA）提供了可行的工具选项，有助于在自然环境中更精细地捕捉身体意象的动态变化。

当然，研究也指出了未来的方向。首先，需要在更多样化的人群（包括不同性别、种族、文化背景）中进一步验证这些单题项工具的测量等值性（measurement invariance）。其次，研究发现的性别差异（男孩中单题项与多题项量表的关联较弱）提示，男性和女性可能以不同的方式概念化和报告其外观满意度，这值得深入探讨。最后，探索针对身体意象其他维度（如身体功能满意度）的单题项测量，也将丰富该领域的评估工具箱。

总之，这项研究是迈向更高效、更灵活的心理评估的重要一步。它证明，在特定条件下，“一个题项”确实可能“足够”好。这不仅是对方法学的贡献，更体现了科学研究中在严谨性与可行性之间寻求最佳平衡的智慧。随着对单题项测量理解的深入，研究人员将能更有效地利用资源，探索身体意象与健康之间错综复杂的关系。

热点排行

新闻专题