谁来给医学指南“把关”?对话AGREE工作组主席Florez教授

  “有指南”是否等于“有好指南”?针对“如何制定一份可靠的指南”这个根本性问题,“医学界”对话了国际权威专家。

  撰文丨凌 骏

  临床实践指南(Clinical Practice Guidelines)是连接循证证据与临床决策的核心桥梁。在全球范围内,每年有数以千计的指南发布,覆盖了从肿瘤治疗到公共卫生的几乎每一个医学领域。

  然而,一个常被忽视却至关重要的问题是——“有指南”是否等于“有好指南”?当一份指南的方法学基础不够坚实,其推荐意见的可靠性便会大打折扣,最终也将影响实际的临床诊疗质量。

  针对“如何制定一份可靠的指南”这个根本性问题,20多年前,AGREE(Appraisal of Guidelines for Research & Evaluation)指南质量评价工具应运而生。它是全球第一个系统性评估指南质量的方法学框架,为指南的制定者提供了方法论蓝图,是国际指南领域公认的“金标准”。

  而执掌这一工具持续迭代升级的核心人物,正是AGREE工作组现任主席Ivan D. Florez教授。Florez教授同时担任全球首本专注于指南科学的学术期刊——Clinical and Public Health Guidelines的主编,并长期活跃于指南方法学的教学、研究与国际合作前沿。

  就指南方法学的演进方向、中国临床指南的发展现状以及国际合作等议题,近日,“医学界”对Florez教授进行了专访。

  指南方法学的未来在哪?

  自问世以来,AGREE工具已走过20余年。

  Florez教授告诉“医学界”,AGREE最核心的贡献,在于它开创性地建立了指南质量评价的标准化范式。

  “在AGREE出现之前,指南领域缺乏一个公认的、系统性的质量评估框架。”Florez教授回顾,“AGREE则为指南开发者创建了一份方法论蓝图,同时也为指南使用者,提供了判断一份指南是否可信赖的评估依据。”

  得益于这一“双重功能”,过去20余年间,AGREE深刻地推动了全球指南质量的整体提升。

  然而,循证医学是一个高度动态的领域,新的工具、新的方法、新的研究范式不断涌现,目前的版本“AGREE II”,已难以完全捕捉这些变化。正因如此,Florez教授牵头启动了“AGREE III”的更新开发工作。

500

  Florez教授

  Florez教授向“医学界”介绍,AGREE III的更新聚焦于四个关键方向,首当其冲的就是人工智能。

  当前,AI正以前所未有的速度渗透到医学的各个领域,指南开发也不例外。从文献检索、证据综合到质量评估,AI工具开始被引入指南制定的多个环节。但如何评价AI在这一过程中的使用是否恰当、是否引入了新的偏倚等,目前尚缺乏明确的方法学指引。

  Florez教授指出,相比阅读一份几十页的指南,临床医生可能更倾向于直接向AI提问,但现阶段,AI难以完全避免的“幻觉问题”仍困扰着行业。“AI在循证医学中的应用仍处于开发和研究阶段,我们需要尽快回应这一重大挑战。”

  其次是健康公平(equity)。 Florez教授强调,指南的制定,应从设计之初就将公平性纳入考量,贯穿整个开发过程直至最终推荐意见的形成。“我们希望推荐意见,不仅是高质量、可实施的,而且还有助于缩小健康差距。”

  第三则是患者参与。 过去,患者在指南制定中更多扮演“推荐意见的接收者”角色。而近十年来,这一范式正在发生深刻转变,患者开始从研究设计阶段就参与其中,甚至参与到临床试验的设计和证据的“共同生产”(co-production)之中。

  Florez教授认为,将患者的视角系统性地纳入指南的全生命周期,是循证医学演进的关键方向之一。

  第四是动态指南(living guideline)。 传统的指南,更新周期通常以3到5年为单位,远滞后于医学证据的产出速度。一项新的临床试验发表后,可能在一年内就会使现有的推荐意见过时。

  动态指南的理念正是为了解决这一矛盾。当新证据发布时,指南将持续评估其对现有推荐的影响,并在必要时即时更新,而非等待下一个更新周期。

  而反过来,AI技术又有助于大幅降低持续更新过程中的人力和时间成本。Florez教授认为,这对资源和能力建设的要求很高,“但这就是未来的方向”。

  如何让中国指南“大而强”?

  在长期的国际合作经历中,Florez教授对中国指南领域有着深入的观察。他坦率地指出,作为全球指南产出量最大的国家之一,中国同时也面临着过多低质量指南的严峻现实。

  “这并非中国独有的问题。在全球范围内,大多数指南的质量都不够理想。”Florez教授说,“但考虑到中国的体量,在绝对数量上,很可能是全球最多的低质量指南生产国。”

  Florez教授指出,问题的根源之一,在于大量指南仍然采用“基于共识”(consensus-based)的传统模式,即由领域专家“圆桌讨论”,是依据经验形成推荐意见,而非基于系统性的证据检索与评价。这种模式容易引入偏倚,推荐意见可能不完整甚至存在误导。

  对此,Florez教授也为中国指南的质量提升提出了清晰的路径建议。首先,也是最根本的一步,就是指南方法学意识的觉醒。

  “我们不会强调临床专家本身必须精通方法学,但他们至少要认识到这些方法的存在,并主动寻求精通方法学专业学者的合作。”Florez教授表示,中国已有一批具备指南方法学能力的优秀团队,关键在于指南的开发者们,如何与他们建立实质性的合作。

  其次是国际可见度的提升。

  事实上,当下有大量高质量的中文指南在国际上几乎“隐形”,主要原因在于语言壁垒。Florez教授建议采取“双轨发表”策略:在保留中文版本以服务国内临床医生的同时,推动指南的英文版发表,以提升国际影响力和可信度。

  “但这有一个前提,那就是要满足国际公认的方法学标准。如果不满足这些标准,指南的长期公信力将成为问题。”Florez教授说。

  Florez教授是Clinical and Public Health Guidelines期刊的主编。作为全球唯一一专注于指南科学的学术期刊的主编,他指出,许多由政府机构或非学会组织独立制定的指南,过去缺乏合适的发表渠道,“而我们的期刊恰好填补了这一空白。对于希望提升国际可见度的中国指南而言,这也是一个值得考虑的选项。”

  此外,Florez教授还特别指出了不同医疗体系对指南实施带来的挑战。

  他认为,同一份指南,是在私立为主的美国医疗体系?英国的公立体系?还是在中低收入国家中?其实施路径可能截然不同。“这是AGREE工具面临的局限之一。工具是统一的,但使用者需要根据各自的具体情境进行调整。”

  国际方法学合作

  事实上,针对指南质量参差不齐的问题,早在2021年,复旦大学附属中山医院终身荣誉教授王吉耀和中国科学院院士韩启德就牵头成立了中国临床实践指南联盟(GUIDANCE)。

  GUIDANCE汇聚了国内多个学会和学术组织,旨在推动跨专科的指南方法学标准化,使不同领域的指南开发能够遵循更加统一和规范的方法学流程。

  而Florez教授正是GUIDANCE的常任国际顾问。在他看来,这一合作关系具有天然的互补性和双赢逻辑。

  “GUIDANCE在中国所做的工作非常有意义。”Florez教授评价道,“它让不同专科的指南方法学趋于统一,这对患者、对学术界、对整个指南生态都是有益的。”

  从AGREE的角度出发,Florez教授希望通过与GUIDANCE的合作,让AGREE的方法学工具更广泛地被中国的临床医生和方法学家所使用。“它不仅是指南发布后的‘检验尺’,更是作为指南开发全过程的方法论蓝图。”

  Florez教授表示:“借助GUIDANCE,AGREE可以在中国,乃至国际上更广泛地推广应用,而GUIDANCE则可以通过AGREE的方法学框架,帮助提升中国指南的质量和国际公信力。”

  在谈及质量监测体系的建设时,Florez教授也给出了务实的建议。

  Florez教授认为,建立有效的指南质量监测体系,需要从国家层面的制度设计入手,明确指南使用和监测的规范性要求,形成全国性的“最低标准”。在此基础上,再逐步深入到医院层面,开展指南使用的培训、质量评估工具的推广以及依从性的审计。

  “这需要资金、人才的持续投入以及机构的持续承诺。这件事没有捷径。”Florez教授强调。

  Florez教授还建议,对于以指南使用者和评价者为定位的临床医生,要充分利用AGREE等质量评价工具。“有些指南看起来可能质量很高,但实际未必如此”,在采纳任何指南之前,要先用科学的工具进行独立评估。

  而对于希望参与指南制定的方法学家和研究者,他则表示,应该持续关注方法学的前沿,积极与国际同行交流,关注全球核心医学期刊的最新进展,并在AGREE III正式发布后,将其作为指南开发的核心方法学参照。

  “归根结底,我们做这一切的最终目的只有一个。”Florez教授总结道,“那就是改善全球患者的临床结局。”

站务

全部专栏