大型语言模型(Large Language Models, LLMs)在医疗健康领域的应用正迅速普及,因此亟需标准化的报告指南。本文提出《个体预后或诊断多变量模型透明报告规范 —— 大型语言模型扩展版》(TRIPOD-LLM),该指南是《个体预后或诊断多变量模型透明报告规范 + 人工智能声明》(TRIPOD + AI 声明)的延伸版本,专门针对 LLMs 在生物医学应用中面临的独特挑战制定。
TRIPOD-LLM 包含一份涵盖 19 项主要条目及 50 项子条目的全面清单,内容覆盖从研究标题到讨论部分的关键维度。该指南采用模块化格式,可适配不同类型的 LLM 研究设计与任务场景,其中 14 项主要条目及 32 项子条目适用于所有研究类别。
TRIPOD-LLM 通过加速版德尔菲法(expedited Delphi process)及专家共识流程制定而成,核心强调研究透明度、人工监督机制及针对特定任务的性能报告要求。同时,我们还搭建了一个交互式网站(https://tripod-llm.vercel.app/),便于研究者完成指南要求的报告内容,并生成可用于投稿的 PDF 文档。
作为一份动态更新文档,TRIPOD-LLM 将随该领域的发展持续完善,旨在通过全面规范的报告体系,提升医疗健康领域 LLM 相关研究的质量、可重复性及临床适用性。