近日,《自然》报道了一个名为 Delphi-2M 的人工智能模型 。它的研究团队基于 GPT 架构,使其能理解并处理贯穿人一生的、带有时间顺序的健康事件。该模型通过对英国生物样本库中超过 40 万名参与者的健康数据进行深度学习,构建了一个能预测超过 1000 种疾病演变的复杂模型 。为了验证其可靠性,研究者将其直接应用于一个全新的数据集 ——190 万丹麦人的健康记录,在未做任何参数修改的情况下,模型依然展现出强大的预测能力 。
Delphi-2M 的预测准确性令人瞩目。在评估死亡风险这项终极健康事件时,其准确率(年龄分层 AUC)达到了惊人的 0.97 。在与多种现行的临床单一疾病风险评估工具(如心血管疾病和痴呆症的评分)的比较中,Delphi-2M 的表现相当,甚至在某些方面更优 。然而,该模型最核心的突破在于其“生成”能力:它不仅能预测,还能模拟、创造出长达 20 年的个人未来健康轨迹的虚拟数据。更令人惊讶的是,当研究者用这些完全合成的、不含任何真实个人信息的数据来训练一个新模型时,新模型的性能仅比原版略有下降,这为在绝对保护患者隐私的前提下进行医学研究开辟了全新路径 。
这项技术为我们描绘了个性化精准医疗的未来蓝图,但研究团队也明确指出,AI 会忠实地学习训练数据中的任何偏见,例如“健康志愿者偏见”(即研究参与者通常比普通人群更健康),因此将其直接用于临床诊断决策需格外谨慎 。
AI 预测我 20 年后会不会生病,可我更想知道我下周的 deadline 能不能活过去。😭😭😭
Nature
#人工智能 #疾病预测 #生成式AI
👏 7