大语言模型 | 知识分享官

AI生成X片已经能以假乱真？随着AI技术的发展，用大语言模型（LLM）生成逼真的合成医疗影像（即“深度伪造”或deepfake）已成为现实

Fri, 03 Apr 2026 05:00:39 GMT

AI生成X片已经能以假乱真？

随着AI技术的发展，用大语言模型（LLM）生成逼真的合成医疗影像（即“深度伪造”或deepfake）已成为现实。这给医疗诊断带来了潜在风险，比如可能被用于误导诊断。一项新研究评估了放射科医生和多种大语言模型（LLMs）能否区分由ChatGPT生成的合成X光片与真实的临床影像。

研究团队邀请了17位来自不同国家的放射科医生，评估了154张影像（77张合成，77张真实）。结果显示，在不知情的情况下，41%的医生能识别出AI生成的影像。当医生被告知部分影像是合成的后，他们的准确率约为70%至75%，但不同医生之间差异不大。在LLMs测试中，GPT-4o和GPT-5能以85%和83%的准确率区分合成影像，而Llama 4和Gemini的准确率仅为59%和56%。合成影像的常见特征包括双侧对称、均匀的噪声或颗粒，以及过于平滑的软组织纹理和骨骼表面。

研究结论指出，无论是放射科医生还是当前的大语言模型，都难以轻易区分AI生成的合成影像与真实影像。这凸显了在医疗领域识别和防范深度伪造技术的紧迫性。研究强调，为应对这一挑战，需要加强对医生和LLMs的培训，并利用像DeepFakeXRay这样的专用数据集。不过，研究也指出，样本量或模型版本可能影响结果，未来仍需更多研究来验证这些发现。

放射科医生也怕“AI画”的X光片？😅

来源：Radiology

#AI医疗 #合成影像 #放射诊断 #Deepfake #大语言模型

via: 热心群友

🧬 频道｜ 🧑‍🔬 群组｜ 📨 投稿

医疗 AI 也会被误导——研究提示“像病历的错误信息”最危险大模型正越来越多地被用于问诊分诊、病历总结和医学问答

Sun, 08 Mar 2026 07:20:12 GMT

医疗 AI 也会被误导——研究提示“像病历的错误信息”最危险

大模型正越来越多地被用于问诊分诊、病历总结和医学问答。但如果错误信息被包装得足够“像真的”，它们会不会照单全收？这项发表于 The Lancet Digital Health 的横断面基准研究，系统测试了 LLM 在医疗虚假信息面前的脆弱性。

研究团队评估了 20 个大语言模型，在 340 万条含医学错误信息的提示词中测试其易感性，错误信息来自社交媒体、临床笔记和模拟病例三类场景。结果显示，整体有 31.7% 的基础提示会让模型接受错误信息；其中临床笔记场景最危险，易感率高达 46.1%，显著高于社交媒体场景的 8.9%。不同模型表现差异明显，GPT-4 抗误导能力更强，而部分小模型和医学微调模型反而更容易“中招”。

这项研究最重要的提醒不是“模型不行”，而是医疗 AI 的部署不能只看答得像不像，还要看它在被误导时能否守住底线。未来真正关键的，可能是事实锚定、来源校验和上下文防御机制，而不是单纯更大的参数规模。

不是 AI 太笨，而是假病历太像真的——穿白大褂的谣言果然更危险。🩺🤖
📄 The Lancet Digital Health

#医疗AI #大语言模型 #医学虚假信息 #柳叶刀 #临床安全

🧬 频道｜ 🧑‍🔬 群组｜ 📨 投稿

大模型精准预测生理年龄，重塑健康管理近日，发表在《自然-医学》上的一项开创性研究指出，大语言模型（LLMs）能够仅通过常规体检报告，精准预测个体的整体及器官特定生理年龄

Sun, 27 Jul 2025 07:17:18 GMT

大模型精准预测生理年龄，重塑健康管理

近日，发表在《自然-医学》上的一项开创性研究指出，大语言模型（LLMs）能够仅通过常规体检报告，精准预测个体的整体及器官特定生理年龄。这项研究开发并利用了基于LLMs的框架，并在超过1000万参与者的六个大型队列中验证了其有效性和可靠性，预示着未来个性化健康评估和疾病预防的新范式。研究表明，与传统方法（如端粒长度、衰弱指数、表观遗传年龄和机器学习模型）相比，LLMs预测的生理年龄在评估疾病风险方面表现出显著优势，例如全因死亡率预测达到0.757的一致性指数，并在预测冠心病、中风、肾衰竭以及其他20多种健康结局上表现更佳。

这项创新性的LLMs评估框架，不仅能提供全面且经济高效的衰老评估，还能通过“年龄差”（即生理年龄与实际年龄的差距）有效识别潜在健康风险。研究团队发现，年龄差与多种衰老相关表型和疾病风险紧密相关，例如加速衰老与全因死亡率的风险增加1.055倍。此外，LLMs还能动态评估衰老进程，并识别出与加速衰老相关的蛋白质生物标志物，其中超过一半是此前未被报道的新发现。

这项研究的突破在于，LLMs无需昂贵的基因组或表观遗传数据，仅凭日常健康报告即可进行高效分析，大大降低了衰老评估的门槛。其强大的泛化能力和实时学习特性，使其在大规模人群健康管理中具备巨大潜力，为个性化健康干预和精准医疗提供了全新的工具。尽管如此，目前该模型在老年人群中的泛化能力仍有待提升，且主要依赖文本数据，未来有望整合更多模态数据以实现更全面的衰老评估。

以后体检完，AI直接告诉我“你比实际年龄老了五岁，该运动了！”——这感觉是福是祸呢？

Nature Medicine

#衰老 #大语言模型 #健康管理