#医学诊断

知识分享官

12:00 · 2026年5月4日 · 周一

来一点医学科学前沿🤯🤯🥹🥹

近半数 AI 聊天机器人医疗回答有问题：五大模型医疗准确性审计当你用 AI 聊天机器人问健康问题时，得到的答案靠谱吗？这项研究对这一问题进行了系统审计。随着 Gemini、DeepSeek、ChatGPT、Meta AI、Grok 等聊天机器人被大众广泛当作"搜索引擎"使用——包括查询日常健康和医疗问题——其回答质量却鲜有严格审查。研究人员在 2025 年 2 月对五大主流聊天机器人进行了压力测试：每个机器人回答 10 道来自癌症、疫苗、干细胞、营养和运动表现五个领域的问题，并使用对抗性提示策略（adversarial…

AI 已经能“像医生一样思考”了吗？一项顶级研究给出了冷静答案

很多人都有过这样的体验：看病时医生时间紧、信息不全，诊断往往依赖经验判断。那问题来了——如果把这些复杂病例交给 AI，它真的能做得更好吗？4 月底发表在《Science》的一项研究，首次把最新一代大语言模型，直接拉到真实医学场景中，与数百名医生“正面对比”。

研究团队评估了 OpenAI o1 系列模型在多种临床推理任务中的表现，包括《新英格兰医学杂志》的经典疑难病例、虚拟临床推理训练案例、真实急诊室患者，以及诊断和治疗方案制定等任务。结果显示，在多个实验中，o1 模型在诊断准确率、鉴别诊断质量和管理决策评分上，整体都高于住院医师和资深医生。例如，在 NEJM 疑难病例中，模型 78% 的情况下能把正确诊断纳入鉴别诊断；在真实急诊分诊阶段，模型给出“准确或非常接近正确诊断”的比例达到 67%，高于两位资深内科医生。研究并未深入解释模型“为什么”能做到这一点，只是指出其在信息有限、时间紧迫的场景下，综合文本信息的能力更稳定。

这并不意味着 AI 可以取代医生。作者明确强调，研究仅评估了文本推理能力，而真实医疗还依赖体格检查、影像、声音和情境判断。此外，这些结果主要来自内科和急诊医学，不能代表所有专科。更重要的是，目前研究只是“性能比较”，真正能否改善患者结局，还需要前瞻性临床试验。但可以确定的是，AI 作为“第二意见”的潜力已经非常现实，医疗系统需要开始认真思考如何安全地与它协作。

AI 已经在急诊分诊赢了医生，但离“真正看病”还差好几步 🤖🩺

📖Science ︱arXiv
🗓2026-04-30

#人工智能 #医学诊断 #大语言模型 #临床决策支持

Via：一往无前啊屁林

🧬 频道｜ 🧑‍🔬 群组｜ 📨 投稿

❤️ 5

人工智能医学诊断大语言模型临床决策支持
12:04 · 2026年4月8日 · 周三

一滴血诊断多种痴呆？AI模型突破传统诊断局限

老年人出现记忆下降、反应变慢或行为改变时，背后可能并不只是阿尔茨海默病一种原因。帕金森相关疾病、额颞叶痴呆、ALS，甚至脑血管事件后的改变，在早期都可能表现得有些相似。也正因为如此，临床上“分清到底是哪一种病”一直很难，往往需要结合脑脊液、PET 和影像学检查，流程复杂，成本也不低。

这篇发表于 Nature Medicine 的研究，核心不是单纯发现了某个新标志物，而是构建了一个新的深度联合学习蛋白组模型——ProtAIDe-Dx。研究团队利用血浆中的大量蛋白信息，让模型学习不同神经退行性疾病之间的差异模式，从而实现对六类与痴呆相关疾病状态的辅助鉴别。它不是只回答“是不是阿尔茨海默病”，而是会同时评估多种疾病的可能性，给出更接近真实临床场景的判断结果。

从科普角度看，可以把它理解成一种“看血液里复杂分子指纹”的方法。过去医生更多依赖单个或少数几个指标，而这类模型试图把许多蛋白信号一起读出来，再交给人工智能综合分析，寻找更细致的疾病特征。研究的意义在于，未来神经退行性疾病的初筛和分流，也许可以先通过更方便的血液检测完成，再决定谁需要接受进一步的高成本检查。

当然，这离日常临床普及还有距离。蛋白组学检测对样本处理、实验平台和不同人群差异都比较敏感，模型是否能在更多医院、更多国家和真实世界环境下稳定工作，还需要继续验证。但至少这项研究说明，用血浆蛋白组 + AI 做多病种痴呆相关疾病鉴别，已经开始从概念走向可测试的工具。

人话：以前是医生看几项指标硬猜，现在是把一大堆蛋白一起丢给 AI 算命，先看看这颗脑子到底更像哪边出了问题。

AI医生要上岗了？一滴血看六种病，未来可期！

📖Nature Medicine
🗓2026-03-31

#医学研究 #神经退行性疾病 #阿尔茨海默病 #人工智能

Via：国一打野余则成

🧬 频道｜ 🧑‍🔬 群组｜ 📨 投稿

医学研究神经退行性疾病阿尔茨海默病人工智能
15:20 · 2026年3月8日 · 周日

医疗 AI 也会被误导——研究提示“像病历的错误信息”最危险

大模型正越来越多地被用于问诊分诊、病历总结和医学问答。但如果错误信息被包装得足够“像真的”，它们会不会照单全收？这项发表于 The Lancet Digital Health 的横断面基准研究，系统测试了 LLM 在医疗虚假信息面前的脆弱性。

研究团队评估了 20 个大语言模型，在 340 万条含医学错误信息的提示词中测试其易感性，错误信息来自社交媒体、临床笔记和模拟病例三类场景。结果显示，整体有 31.7% 的基础提示会让模型接受错误信息；其中临床笔记场景最危险，易感率高达 46.1%，显著高于社交媒体场景的 8.9%。不同模型表现差异明显，GPT-4 抗误导能力更强，而部分小模型和医学微调模型反而更容易“中招”。

这项研究最重要的提醒不是“模型不行”，而是医疗 AI 的部署不能只看答得像不像，还要看它在被误导时能否守住底线。未来真正关键的，可能是事实锚定、来源校验和上下文防御机制，而不是单纯更大的参数规模。

不是 AI 太笨，而是假病历太像真的——穿白大褂的谣言果然更危险。🩺🤖
📄 The Lancet Digital Health

#医疗AI #大语言模型 #医学虚假信息 #柳叶刀 #临床安全

🧬 频道｜ 🧑‍🔬 群组｜ 📨 投稿

🌚 5 ❤️ 2

医疗AI 大语言模型医学虚假信息柳叶刀临床安全
14:58 · 2026年2月15日 · 周日

可穿戴AI设备实现斜视“一键”诊断？新方法或改变传统检查方式

斜视是影响约4%儿童的常见问题，不仅损害视力，还可能引发心理困扰。传统诊断需多种仪器，步骤繁琐，儿童难以配合，成本也较高。一项新研究提出了一种AI集成的可穿戴设备，可能让诊断更简单。

该设备像皮肤一样轻薄（约60微米厚），佩戴在眼睑上，通过多方向应变传感器测量眼睑变形。结合生物力学模型和AI算法，能同时测量斜视角度并识别受影响的肌肉。研究显示，其四方向分类准确率达96.6%，测量精度为1.2度，与临床标准高度一致。

这项技术将生物力学传感与数字诊断结合，可能提高诊断客观性，降低成本，尤其对儿童友好。不过，目前研究主要基于儿童样本，且仍需更多临床验证，以确定是否适用于所有斜视类型。

斜视检查终于不用再被仪器“折磨”啦！🤩

来源：Science advances

#斜视诊断 #可穿戴设备 #人工智能 #儿童视力 #医疗科技

🧬 频道｜ 🧑‍🔬 群组｜ 📨 投稿

❤️ 5

斜视诊断可穿戴设备人工智能儿童视力医疗科技

Search: #医学诊断