新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

资讯
24年12月25日
編輯

admin

12 月 25 日消息，由哈佛医学院和斯坦福大学组成的科研团队，在医学诊断领域深入评估 OpenAI 的 o1-preview 模型，发现其比人类医生更擅长诊断棘手的医疗案例。

根据研究报告，o1-preview 正确诊断了 78.3% 的测试案例，在 70 个特定案例的对比测试中，准确率更是高达 88.6%，显著优于其前身 GPT-4 的 72.9%。

使用医学推理质量评估标准量表 R-IDEA，o1-preview 在 80 个案例中取得了 78 个满分。相比之下，经验丰富的医生仅在 28 个案例中获得满分，住院医生则仅为 16 例。

在 25 位专家设计的复杂案例中，o1-preview 得分高达 86%，是使用 GPT-4 的医生（41%）和使用传统工具的医生（34%）的两倍多。

研究人员承认该测试存在局限性，部分测试案例可能包含在 o1-preview 的训练数据中，且测试主要集中于系统单独工作，并未充分考虑其与人类医生协同工作的场景；此外 o1-preview 建议的诊断测试成本高昂，在实际应用中存在局限性。

声明：内容来源公开的各类媒体平台，若收录的内容侵犯了您的权益，请联系邮箱，本站将第一时间处理。

{{userData.name}}已认证

新研究发现 OpenAI 的 o1-preview AI 模型在诊断棘手医疗案例方面优于医生

AI搜索的阴暗面，隐藏内容可操纵 ChatGPT 结果

Anthropic 新研究：打错字就能“越狱”GPT-4、Claude 等 AI 模型

AI微博

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai抖音

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

1ai微信

每天五分钟

一年变大神

扫码关注

{{userData.name}}已认证

相关内容：

AI搜索的阴暗面，隐藏内容可操纵 ChatGPT 结果

Anthropic 新研究：打错字就能“越狱”GPT-4、Claude 等 AI 模型

OpenAI 寻求联合好莱坞，开拓电影产业

报告称：OpenAI和Meta即将发布具有人类推理能力的AI模型

OpenAI 开放 GPT-4o 定制功能，企业可更轻松打造专属 AI 助手

新人事变动！OpenAI 任命前 Meta 高管负责战略规划

AI应用

5000+AI应用！每日更新

1AICLUB

强烈推荐！官方品牌微博

AI教程

海量教程看不完

AI基础训练营

零基础入门，带你成为AI高手

1ai大神

抖音号：1ai.net

1ai大神

抖音号：1ai.net

每天五分钟

一年变大神

扫码关注