Exploring the use of large language models for classification, clinical interpretation, and treatment recommendation in breast tumor patient records

8.3
来源: Nature
发布时间: 2025-08-27 03:40
摘要:

本研究比较了三种大型语言模型(GPT-4o、DeepSeek-R1和DeepSeek-V3)在乳腺肿瘤分类、疾病解释和治疗推荐中的表现。结果显示,GPT-4o在肿瘤分类准确性上表现最佳,而DeepSeek-R1在医生评分中表现突出,显示出其在临床决策支持中的潜力。研究强调了AI在乳腺肿瘤管理中的应用价值,尤其是在提高诊断效率和个性化治疗方面。

原文: 查看原文

价值分投票

评分标准

新闻价值分采用0-10分制,综合考虑新闻的真实性、重要性、时效性、影响力等多个维度。 评分越高,表示该新闻的价值越大,越值得关注。

价值维度分析

domain_focus

1.0分+核心领域符合度

business_impact

0.8分+获得医生认可

scientific_rigor

1.5分+有具体实验数据

timeliness_innovation

1.5分+技术创新

investment_perspective

2.5分+早期研发阶段

market_value_relevance

1.0分+高发疾病

team_institution_background

0.5分+知名机构背景

technical_barrier_competition

0.5分+技术壁垒一般

关键证据

GPT-4o在肿瘤分类中取得了最高的AUC值(0.848)。
DeepSeek-R1在疾病解释和治疗推荐方面获得了医生的最高评分。
研究显示AI在乳腺肿瘤管理中的应用潜力,尤其是在临床决策支持方面。

真实性检查

AI评分总结

本研究比较了三种大型语言模型(GPT-4o、DeepSeek-R1和DeepSeek-V3)在乳腺肿瘤分类、疾病解释和治疗推荐中的表现。结果显示,GPT-4o在肿瘤分类准确性上表现最佳,而DeepSeek-R1在医生评分中表现突出,显示出其在临床决策支持中的潜力。研究强调了AI在乳腺肿瘤管理中的应用价值,尤其是在提高诊断效率和个性化治疗方面。

评论讨论

发表评论