Exploring the use of large language models for classification, clinical interpretation, and treatment recommendation in breast tumor patient records
8.3
来源:
Nature
发布时间:
2025-08-27 03:40
摘要:
本研究比较了三种大型语言模型(GPT-4o、DeepSeek-R1和DeepSeek-V3)在乳腺肿瘤分类、疾病解释和治疗推荐中的表现。结果显示,GPT-4o在肿瘤分类准确性上表现最佳,而DeepSeek-R1在医生评分中表现突出,显示出其在临床决策支持中的潜力。研究强调了AI在乳腺肿瘤管理中的应用价值,尤其是在提高诊断效率和个性化治疗方面。
原文:
查看原文
价值分投票
评分标准
新闻价值分采用0-10分制,综合考虑新闻的真实性、重要性、时效性、影响力等多个维度。
评分越高,表示该新闻的价值越大,越值得关注。
价值维度分析
domain_focus
1.0分+核心领域符合度
business_impact
0.8分+获得医生认可
scientific_rigor
1.5分+有具体实验数据
timeliness_innovation
1.5分+技术创新
investment_perspective
2.5分+早期研发阶段
market_value_relevance
1.0分+高发疾病
team_institution_background
0.5分+知名机构背景
technical_barrier_competition
0.5分+技术壁垒一般
关键证据
GPT-4o在肿瘤分类中取得了最高的AUC值(0.848)。
DeepSeek-R1在疾病解释和治疗推荐方面获得了医生的最高评分。
研究显示AI在乳腺肿瘤管理中的应用潜力,尤其是在临床决策支持方面。
真实性检查
否
AI评分总结
本研究比较了三种大型语言模型(GPT-4o、DeepSeek-R1和DeepSeek-V3)在乳腺肿瘤分类、疾病解释和治疗推荐中的表现。结果显示,GPT-4o在肿瘤分类准确性上表现最佳,而DeepSeek-R1在医生评分中表现突出,显示出其在临床决策支持中的潜力。研究强调了AI在乳腺肿瘤管理中的应用价值,尤其是在提高诊断效率和个性化治疗方面。