Prompt-dependent performance of multimodal AI model in oral diagnosis: a comprehensive analysis of accuracy, narrative quality, calibration, and latency versus human experts

7.0

来源： Nature 关键字： computational pathology

发布时间： 2025-10-30 23:36

摘要：

本研究评估了多模态AI模型（Gemini Pro 2.5）在口腔诊断中的表现，比较了不同提示策略（直接提示、链式思维、自我反思）对诊断准确性和叙述质量的影响。结果表明，尽管人类专家在简单病例中表现更佳，但链式思维提示在复杂病例中表现突出，显示出AI在临床决策支持中的潜力。研究强调了提示设计在优化AI性能中的重要性，并为未来的临床应用提供了重要见解。

原文：查看原文

价值分投票

评分标准

新闻价值分采用0-10分制，综合考虑新闻的真实性、重要性、时效性、影响力等多个维度。评分越高，表示该新闻的价值越大，越值得关注。

价值维度分析

domain_focus

1.0分+重点关注领域符合度

business_impact

1.0分+商业影响力

scientific_rigor

1.5分+数据支撑的科学性

timeliness_innovation

1.5分+时效性与创新性

investment_perspective

2.5分+BOCG投资视角

market_value_relevance

1.0分+市场价值相关性

team_institution_background

0.0分+团队与机构背景

technical_barrier_competition

0.5分+技术壁垒与竞争格局

关键证据

研究显示链式思维提示策略在复杂病例中提高了AI的可靠性。

人类专家在简单病例中表现优越，AI在复杂病例中显示潜力。

研究在多个学术中心进行，确保了数据的多样性和可靠性。

真实性检查

否

AI评分总结