Grok‑4 爆火出圈，但在生物推理面前，它还不够“聪明”

5.9

来源： BioTender

发布时间： 2025-07-11 17:31

摘要：

Grok‑4模型在医学影像识别中表现优异，但在生物推理任务上仍然不及专业模型，显示出通用模型和领域专用模型之间的能力差异。文章讨论了Grok‑4在生物推理方面的局限性以及未来的发展方向。

原文：查看原文

评分标准

新闻价值分采用0-10分制，综合考虑新闻的真实性、重要性、时效性、影响力等多个维度。评分越高，表示该新闻的价值越大，越值得关注。

2.5分|涉及AI在生物领域的应用，属于前沿技术，但主要集中在通用模型的讨论。

0.5分|虽无直接的商业动态，但Grok-4的能力对医疗影像行业有间接影响。

2.4分|引用了具体的准确率数据，但缺乏临床数据及权威验证。

0.5分|通用模型的进步可能对生物医学研究者产生影响。

0.8分|Grok‑4的发布及其在医学图像识别的表现具有时效性，但创新性较低。

Grok‑4在Chest Agent胸部X光解读中以72.8%的准确率超过MedRAX的63.1%。

在生物推理任务中，Grok‑4仅达85%的准确率，低于专业模型的97.2%。

文章讨论了通用大模型与领域专用模型的性能对比，提出对未来AI发展的看法。

否