Human level information extraction from clinical reports with finetuned language models

7.0
来源: Nature 关键字: computational pathology
发布时间: 2025-11-25 07:48
摘要:

研究开发了Strata,一个低代码库,利用微调的语言模型从临床报告中提取结构化数据,达到人类水平的准确性。通过评估多种开源模型,发现LoRa微调的Llama-3.1在多个数据集上表现优异,展示了在肿瘤学等领域的应用潜力。该技术不仅提高了数据提取的效率,还为本地研究数据库的构建提供了可行方案,具有较高的商业价值和创新性。

原文: 查看原文

价值分投票

评分标准

新闻价值分采用0-10分制,综合考虑新闻的真实性、重要性、时效性、影响力等多个维度。 评分越高,表示该新闻的价值越大,越值得关注。

价值维度分析

domain_focus

1.0

business_impact

0.8

scientific_rigor

1.5

timeliness_innovation

1.5

investment_perspective

2.5

market_value_relevance

1.0

team_institution_background

0.5

technical_barrier_competition

0.7

关键证据

LoRa-finetuned Llama-3.1 8B achieved non-inferior performance to the second human annotator across all four datasets.
Small, open-source LLMs offer an accessible solution for the curation of local research databases.
Strata enables automated human-level performance in extracting structured data from clinical notes.

真实性检查

AI评分总结

研究开发了Strata,一个低代码库,利用微调的语言模型从临床报告中提取结构化数据,达到人类水平的准确性。通过评估多种开源模型,发现LoRa微调的Llama-3.1在多个数据集上表现优异,展示了在肿瘤学等领域的应用潜力。该技术不仅提高了数据提取的效率,还为本地研究数据库的构建提供了可行方案,具有较高的商业价值和创新性。

评论讨论

发表评论