Human level information extraction from clinical reports with finetuned language models
7.0
来源:
Nature
关键字:
computational pathology
发布时间:
2025-11-25 07:48
摘要:
研究开发了Strata,一个低代码库,利用微调的语言模型从临床报告中提取结构化数据,达到人类水平的准确性。通过评估多种开源模型,发现LoRa微调的Llama-3.1在多个数据集上表现优异,展示了在肿瘤学等领域的应用潜力。该技术不仅提高了数据提取的效率,还为本地研究数据库的构建提供了可行方案,具有较高的商业价值和创新性。
原文:
查看原文
价值分投票
评分标准
新闻价值分采用0-10分制,综合考虑新闻的真实性、重要性、时效性、影响力等多个维度。
评分越高,表示该新闻的价值越大,越值得关注。
价值维度分析
domain_focus
1.0
business_impact
0.8
scientific_rigor
1.5
timeliness_innovation
1.5
investment_perspective
2.5
market_value_relevance
1.0
team_institution_background
0.5
technical_barrier_competition
0.7
关键证据
LoRa-finetuned Llama-3.1 8B achieved non-inferior performance to the second human annotator across all four datasets.
Small, open-source LLMs offer an accessible solution for the curation of local research databases.
Strata enables automated human-level performance in extracting structured data from clinical notes.
真实性检查
否
AI评分总结
研究开发了Strata,一个低代码库,利用微调的语言模型从临床报告中提取结构化数据,达到人类水平的准确性。通过评估多种开源模型,发现LoRa微调的Llama-3.1在多个数据集上表现优异,展示了在肿瘤学等领域的应用潜力。该技术不仅提高了数据提取的效率,还为本地研究数据库的构建提供了可行方案,具有较高的商业价值和创新性。