Hugging Face 博客作者 Maziyar Panahi 于 2025 年 7 月 16 日发表文章,宣布推出 “OpenMed” 计划,向全球开放 380 多款医学/临床文本命名实体识别(NER)模型,以期打破高价闭源工具对医疗 AI 的封锁。
完全免费、Apache 2.0 许可证,可商用、可改写、可分发
模型规模丰富——参数量从 109 M 到 568 M,覆盖轻量级到 XXLarge
高质验证——在 13 + 标准医学数据集上测试,单模型 F1 最高达 0.998
在常见数据集(如 BC4CHEMD、BC5CDR、NCBI‑Disease 等)上,OpenMed 模型多数超越 Spark NLP、BioBERT 等闭源/商业 SOTA,最大领先幅度达 36 个百分点。
源