患者数据永不离开你的设备一行代码临床文本变结构化——无API、无供应商锁定、无网络调用 先看一个场景矛盾在哪你是一个医院信息科的技术人员或者一家医疗AI创业公司的开发者。临床医生给你一堆病历出院小结、影像报告、化验单……他们要你“提取出里面的疾病、药物、检查结果”。你怎么办传统方案的死结方案问题用商业医疗AI API比如AWS Comprehend Medical、Google Healthcare API数据要发到云端患者隐私谁负责HIPAA合规成本高得离谱自己训练模型需要标注好的医疗数据——贵、慢、医疗标注找专业医生更贵用开源通用NLP模型医疗术语太专业通用模型一塌糊涂。“AML”它可能以为是“上午”其实是“急性髓系白血病”核心矛盾医疗数据极度敏感不能出网络但高性能的医疗AI模型又被锁在商业API里。✅ OpenMed 的解法OpenMed 是一套“本地优先”的医疗AI工具包。1000 个专业医疗模型全部可以在你自己的硬件上运行——CPU、GPU、Apple SiliconM系列芯片都行。患者数据从不离开你的设备或网络。fromopenmedimportanalyze_text resultanalyze_text(Patient started on imatinib for chronic myeloid leukemia.,model_namedisease_detection_superclinical,)# 输出# DISEASE chronic myeloid leukemia 0.98# DRUG imatinib 0.95一行代码本地运行。没有API密钥没有网络调用数据不出门。 它跟云端医疗API有什么不同OpenMedAWS / Google 医疗API运行位置你的设备/服务器他们的云端患者数据离开你的网络❌ 从不✅ 发送给供应商成本免费、开源按调用付费长期用很贵专业医疗模型数1000有限通用为主离线/内网部署✅ 支持❌ 不行供应商锁定无Apache 2.0有 一个特别亮点苹果生态原生支持OpenMed 跟 Apple SiliconM1-M4 芯片深度集成MLX加速Apple 自己的机器学习框架通过OpenMedKit可以直接集成到iOS / iPadOS / macOS 应用里PII检测、临床实体抽取完全在设备本地完成// 加到你的Swift包里dependencies:[.package(url:https://github.com/maziyarpanahi/openmed.git,from:1.5.5),]一句话解释MLX 是苹果做的机器学习框架专门给M系列芯片加速。比 PyTorch 在 Mac 上跑得更快、内存占用更小。 它能干什么1. 医疗实体抽取NER命名实体识别从临床文本里抽取出疾病和诊断chronic myeloid leukemia、Type 2 diabetes药物和治疗imatinib、75mg clopidogrel解剖部位left ventricle、liver基因和蛋白质BRCA1、EGFRfromopenmedimportanalyze_text resultanalyze_text(Patient with NSTEMI and hypertension, started on clopidogrel.,model_namepharma_detection_superclinical,)forentityinresult.entities:print(f{entity.label}:{entity.text})# DRUG: clopidogrel# CONDITION: NSTEMI, hypertensionNER命名实体识别就是让计算机从一段文字里“挑出”特定类型的词——比如人名、地名、疾病名、药名。医疗版NER要能认出imatinib是药NSTEMI是病。2. PII检测与去标识化脱敏医疗数据最怕“泄露患者隐私”。OpenMed能自动找出病历里的姓名、出生日期、地址社保号SSN、病历号MRN电话号码、邮箱身份证、驾照号……覆盖HIPAA全部18类标识符fromopenmedimportextract_pii,deidentify textPatient: John Doe, DOB: 01/15/1970, SSN: 123-45-6789# 找出PIIresultextract_pii(text,model_namepii_superclinical_large)# 多种脱敏方式deidentify(text,methodmask)# [NAME], [DATE]deidentify(text,methodreplace)# 伪造真实感的数据保留格式deidentify(text,methodhash)# 加密哈希deidentify(text,methodshift_dates,date_shift_days180)# 日期偏移关键能力智能实体合并——01/15/1970不会被拆成01/15和1970两个碎片。PII个人身份信息能直接或间接定位到具体人的信息比如姓名、身份证号、病历号。医疗AI处理这些信息前必须先“脱敏”。HIPAA美国医疗信息隐私保护法案规定了18类需要保护的标识符。不合规罚款很重。3. 多语言支持12种语言的PII检测总计247个PII检查点语言代码语言代码英语en法语fr德语de意大利语it西班牙语es荷兰语nl葡萄牙语pt印地语hi泰卢固语te阿拉伯语ar日语ja土耳其语tr# 葡萄牙语示例extract_pii(Paciente: Pedro Almeida, CPF: 123.456.789-09,langpt) 核心模型一览模型名专长实体类型模型大小disease_detection_superclinical疾病与病症DISEASE, CONDITION, DIAGNOSIS434Mpharma_detection_superclinical药物与用药DRUG, MEDICATION, TREATMENT434Mpii_superclinical_largePII与去标识化18类HIPAA标识符434Manatomy_detection_electramed解剖与身体部位ANATOMY, ORGAN, BODY_PART109Mgene_detection_genecorpus基因与蛋白质GENE, PROTEIN109M模型大小如434M指模型参数数量4.34亿个。参数越多模型越“聪明”但对硬件要求也更高。109M的模型可以在老一点的CPU上跑434M的建议有GPU或M系列Mac。 三种使用方式1. Python API最直接pipinstallopenmed[hf]fromopenmedimportanalyze_text,extract_pii# NER抽取resultanalyze_text(Patient with AML and diabetes.,model_namedisease_detection_superclinical)# PII检测piiextract_pii(John Doe, SSN: 123-45-6789,model_namepii_superclinical_large)2. REST服务部署成APIpipinstallopenmed[hf,service]uvicorn openmed.service.app:app--host0.0.0.0--port8080curl-XPOST http://127.0.0.1:8080/pii/extract\-HContent-Type: application/json\-d{text:Paciente: Maria Garcia, DNI: 12345678Z,lang:es}3. 离线/内网部署没有互联网的环境比如医院内网、研究机构的隔离网络也能用resultanalyze_text(Patient presents with chronic myeloid leukemia.,model_id./models/OpenMed-NER-DiseaseDetect-SuperClinical-434M,# 本地路径configOpenMedConfig(devicecpu),) 谁应该用 OpenMed人群为什么适合医院/医疗机构的IT/数据团队患者数据不能出网。OpenMed本地部署合规无忧医疗AI创业公司不用重新训练模型直接用1000个专业模型省几百万标注费制药公司/CRO合同研究组织从海量临床试验文本、文献里抽实体全程在自己服务器上跑医学研究机构病历去标识化后做研究不暴露患者隐私个人开发者/黑客马拉松免费、开源、一行代码跑起来不用申请任何API keyMac/iOS开发者OpenMedKit让你在iPhone上跑医疗AI完全本地不联网一个典型的“冲突”场景问题某三甲医院想做“智能病历结构化”从出院小结里自动抽疾病和药物。但IT部门规定任何患者数据不得上传至公有云。之前要么自己招团队训练模型投入大、周期长要么放弃。现在OpenMed 直接部署在内网服务器上模型本地加载数据不出院区。一行 Python 就能跑。 技术原理通俗版1. 模型从哪来OpenMed 聚合了 Hugging Face 上 1000 个领域适应domain-adapted的生物医学模型。这些模型用大量的生物医学文献、临床笔记、出院小结训练过所以能认出imatinib是药NSTEMI是病。2. 怎么跑在你本地模型下载到本地后OpenMed 用 Hugging Face 的transformers库加载推理inference。你可以选devicecpu任何电脑都能跑慢一点devicecuda有NVIDIA显卡快很多devicempsMac M系列用苹果的Metal加速3. 隐私过滤器Privacy Filter基于 OpenAI 发布的 Privacy Filter 架构专门做PII检测。OpenMed 提供了三个变体openai/privacy-filterOpenAI原始版本OpenMed/privacy-filter-nemotron用NVIDIA的Nemotron数据集微调更准OpenMed/privacy-filter-multilingual支持12种语言这些模型在MLX加速下iPhone上也能跑。✅ 总结层次核心内容解决了什么矛盾医疗数据敏感不能上云 ↔ 高性能医疗AI被锁在商业API里。OpenMed让医疗AI本地运行数据不出设备核心能力①医疗实体抽取疾病/药物/基因②PII检测与脱敏18类HIPAA③12种语言 ④1000模型 ⑤苹果生态原生支持谁来用医院IT、医疗AI创业、药企、研究人员、Mac/iOS开发者怎么开始pip install openmed[hf]→from openmed import analyze_text→ 一行代码跑起来 立即开始pipinstallopenmed[hf]fromopenmedimportanalyze_text resultanalyze_text(Patient started on imatinib for chronic myeloid leukemia.,model_namedisease_detection_superclinical,)print([(e.label,e.text)foreinresult.entities])# [(DISEASE, chronic myeloid leukemia), (DRUG, imatinib)]Apache 2.0 许可证 · 无供应商锁定 · 你的数据永远只属于你