文章题目:
Refined selection of individuals for preventive cardiovascular disease treatment with a transformer-based risk model
全文链接:
DOI:10.1016/j.landig.2025.03.005
影响因子/JCR分区:24 /Q1


文章主要内容:
该研究针对当前心血管疾病风险模型普遍存在的过度治疗推荐问题,以及在糖尿病等高风险人群中“一刀切”治疗策略缺乏个体化考量的问题,开发并验证了一种基于Transformer架构的生存预测模型—TRisk,用于精准评估初级预防人群与糖尿病患者的10年心血管疾病风险。TRisk模型在BEHRT(基于Transformer的电子健康记录模型)的架构基础上进行了关键改进:将原有的二分类结局预测拓展为生存分析模型,以有效处理心血管疾病风险预测中常见的随访数据截尾问题。该模型的核心方法在于直接利用电子健康记录中的时序多模态数据(包括诊断、用药和检查等信息),自动学习与风险相关的特征表示,无需依赖专家预先定义变量;同时采用迁移学习策略,首先在样本量更大的初级预防人群中进行预训练,再通过微调适配糖尿病等高危人群,从而避免了为不同患者亚组重复构建模型,显著提升了模型的泛化性能。
可专利性分析:若在该技术方案公开发表前,现有技术中未公开将Transformer架构改造为生存分析模型以处理电子健康记录截尾数据的方法,也未涉及“初级预防人群预训练-高危人群微调”的迁移学习策略,则该技术方案具备新颖性。其核心可专利点涵盖:
模型架构创新:本模型的核心创新在于首次将Transformer架构从常规的二分类预测改进为生存分析模型,充分利用EHR中的时序多模态数据(诊断、药物、检查等)进行端到端训练,自动学习风险表征,从而摆脱了对传统“专家驱动特征工程”的依赖;这种数据驱动方式能捕捉到人工难以定义的潜在风险关联(如药物与诊断间的复杂时序模式),为心血管风险预测提供了更丰富、更深入的信息维度。
模型训练方法创新:面向医疗人群适配的迁移学习策略。本研究采用的“预训练-微调”迁移学习策略,是一套专为解决医疗数据样本分布不均问题而设计的创新模型训练方法。该方法并非对通用迁移学习概念的简单应用,而是针对“高危人群样本量不足导致模型性能受限”与“‘一刀切’式全治疗策略缺乏精准性”这两个医疗领域特有的技术难题所提出的定制化解决方案。利用数据丰富的大人群(初级预防)来提升模型的基础能力,再通过数据稀缺的亚组(糖尿病患者)进行精准调优。这种方法实现了“在不同亚组中性能稳定,有助于减少风险评估中的人群差异”这一预料不到的技术效果,成功地将一个“通用”模型转化为一个“特异”且精准的模型。
可专利点拆解:本研究首次提出并成功验证了一种基于改进Transformer架构的生存分析模型(TRisk),用于解决传统心血管疾病风险预测中存在的过度治疗推荐与高危人群个体化评估缺失的双重难题。若未公开,可主要从以下三个方面申请专利:
1.模型架构创新:将Transformer架构(BEHRT)从二分类预测改造为生存分析模型,提出了一种处理电子健康记录中截尾数据的新方法;
2.训练策略创新:设计了“初级预防人群预训练-高危人群微调”的两阶段迁移学习框架,解决了不同亚组患者数据分布不均导致的模型泛化受限问题;
3.风险评估系统:构建了能够同时适用于初级预防人群与糖尿病患者的心血管风险分层系统,实现了跨人群的精准风险评估。
授权案例分析:
网络架构及数据处理联合改进---种基于超网络和联邦学习的预后预测预警模型训练方法、系统及设备

网络结构改进--一种基于双眼融合网络预测高血压的方法、系统和设备

网络模块改进--一种基于知识蒸馏的医学图像分割方法、系统、设备

总结:
在模型架构与训练方法的创新中,专利布局应体系化地覆盖两大层面:其一,在模型架构上,关注其模块化、可重构的设计思想与针对特定任务的核心结构优化;其二,在模型训练上,保护其创新的训练策略、学习范式,以及旨在提升训练效率与模型稳定性的独特方法。通过这种多维度的知识产权保护,将核心技术优势转化为持久的市场竞争力。
北京预立生科知识产权代理有限公司
北京预立生科知识产权代理有限公司是一家专注于生物医学领域的专利咨询、专利申报及技术转化公司。拥有一支由专利代理师和技术专家顾问组成的逾40人的专业团队,是中国最优秀的生物医学专利服务机构之一。区别于传统专利服务机构的全领域服务,预立生科服务领域聚焦,在医学细分领域发明专利授权率全国排名前三,已经与200多家医药企业、三甲医院及重点研究所达成合作,成功申报5000余项生物医学类专利。

欢迎扫码咨询