提前11年预判糖尿病风险的底层逻辑
日期:2026-03-17 19:20:36 / 人气:1

有没有过这样的经历:体检时空腹血糖、糖化血红蛋白全在正常范围,没过几年却被确诊糖尿病前期;明明和朋友吃了一样的米饭,他的血糖纹丝不动,你的数值却飙升到超标;医生拿着你的化验单,只能告诉你“血糖有点高,控制饮食”,却没法精准预判你的血糖未来会不会恶化、什么时候会出问题。
这不是医生的能力有限,而是我们对血糖的传统认知,从根上就有盲区。
2026年1月,Nature发表了来自魏茨曼科学研究所等机构的团队,开发出了全球首个面向连续血糖监测(CGM)的基础大模型GluFormer。它只用一次短期的动态血糖数据,就能提前11年预判糖尿病发病和心血管死亡风险,准确率远超医院沿用数十年的金标准——糖化血红蛋白;它能精准复刻人体血糖变化规律,甚至能结合饮食,预判你吃完一顿饭后血糖的每一次波动。
作为跨界阅读,我希望能在自己读懂的情况下,用普通人能听懂的话讲清这项研究到底厉害在哪,之后我们再拆解它背后的科学逻辑,带你刷新对血糖、对AI赋能生命科学的认知。
我们对血糖的认知,一直困在快照陷阱里
在讲这项突破之前,先科普三个最核心概念。
糖化血红蛋白(HbA1c):这是目前临床诊断糖尿病的金标准,它反映的是你过去2-3个月的平均血糖水平。
连续血糖监测(CGM):这是一种能24小时不间断监测血糖的设备,每隔几分钟就会记录一次血糖值。如果说空腹血糖是给血糖拍了一张快照,糖化血红蛋白是三个月的平均成绩单,那CGM就是给你的血糖变化拍了一部完整的纪录片。
基础大模型:我们熟悉的ChatGPT是语言大模型,它通过学习海量文本,掌握了人类语言的规律;而GluFormer是血糖领域的基础大模型,它通过学习上千万条血糖数据,掌握了人体血糖变化的底层生理规律。
过去几十年,临床对血糖的评估,始终困在快照陷阱里:我们只看空腹血糖、糖化血红蛋白这两个静态数值,却完全忽略了CGM记录的、血糖动态变化里藏着的海量健康信息。不是医生不想看,而是根本看不过来。一个人两周的CGM数据就有成千上万条,里面藏着血糖的波动幅度、餐后峰值、夜间变化、日间差异等上百个维度的信息,人工只能提取出平均血糖、目标范围内时间等几个简单指标,90%以上的有效信息都被浪费了。
更关键的是,传统方法有一个致命短板:它只能判断你现在有没有糖尿病,却没法精准预判未来会不会得糖尿病、什么时候会出问题。很多人糖化血红蛋白完全正常,但血糖的动态规律已经出现了异常,等到数值超标时,代谢损伤已经不可逆了。
而GluFormer的出现,彻底打破了这个困局。
GluFormer:一个能读懂人体血糖规律的AI
GluFormer的本质,是一个专门为血糖数据而生的Transformer生成式大模型,我们可以把它的学习和工作过程,拆解成3个通俗易懂的步骤(参加后面的图1)。
第一步:用千万级数据,让AI自学血糖的底层规律
和传统AI一个任务、一次标注、一次训练的模式完全不同,GluFormer用的是自监督学习——这也是它最核心的创新之一。
通俗来说,传统AI就像一个死记硬背的学生,你必须给它每一道题都标好正确答案,它才能学会解题;而自监督学习,是让AI自己当自己的老师,从海量无标注的数据里找规律。
研究团队给模型喂了10812名受试者的超1000万条血糖测量数据,训练方式非常简单:给AI看一段历史血糖数据,遮住后面的数值,让它预测下一个时间点的血糖值。就像我们学说话,看了前半句接后半句,读的文章多了,自然就懂了语言的语法和逻辑;AI反复做这个预测游戏,慢慢就彻底学会了人体血糖变化的生理语法。最终,训练好的模型拥有了两个核心能力:
它能把一个人上千条的血糖数据,压缩成一个1024维的代谢数字身份证(学术名:嵌入向量/表征)。这个身份证里,藏着这个人血糖变化的全部规律、代谢健康的底层状态,甚至未来的患病风险,比几十项血检指标包含的信息还丰富。
它能生成和真人实测几乎完全一致的血糖变化曲线,完美复刻健康人、糖尿病人、肥胖人群等不同群体的血糖特征,说明它不是死记硬背数据,而是真的理解了血糖背后的生理规律。
第二步:跨人群通用,打破AI水土不服的魔咒
很多医疗AI都有一个通病:在训练用的数据集里表现完美,换一家医院、换一个人群、换一个品牌的监测设备,性能就会大幅下滑,也就是我们常说的水土不服。
而GluFormer在设计之初,就解决了这个问题。研究团队用覆盖5个国家、8种不同品牌CGM设备、19个外部队列、6044名受试者的数据做了验证,人群涵盖健康人、糖尿病前期、1型/2型糖尿病、妊娠糖尿病、肥胖人群、乳腺癌康复者等。
结果让人震撼:哪怕是完全没见过的人群、设备、疾病状态,GluFormer依然能稳定发挥,生成的血糖曲线和实测值相关系数始终保持在0.8以上(满分1,0.8以上属于极高相关性)。这意味着,它学会的不是某一群人的血糖特征,而是全人类血糖变化的通用生理规律。
第三步:三大实用能力,覆盖从预防到治疗的全场景
基于这个代谢数字身份证,GluFormer解锁了三个极具临床价值的核心能力,完全重构了血糖管理的全流程:
风险预判:只用一次短期CGM数据,就能精准分层未来糖尿病、心血管死亡的发病风险,实现疾病的早筛早防;
治疗效果预判:在药物、饮食干预开始前,就能提前预判这个治疗方案对患者有没有效,帮医生给患者选最合适的个性化方案,也能大幅提升临床试验的效率;
个性化饮食指导:模型的多模态版本能整合饮食数据,精准预测吃不同食物后的血糖变化,告诉你吃什么、怎么吃,血糖不会飙升,真正实现千人千面的控糖饮食。
硬核证据:文章中五张图,看懂这个AI的颠覆性实力
论文里有五张图表,可以看做是GluFormer血糖AI模型的全景功能说明书,从模型原理、核心能力到临床价值,用可视化的方式把复杂的技术和数据讲得明明白白,下面我们逐张拆解,用普通人能听懂的话讲清每张图的核心信息。
图1:GluFormer模型全景图——它是什么、怎么训练、能做什么
这张图是整个研究的总览,相当于给这个血糖AI做了一张功能地图,分4个模块讲清了模型的全貌。
图1a:模型的核心架构与训练逻辑
GluFormer用的是和大语言模型同类的Transformer架构,它不学文字,专门学血糖变化规律。
首先,研究把10812个人的超1000万条血糖数值,转换成AI能读懂的“数字令牌”(就像把汉字转换成AI认识的字),然后用自回归预测训练它:给AI看一段历史血糖数据,让它猜下一个时间点的血糖值,就像给你看文章前半句,让你接后半句。通过反复做这个训练,AI就彻底学会了人体血糖变化的底层生理规律。图里还标注了AI的核心运算组件:多头自注意力(让AI同时盯住饭前、饭后、夜间等多个血糖变化的关键节点,不遗漏重要信息)、标准化层(给数据做统一格式化,让AI学得更高效)、MLP运算层(AI的“大脑加工区”,把看到的血糖信息处理成有用的结论)。最终训练好的AI有两个核心能力:一是生成符合生理规律的血糖变化曲线,二是把一个人的全套血糖数据,压缩成一个1024维的数字标签(表征/嵌入向量),这个标签里藏着这个人代谢健康的全部秘密,用来完成各种后续任务。
图1b:模型的水土不服测试——跨人群泛化能力
这部分验证了AI不是只会做训练过的题,换场景、换人群照样能用。研究用19个外部队列验证它,覆盖5个国家(以色列、美国、西班牙、澳大利亚、中国,图中标注了每个国家的受试者人数)、8种不同品牌的血糖监测设备,人群涵盖健康人、糖尿病前期、1/2型糖尿病、妊娠糖尿病、肥胖人群、乳腺癌康复者等。简单说,这个AI在以色列健康人身上学会的血糖规律,拿到中国的糖尿病人、美国的肥胖人群里,照样能稳定发挥,不会因为换了人、换了设备就失灵。
图1c:第一个实用功能——提前预判临床试验/治疗的效果
这部分讲AI能帮医生和临床试验做预判。在药物、饮食等干预治疗开始前,只需要用受试者的基线血糖数据,通过AI生成数字标签,就能提前预判这个治疗方案对受试者有没有用:比如能不能降低他的糖化血红蛋白(糖尿病核心金标准),能不能改善他的BMI、血压、血脂、体脂率等指标。这个能力能帮临床试验更快筛选出合适的受试者,也能帮医生提前给患者选更合适的治疗方案,不用等几个月才知道药有没有效果。
图1d:第二个实用功能——结合饮食,精准预判餐后血糖
这是AI的多模态升级版本,不止看血糖数据,还能把饮食信息加进去。研究把巧克力、披萨、沙拉、咖啡等食物的营养成分(碳水、蛋白质、脂肪、胆固醇等)也转换成数字令牌,和血糖数据同步喂给AI。这样一来,AI就能结合吃了什么,精准预测吃完之后的血糖会怎么变,还能生成完整的血糖变化轨迹。简单说,你告诉AI中午要吃一碗意面,它就能精准给你画出来:吃完后血糖多久会升到峰值、最高升到多少、多久能降到正常水平。
图2:AI生成的血糖数据,和真人实测的几乎一模一样
GluFormer生成的合成血糖数据,不是瞎编的数字,完全符合真实的人体生理规律,和真人戴动态血糖仪测出来的数据高度匹配。
图2a:3个受试者的单日血糖对比(个体验证)
这是最直观的真假对比。左边的折线图里,黑色线是受试者真实测出来的24小时血糖曲线,蓝、橙、绿三条线,是AI用不同随机种子生成的3条血糖曲线。能清晰看到,三条生成的曲线和真实的黑线几乎完全贴合,血糖波动的时间、峰值、谷值都精准对应。
右边的雷达图,是把临床医生最关注的血糖核心指标(平均血糖、波动幅度、目标范围内时间、高血糖时间等)做成了可视化对比,真实值和AI生成值的雷达轮廓几乎完全重合,说明AI生成的数据,不光曲线长得像,连临床关键指标都和真人分毫不差。
补充说明:AI是只用受试者前一天的真实血糖数据,就生成了第二天的完整曲线,相当于看了你周一的血糖,就能精准模拟出你周二的血糖变化。
图2b:大样本的量化验证(群体级准确性)
个例准确不算本事,这部分验证了AI在成百上千人的大样本里,依然能保持高准确率。图里的每个散点代表一个受试者,横坐标是这个人真实的指标数值,纵坐标是AI生成的指标数值。如果点都集中在对角线上,就说明生成值和真实值几乎完全一致。
结果显示:平均血糖、血糖管理指标(GMI)的相关系数R=0.98(满分1,几乎是完美匹配);低血糖时间、目标范围内时间的相关系数也达到0.89、0.79,都属于极高的相关性。这就证明,AI不是蒙对了几个人,是真的掌握了血糖变化的通用规律。
图2c:跨人群的稳定性验证(泛化能力再确认)
这部分验证了AI在不同人群、不同研究里,生成能力依然稳定。图里的每一组柱子,对应一个研究队列,不同颜色代表不同血糖指标,柱子高度是生成值与真实值的相关系数。
能看到,不管是健康人、肥胖人群、1/2型糖尿病人、妊娠糖尿病人,在所有队列里,所有核心指标的相关系数都在0.75以上,统计学上极其显著。只有血糖波动幅度这类受短期饮食、运动影响极大的指标,在部分队列里相关系数稍低,整体表现依然远超行业常规水平。
图3:AI预判糖尿病和心血管死亡,比医院金标准还准
这是整个研究最重磅的临床价值证明,核心结论是:只需要一次短期动态血糖数据,这个AI就能提前数年预判你会不会得糖尿病、会不会发生心血管死亡,准确率远超现在医院通用的糖化血红蛋白(HbA1c)金标准。
图3a:糖尿病前期人群的2年病情进展预判
糖尿病前期(糖化血红蛋白5.7%-6.4%)是糖尿病的“后备军”,但现有的医疗手段,很难预判这些人里哪些会进展成糖尿病,哪些能稳住甚至好转。
研究选了337名糖尿病前期受试者,分成两组做对比:一组用AI的GluFormer风险评分,分成低到高4个风险等级(Q1最低,Q4最高);另一组用医院实测的糖化血红蛋白,同样分成4个等级,跟踪2年看他们的糖化血红蛋白变化。
结果一目了然:
AI分组里,最高风险Q4组,2年里糖化血红蛋白平均涨了0.18%,最低风险Q1组,糖化平均降了0.13%,两组差异极其显著,中间的Q2、Q3也呈梯度变化,完美分开了“会加重”和“会好转”的人群;
而用实测糖化血红蛋白分的组,四个等级的2年糖化变化几乎没有差别,统计学上完全分不开谁会进展、谁会好转。
通俗说:现在医生看你是糖尿病前期,只能让你定期复查;而这个AI看一眼你的动态血糖,就能精准揪出真正需要干预的高风险人群,提前2年预判病情走向。
图3b:长达11年的长期结局预判
这部分用了西班牙的AEGIS队列,580名普通成年人,只测了短期的动态血糖,研究人员跟踪了他们整整11年,看谁得了糖尿病、谁因为心血管病去世。
糖尿病发病预判
:用AI评分分的最高风险25%人群里,11年里65.8%的人都得了糖尿病;而最低风险25%的人群里,只有7.3%发病。生存曲线两条线分得极开,统计学差异极其显著。而用实测糖化血红蛋白分的组,高风险和低风险人群的发病率几乎没差别,完全分不开。
心血管死亡预判
:结果更震撼——AI评分最高的25%人群里,集中了69.2%的心血管死亡事件;而最低风险25%的人群里,11年里没有一个人因为心血管病去世!反观实测糖化血红蛋白分组,依然完全无法区分死亡风险,没有统计学差异。
图4:不管是当下还是未来4年,AI的预测能力都碾压现有方法
这张图做了更全面的对比,把AI和目前业内最权威的两种CGM分析方法做了头对头比拼:一个是iglu(业内通用的CGM综合分析工具,能算出几十种血糖指标),一个是GMI(临床公认的、用CGM估算糖化血红蛋白的金标准)。
图表分a、b、c三部分,分别对应测血糖的当下、2年后、4年后三个时间节点,核心验证AI对临床指标的预测能力,三个维度的结果高度一致:
预测准度(皮尔逊相关系数)
不管是预测当下、2年还是4年后的糖化血红蛋白、空腹血糖,GluFormer的相关系数全程最高,而且预测的时间越久,和另外两种方法的差距越大。比如预测4年后的空腹血糖,AI的相关系数0.43,iglu只有0.32,GMI仅0.28。
糖尿病发病识别能力(ROC AUC)
满分1,数值越高,区分“会不会得糖尿病”的能力越强。在基线、2年、4年三个节点,AI的AUC分别是0.75、0.72、0.73,全程碾压iglu和GMI,哪怕是4年的长期预测,依然保持高准确率。
临床实用价值(决策曲线分析)
曲线越靠上,代表用这个指标做临床判断,给患者带来的实际收益越高。能看到,在临床常用的绝大多数阈值范围内,GluFormer的曲线都在最上方,远高于iglu和GMI,也比“所有人都治疗”“所有人都不治疗”两个极端策略更优,证明用AI做判断,能给医生和患者带来实实在在的临床收益。
图5:加入饮食数据后,AI的血糖预测准度直接翻倍
这张图专门验证了多模态版本的AI能力,核心结论是:把饮食信息加进模型后,AI对血糖的预测准度大幅提升,尤其是餐后血糖波动的预测,精准度实现了质的飞跃。
图5a:大样本的性能提升验证
上面的散点图对比了预测准度(相关系数):横坐标是不加饮食的模型准度,纵坐标是加了饮食的模型准度,点在对角线上方,就代表加了饮食后更准。结果显示,91%的受试者,加入饮食数据后预测准度都提升了,整体平均相关系数从0.22直接涨到0.50,翻了一倍还多。
下面的散点图对比了预测误差(平均绝对误差):横坐标是不加饮食的误差,纵坐标是加了饮食的误差,点在对角线下方,就代表加了饮食后误差更小。结果显示,92%的受试者,加入饮食数据后预测误差都降低了。
图5b:整体性能的箱线图对比
更直观地展示了两组模型的差距:左边的相关系数,加了饮食的模型,中位数、上下限都比不加饮食的高一大截;右边的预测误差,加了饮食的模型,中位数、上下限都比不加的低很多,统计学上差异极其显著,证明加入饮食带来的准度提升是实打实的,不是偶然结果。
图5c:两个受试者的直观曲线对比
这是最具象的例子,能一眼看到饮食数据的作用:
蓝色线:受试者真实的血糖曲线;
橙色线:只看血糖数据、不加饮食的模型生成的曲线;
绿色线:加入饮食数据的模型生成的曲线;
红色柱子:受试者吃饭的时间点。
能清晰看到,不加饮食的橙色线,完全没预测到吃饭后的血糖飙升,和真实的蓝色线偏差极大;而加了饮食的绿色线,精准抓住了餐后血糖的峰值、上升和下降的时间,和真实的蓝色线几乎完全贴合,尤其是餐后血糖波动的部分,预测得极其精准。
这个能力的实用价值极高:未来可以用它给普通人、糖尿病人做个性化饮食指导,精准告诉你吃什么、怎么搭配,血糖不会飙升,帮你实现平稳控糖。
总结
这5张图形成了一套完整的证据链:从模型的底层架构和训练逻辑,到生成数据的真实性,再到临床风险预判的硬实力,以及长期预测、多模态升级的能力,全方面证明了GluFormer这个血糖基础模型,不仅技术上实现了重大突破,更给糖尿病早防早治、代谢健康精准管理,提供了一套前所未有的高效工具。
解读文献:
"
作者:杏耀注册登录官方平台
新闻资讯 News
- 龙虾狂欢Coding 自由,为何AI ...03-17
- 当8家顶级AI集体“说谎”:谁在...03-17
- B站完成了一场透支式盈利03-17
- “3·15”晚会曝光电动自行车乱象...03-17

