登上Nature子刊!因果机器学习起步A会!

news/2025/2/25 16:48:44

2025深度学习发论文&模型涨点之——因果机器学习

传统机器学习方法多聚焦于关联关系的挖掘,对于变量之间深层次的因果关系却难以有效揭示。这种局限性在诸多复杂问题场景中逐渐凸显,促使学术界对能够突破这一瓶颈的新型方法展开深入探索,因果机器学习应运而生。

因果机器学习作为一门新兴且极具潜力的交叉学科,巧妙融合了因果推断理论与机器学习算法,致力于从海量数据中抽丝剥茧,精准辨识变量间的因果关联,进而为模型的解释性、可迁移性以及决策的科学性提供有力支撑。它不仅在经济学、社会学、医学等传统领域展现出强大的应用价值,更在人工智能的前沿发展中扮演着关键角色,推动着机器学习技术迈向更加智能、可靠的阶段。

我整理了一些 因果机器学习论文+代码】合集,需要的同学公人人人号【AI创新工场】发525自取。

论文精选

论文1:

[Nature子刊] Causal machine learning for predicting treatment outcomes

用于预测治疗结果的因果机器学习

方法

因果机器学习(Causal ML):提出了一种新的机器学习方法,用于从数据中估计治疗效果,包括疗效和毒性,从而支持药物的评估和安全性。

因果图(Causal Graph):通过因果图表示变量之间的因果关系,为因果推断提供基础。

潜在结果框架(Potential Outcomes Framework):基于潜在结果框架,定义了不同的因果量(如平均处理效应ATE和条件平均处理效应CATE),并选择相应的因果ML方法进行估计。

模型选择与评估:讨论了如何选择合适的因果ML方法,并提出了评估因果ML方法的策略,包括使用随机变量进行验证和替换处理变量进行稳健性检查。

图片

创新点

个性化治疗效果估计:能够估计个体化治疗效果,为临床决策提供更精准的支持,相比传统统计或ML方法,能够更好地处理高维和非结构化数据(如图像、文本和时间序列数据)。

处理异质性:有效估计患者间治疗效果的异质性,识别对治疗有效或无效的患者亚组,为精准医疗提供了更细致的视角。

数据驱动的因果推断:将因果推断机器学习相结合,能够从实验数据(如随机对照试验)和观察数据(如临床登记和电子健康记录)中估计治疗效果,拓宽了因果推断的应用范围。

降低偏倚风险:通过明确因果结构假设和使用因果图,降低了因未观察到的混杂因素导致的偏倚风险,提高了治疗效果估计的可靠性。

图片

论文2:

[Nature子刊] Improving the accuracy of medical diagnosis with causal machine learning

用因果机器学习提高医学诊断的准确性

方法

反事实推理(Counterfactual Inference):将诊断重新定义为反事实推理任务,通过计算疾病对症状的反事实概率来评估因果关系。

预期失效(Expected Disablement)和预期充分性(Expected Sufficiency):提出了两种新的诊断度量方法,用于量化疾病对症状的因果解释能力,满足一致性、因果性和简洁性三个基本要求。

贝叶斯网络(Bayesian Networks):使用贝叶斯网络作为疾病模型,结合因果推理,推导出反事实诊断算法。

结构因果模型(Structural Causal Models, SCMs):将贝叶斯网络扩展为结构因果模型,以支持反事实推理和因果分析。

图片

创新点

诊断准确性提升:相比传统关联诊断算法,反事实诊断算法在临床案例测试中平均准确率提高了5.74%,达到77.26%,进入医生群体的前25%,达到了专家临床准确率。

罕见病诊断改进:在罕见病和极罕见病的诊断中,反事实算法的准确率分别提高了29.2%和32.9%,显著优于关联算法,减少了罕见病误诊的可能性。

后向兼容性:反事实算法可以在不改变现有疾病模型的情况下,直接应用于现有的贝叶斯诊断模型,作为现有系统的即时升级,具有很强的实用性。

图片

论文3:

[NIPS] Causal Discovery in Semi-Stationary Time Series

半平稳时间序列中的因果发现

方法

半平稳时间序列因果模型(Semi-Stationary SCM):提出了一种新的因果模型,用于描述具有周期性因果机制的非平稳时间序列,能够捕捉因果机制的交替和重复变化。

PCMCIω算法:基于PCMCI算法,开发了一种新的约束基于的非参数算法PCMCIω,用于发现半平稳时间序列中的因果关系,并通过条件独立性(CI)测试识别底层因果图。

时间分区(Time Partition)和齐次时间分区(Homogenous Time Partition):定义了时间分区和齐次时间分区,用于处理具有周期性因果机制的时间序列数据,确保样本的一致性。

马尔可夫链(Markov Chain):利用马尔可夫链的性质,将时间序列数据转换为马尔可夫链,以便在假设条件下进行因果关系的推断。

图片

创新点

周期性因果关系发现:首次提出了一种能够处理半平稳时间序列中周期性因果关系的方法,能够正确识别因果机制的周期性变化。

性能提升:在连续值和离散值时间序列的实验中,PCMCIω算法在因果图恢复任务上表现出色,特别是在处理具有较大周期性(ωmax)的时间序列时,其精度显著优于其他算法。

非平稳时间序列适用性:该算法不依赖于平稳性假设,能够处理实际应用中常见的非平稳时间序列数据,拓宽了因果发现方法的应用范围。

理论保证与实验验证:通过理论分析和广泛的实验验证,证明了PCMCIω算法在因果关系发现任务中的有效性,并在真实世界气候数据中发现了潜在的周期性因果关系。

图片

论文4:

Inferring Heterogeneous Treatment Effects of Crashes on Highway Traffic: A Doubly Robust Causal Machine Learning Approach

推断交通事故对高速公路交通的异质性处理效应:一种双重稳健因果机器学习方法

方法

Neyman-Rubin 因果模型(RCM):用于从因果角度构建问题,定义交通事故对高速公路速度的因果效应。

条件Shapley值指数(CSVI):基于因果图理论,用于筛选不良变量,去除对因果推断无益的变量。

结构因果模型(SCM):定义统计估计量,明确因果效应的统计目标。

双重稳健学习(DRL):结合机器学习因果推断,通过倾向得分匹配和回归模型估计异质性处理效应。

匹配算法:用于选择“反事实结果”以验证估计的因果效应,通过计算误差指标评估模型准确性。

图片

创新点

异质性因果效应估计:首次在高分辨率数据环境中估计交通事故对交通速度的异质性因果效应,揭示不同事故类型在不同时间和空间下的影响。

CSVI变量选择方法:提出基于因果图的条件Shapley值指数,有效筛选不良变量,将误差指标MAE从10.74降低到9.17(针对追尾事故)。

双重稳健学习的应用:在交通领域首次应用DRL方法,相比其他因果推断方法(如GRF和DML),DRL在估计误差上表现更优,MAE降低至10.73。

高分辨率数据整合:将交通流量、事故记录和道路几何数据以5分钟间隔和1英里段落的方式整合,提供更精细的因果分析。

图片


http://www.niftyadmin.cn/n/5865727.html

相关文章

uniapp打包生产证书上架IOS全流程

第一步:生成生产证书 上传CSR文件,windows系统电脑无法上传csr文件可以参考这个: windows下创建ios打包证书的详细流程_香蕉云编 下载生产证书 下载下来的cer生产证书在香蕉云编cer文件上传栏上传,然后生成p12文件 生成p12文件…

14.12 Auto-GPT OutputParser 架构设计:构建安全可控的大模型输出管道

Auto-GPT OutputParser 架构设计:构建安全可控的大模型输出管道 关键词:Auto-GPT 输出解析、结构化响应控制、内容安全过滤、多格式输出适配、错误恢复机制 1. OutputParser 的核心作用与设计挑战 输出解析的三大核心任务: #mermaid-svg-sUqVk51rX50EHefe {font-family:&q…

在 JavaScript 中,[](空数组)不是假值,它是“真值”(truthy)

文章目录 语法解释!this.form.productPhotos 的含义在代码中的作用具体判断 实际上下文总结当前代码的局限 在你的父组件代码中,出现了 !this.form.productPhotos 这样的表达式,具体是在 handleSubmit 方法中: private handleSubmit() {if (…

C语言基础学习指南第二章:核心语法与函数——从函数定义到实战项目,助你快速掌握C语言核心能力

目录 1. 函数的定义与调用 2. 数组与字符串操作 3. 指针基础 4. 动态内存管理 5. 综合项目实战 1. 函数的定义与调用 1.1 函数的基本结构 函数由返回值类型、函数名、参数列表和函数体组成。例如: int get_max(int x, int y) { return (x > y) ? x : y; …

分布式之Raft算法

参考: 分布式算法 - Raft算法 | Java 全栈知识体系 Raft 算法详解 | JavaGuide 分布式 | CS-Notes 面试笔记

论文笔记:Scaling Sentence Embeddings with Large Language Models

2024 ACL findings 1 intro 直接利用LLMs生成句子嵌入面临两个主要挑战 LLMs作为自回归模型生成的是文本而非向量,因此需要将输出向量化如何有效地将上下文学习的能力融入句子嵌入中也是一个关键问题 论文调查了当前LLMs在句子嵌入中的能力 如何使用LLMs表示句子嵌…

基于嵌入式linux的数据库:SQLite

数据库基本概念 1. 数据(Data) 能够输入计算机并能被计算机程序识别和处理的信息集合。 2. 数据库 (Database) 数据库是在数据库管理系统管理和控制之下,存放在存储介质上的数据集合。注:数据库管…

GO 进行编译时插桩,实现零码注入

Go 编译时插桩 Go 语言的编译时插桩是一种在编译阶段自动注入监控代码的技术,目的是在不修改业务代码的情况下,实现对应用程序的监控和追踪。 基本原理 Go 编译时插桩的核心思想是通过在编译过程中对源代码进行分析和修改,将监控代码注入到…