耿直主讲才斋讲堂第136讲:因果推断与因果网络

日期: 2017-04-10       
  • 19世纪至今,统计学领域发生了突破性的进展,通过对事物相关性进行数学形式化和建立回归模型等手段,统计学同时推动了自然科学、经济金融和人文社会科学等学科的发展。201746日晚,数学科学学院教授、统计科学中心联席主任耿直做客“才斋讲堂”,以“因果推断与因果网络”为题向同学们介绍了利用数据进行因果推断和因果关系网络发现的统计方法。研究生院副院长刘明利主持并全程参加了讲座。

    耿直主讲才斋讲堂第136讲:因果推断与因果网络

    讲座的开始,耿直带领在座师生回顾了人类观察探索自然和社会规律的历程,自古以来,探讨事物之间的因果关系是哲学、自然科学、社会科学、医学等几乎所有科学研究的最终目的。但实际上,因果关系不同于相关关系,两个因素之间即使无因果关系,仍可能会表现出虚假的相关性,比如Freedman的研究(1991)显示,小学生的阅读能力与鞋的尺寸有相关性,但是很明显它们没有因果关系:人为地改变鞋的尺寸不会提高学生的阅读能力。相反地,有因果关系也可能表现出无相关关系,例如打太极拳可以强壮身体,延长寿命,也就是说,打太极拳对身体健康有因果作用。但是,打太极拳的人的寿命可能与不打太极拳的人的寿命没有什么差异,甚至打太极拳的人的寿命反而短一些,这可能是因为打太极拳的人都是原本体弱多病的人,所以表现出虚假的独立性。

    讲座现场

    那么,我们应当如何进行因果推断?探索因果关系是哲学、自然科学、社会科学、医学等领域几乎所有科学研究的重要目的。耿直尤其强调,在当今时代,如何从大数据中推断因果关系是研究人员努力的方向。诺贝尔经济学奖获得者James Heckman2008年提出了三个与因果相关的政策评价问题:其一是评价历史上出现的干预对结果的影响;其二是预测在一个环境中曾执行过的干预将在其他环境中的影响;而最具有挑战的问题是预测历史上从来没有经历过的干预,它们在各环境中的影响。这些问题的解决都需要研究者掌握因果推断的统计方法,耿直结合实例向同学们详细介绍了Yule-Simpson悖论、替代指标的选取原则、因果网络的分解学习方法、主动学习方法和局部学习方法,以期望引导学生从观测数据分析因果作用和挖掘因果网络。

    最后,耿直向同学们推荐了因果推断和因果网络领域的若干著作,并提醒大家在学习过程中应该注重研究能力与学术思想的培养。

    提问环节

    讲座结束后,耿直与现场同学们就“寻根问底+顺藤摸瓜”的因果推断的统计方法、统计学的数据可信度以及回归预测与贝叶斯网络之间的关联等问题进行了热烈的交流与讨论。

     

    主讲人简介

    耿直,数学科学学院教授,统计科学中心联席主任,研究方向为因果推断、数理统计、生物医学统计、因果网络、贝叶斯网络、图模型等。1998年当选国际统计学会推选会员,1998年获国家杰出青年基金资助项目。曾任中国数学会概率统计学会理事长、IMS-China的主席、国家自然科学基金委员评审会专家组成员,现任中国现场统计研究会理事长、中国统计学会副会长、国家社会科学基金学科评审组专家、国家统计局统计学学科评议组成员、应用统计专业学位研究生教育指导委员会委员。还兼任国内外多个刊物的副主编和编委,荣获国家教委科技进步奖二等奖、国家统计局科技进步奖一等奖、北京市科技进步二等奖等多项奖,在统计学、机器学习和人工智能的国际顶尖杂志发表多篇学术文章。