当前位置: > 学术报告 > 理科 > 正文

理科

建立量化网络中直接关联性的部分互信息新方法

发布时间:2017-06-12 浏览:

讲座题目:建立量化网络中直接关联性的部分互信息新方法

讲座人:陈洛南 教授

讲座时间:15:00

讲座日期:2017-6-12

地点:数学与信息科学学院学术报告厅

主办单位:数学与信息科学学院

讲座内容:在数据分析中,定量的标识变量的直接依赖性是一件非常重要的事情,特别是对于科学和工程中各种类型的网络重构和因果推断问题,都需要高精度的理论和方法。应用的最广泛的方法之一是偏相关性系数(partialcorrelation),但是偏相关性系数只能量化线性之间相关性和关联性,从而忽略非线性的关联性。然而,基于“条件独立性”(conditionalindependency)的“条件互信息”(CMI: conditionalmutual information)可以从观察数据中量化变量之间非线性的直接关联性,优于线性的方法。但是,条件互信息存在着过低估计的问题,因而严重限制它的应用,特别是在网络节点有强相关的网络中,这个问题就更加严重。基于这个问题,我们提出了全新的概念,即“偏独立性”(partialindependency)以及新的度量方法,又称作“部分互信息”(PMI: part mutualinformation),不仅能够克服条件互信息的缺点,同时还能保持互信息和条件互信息的性质。特别是,陈洛南研究组首先定义了部分互信息用于量化变量之间的直接关联性,然后从理论上给出部分互信息和互信息以及条件互信息之间的内在联系。通过数值实验,证明了部分互信息的性质和优点,接着通过用Escherichia coli和Yeast的基因表达数据重构其基因调控网络,进一步验证了部分互信息在量化网络中非线性的直接关联性的优越性。该工作对大数据网络研究提供了全新的概念和理论,不仅可用于生物分子网络的高精度构建,而且可以应用于其他网络(领域)中各种复杂因素的因果关系推断。