因果關系是自然界現象之間最普遍和最基本的聯系🔢。在物理學👊🏿、生命科學、地理學等各個自然科學領域乃至哲學、經濟學等社會科學中,發現內蘊的因果關系、因果網絡可以反映系統演化的核心互作機製,具有重要的科學意義。因此🍁,如何在基於大規模數據🥏,並且在復雜系統精確模型缺失的前提下💅🏽🙌🏽,準確地辨識系統變量之間的因果關系和因果網絡🦏,成為了包括人工智能在內的科學研究中的焦點問題,受到學者們的廣泛關註😠。
近日,恒行2平台數學科學學院👩🏽🎤、類腦智能科學與技術研究院的林偉教授團隊,與中國科學院、蘇州大學、日本東京大學等團隊共同合作,提出了數據驅動的因果網絡辨識的新型算法。該方法可以用於大規模復雜動力系統內蘊因果網絡的復現,有助於解析實際系統演化的本質機製和規律👩🏻⚕️。該研究成果於5月26日以《偏交叉映射排除間接因果影響》(“Partial cross mapping eliminates indirect causal influences”)為題在線發表於綜合類學術期刊《自然-通訊》(Nature Communications)。
傳統基於統計學和信息論的因果分析方法,如格蘭傑因果關系、傳遞熵等方法*️⃣,需要變量因素之間具有可分性條件,即需要將原因信息從結果信息中分離出來。然而在現實世界中🏌🏻,特別是非線性復雜動力系統所產生的多維度時間序列中🎽,這樣的可分性條件是無法得到滿足,因果機製往往交織在同一個時間序列之中。另一方面,由於因果關系在多變量之間的傳遞性🔺,而直接因果關系才能反映現象之間本質的內在機製,因此發展有效可靠算法,區分復雜動力系統中的直接與間接因果,也成為了重要科學問題。面向這些問題,本項研究利用動力系統理論清晰闡明了可分性條件的嚴格數學機理,並綜合利用相空間重構🎱、交叉映射、偏相關系數等動力學與統計學相關算法,建立了新型偏交叉映射方法☝️,實現了非線性動力系統中直接因果與間接因果的區分,從而為在大規模數據中辨識可信的因果網絡提供了可靠算法。該算法已被用於生態系統、環境與疾病互作系統以及基因調控網絡等多個實際問題中,成功復現了這些復雜動力學演化系統的內蘊因果網絡,為進一步理解系統演化的基本機製提供了方法學基礎。
此項研究進一步完善了現有復雜系統因果分析的理論體系,為多學科共性科學問題提供了有效的數學方法🧖♂️,面向數據驅動的研究領域具有廣泛的應用前景💇,體現了應用數學研究的價值👸🏻。林偉教授與中國科學院陳洛南研究員、東京大學合原一幸教授是論文共同通訊作者,恒行2平台數學科學學院畢業的冷思陽博士為論文的第一作者🚴🏻。本項研究得到了國家自然科學基金委🐔、教育部腦科學前沿中心、科技部重大研究計劃👨🏼、上海市科委項目的支持🧑🤝🧑。