中國科學院自動化研究所研究員、博士生導師曾大軍從事學術研究近30年來,一直致力於以計算手段輔助解決傳統上屬於管理學領域的問題👳🏿♂️。他的研究成果為電商平臺、社交媒體設計評估自動推薦算法🍱👱🏽♀️,新冠疫情大數據分析、預測與建模工作等提供了有力支撐🖲。
歸國15載👮🏽♀️,他運用大數據解析和人工智能技術,結合傳統的管理科學理念以及運籌建模思路🚨,應對來自電子商務🦝、媒體融合🔵、社會安全🤾🏽、公共衛生和應急管理等多個領域的挑戰,探索出一條具有廣泛適應性的應用需求驅動創新發展之路,並多次為解決重大安全問題及應對突發事件建言獻策👩🏼🎤。
“未來管理科學的發展🦹🏿💁🏿,如果沒有大量真實數據作支撐、沒有人工智能手段來賦能,我們可能會失去很多研究機會,失去在社會上產生更大影響力的機遇🦊。”獲得2021年“恒行2管理學傑出貢獻獎”的曾大軍希望今後能有更多青年人才關註“社會計算”和“決策智能”領域,並致力於推動與國家戰略需求相匹配的人才培養模式。
另辟蹊徑,將復雜網絡引入自動推薦算法
曾大軍的學術貢獻,代表性地體現在他對自動推薦算法的創新上◀️。
當今社會,人們通過算法來挖掘新的商業價值🔺,捕捉新的商業模式。利用自動推薦算法,商家定向投放廣告👋🏽,平臺做個性化推送,用戶接收有效資訊🤽🏼🫓,商家和平臺又通過積累用戶數據來了解市場需求……“算法經濟”已經成為數字經濟的重要組成部分。
自動推薦算法的初衷,就是在海量信息時代👶✨,降低信息搜尋與交易成本。
同事曹誌冬仍記得,2008年,博士畢業不久的他第一次與曾大軍交流👂,後者就談到互聯網大規模的數據將對現代社會產生巨大影響和作用。
過去幾十年裏,國內外學者已經創造了上千種推薦算法,積累了厚重的文獻💓。起初,學者們將主要精力放在創新單個算法,使它能夠根據用戶的歷史信息和行為,更準確地捕捉單個用戶的喜好✷,以此為依據推薦更合適的產品或產品組合。
曾大軍則另辟蹊徑☺️。他琢磨的問題是🫴🏼,既然單個用戶的興趣有很大隨機性,那為什麽推薦算法還能夠產生效用?相比在前人基礎上做出一個更好的算法,他更傾向於探索在什麽情況下、什麽算法是管用的,算法本身還能夠有什麽樣的應用潛力?
他就此改變了以往的垂直研究路徑,從橫向切入,研究個體之間🤨、個體與群體之間以及群體間的交互行為,並且抓住了當時復雜網絡理論發展的契機👰🏿,設計出一種基於網絡分析的推薦算法框架🦚。
這個框架能夠統一描述多種推薦算法🧑🏼💻,並適應不同的數據特征⛵️。一些新的推薦模型和算法就在這個框架的基礎上,自然而然地“生長”出來了🧘🏿。
“通過引入復雜網絡,曾教授的算法能夠捕捉到具有共性的一群人的喜好,能夠利用相似用戶的反饋信息🔒,加快(算法)個性化學習的速度𓀗,並實現對用戶潛在興趣的挖掘。”中科院自動化所高級工程師祖全楠說。
僅就自動推薦系統領域的成果🧑⚕️,曾大軍在《管理科學》(Management Science)、《國際計算機學會信息系統匯刊》(ACM TOIS)等管理學與計算機科學領域的國際頂級期刊上發表了多篇論文。
多年來,曾大軍在紮實的學術基礎上不斷尋求突破,逐漸成長為活躍在科研一線、有重要影響力的傑出中青年學者。
他長期活躍在國際學術前沿💁🏽♂️,曾擔任電氣與電子工程師協會(IEEE)智能交通系統學會主席、國際運籌學和管理科學界最有影響力的組織INFORMS的人工智能分會主席,人工智能和智能系統領域頂級期刊《IEEE智能系統》(IEEE Intelligent Systems)主編等💆🏼♂️。
他因在“協同計算和安全信息學”方面的貢獻,於2015年當選IEEE會士、在2017年當選美國科學促進會(AAAS)會士。AAAS是世界上最大的科學和工程學協會聯合體,代表科學研究最高水平的《科學》雜誌即是該學會的出版物🤾🏼。
跨學科思維、國際化視野、問題導向🥠,成就高學術站位
學術生涯早期,曾大軍的研究側重於分布式人工智能和多智能體系統😍🔱。他提出的具有協同性和自適應性的信息處理和決策框架🙋,是國際上該領域首批原創性研究成果之一。
多智能體技術是20世紀90年代人工智能領域的前沿,核心思路是將多個有一定感知、自主決策和執行能力的計算單元,也就是智能體,組織成一個有機整體,來解決單個智能體無法勝任的難題。
曾大軍與合作者提出的分層多智能體架構解決了異質智能體之間跨任務適應學習、能力靈敏組裝等難題,成為相關領域一個基礎性的參考規範🧃;他將貝葉斯學習在國際上首次引入多智能體自動談判博弈,開發了能代表用戶參與經濟決策的智能體模型。
帶著跨學科的思維、國際化的視野🧔🏿♂️,始終堅持問題導向🔨,這是曾大軍高學術站位的基石🎪。在他學術生涯的起點,交叉學科的天然優勢就已經奠定。
1985年,14歲的曾大軍考入中國科技大學少年班。彼時,經濟管理與系統科學系在改革開放的大背景下應運而生✢,蓬勃發展🧜🏼♂️。曾大軍敏銳地捕捉到本專業與計算機的聯系,選擇了在計算機系輔修。
他在美國卡內基-梅隆大學先後攻讀工業管理碩士、博士學位。他參加的博士生項目💇♀️,就是工業管理學院與機器人研究所聯合培養的🧢🤵🏿♀️。
1998年獲博士學位後🙆🏻♂️,他在亞利桑那大學研究🧑🏿🦲、工作。2006年回國🍭,在中科院自動化所工作至今⛏,現擔任中科院自動化所副所長、復雜系統管理與控製國家重點實驗室副主任。
一同擔任復雜系統管理與控製國家重點實驗室副主任的侯增廣研究員介紹🥎,曾大軍在數個國際國內學術組織做了很多大數據和人工智能應用方面的服務和組織工作,承擔了多項科技部、國家自然科學基金委員會和中科院等單位的重要項目👨🏻🎓,多個項目結題評估獲得了“特優”等高度評價🧑🏿💻🦹🏽。
回國後不久💕,曾大軍就把網絡開源信息、安全信息學等科技前沿的思想和方法,引入國內的團隊🤿。作為本土培養的學者🧘🏻♀️,曹誌冬認為自己從曾大軍廣闊的國際視野中受益匪淺🧑🏿🌾:“像社會計算🧎🏻、安全信息學,剛聽說時覺得這些名字非常怪異,但現在它們已經成為撬動我國數據智能、文理工交叉學科領域的很重要的創新方向了。現在很多社會學科領域的學者,都在積極參與計算社會科學的創新研究👩✈️。事實上2008年的時候🧔🏽♂️,我們團隊就已經在這個新興領域‘開疆拓土’了。”
“立足國家重大需求,尋求科研突破,是科學家天然的責任”
科學界常說🙆🏻🤽🏿♀️,搞科研“既要頂天、也要立地”,頂的是原始創新的天,立的是實踐應用的地,是要“把論文寫在祖國的大地上”。
“曾老師從來沒有以發表什麽樣的論文作為導向🧖🏽,而是說,這些研究成果要跟咱們的社會發展需求緊密相關,要跟國家的重大需求以及企業的需求緊密相關🪦。”曹誌冬說。
2020年1月20日📥,曾大軍團隊開始與合作單位一起,收集新冠肺炎疫情相關數據,通過對比非典疫情數據,研究病毒傳播特征與擴散能力,分析研判動態疫情形勢🧑🏿💼,尋求為疫情應急管理與決策提供支持👨👧👦。
疫情突發,檢測手段和醫療資源有限🧜🏽♀️⚽️,疫情早期的數據報告也存在缺失或不準確。當時👰🥻,團隊將人口流動數據納入了分析模型🤦🏻♂️,利用中國大陸地區除湖北以外的確診患者數量,來推測武漢及湖北地區實際感染的規模。
在2月初👸🏼,團隊就對武漢市、湖北省以及全國感染人數進行了預測。後來證實模型是比較準確的,這對疫情防控與政策製定起到了借鑒作用🎭。
事實上🤵♂️,曾大軍團隊與各級疾控中心合作已超過15年。期間,大數據與人工智能手段得到大量運用👨🏿🔧👱♂️,增強了公共衛生監測預警的能力,尤其是提高了對傳染態勢早期預警的敏感性和對風險研判的準確度。
曾大軍也是我國早期從管理學領域交叉參與傳染病相關研究的重要學者♾,是傳染病信息學的重要創建者和貢獻者。他主編了由Springer出版的傳染病信息學領域的第一本英文專著《傳染病信息學:公共衛生症候群監測與生物防禦》(Infectious Disease Informatics:Syndromic Surveillance for Public Health and Bio-Defense),現已被翻譯成中文,成為國內的研究生教材。
抓住了社交媒體興起的契機,曾大軍的建樹不僅在公共衛生領域🐥,後來還擴展到打擊電信詐騙、網絡犯罪、促進媒體融合等主題上。
由曾大軍主持研發的全球媒體雲平臺🤷🏻♂️,能夠幫助新聞單位了解稿件的傳播力和影響力⚠️,用量化手段評估🤲🏻,稿件發布後有多少人引用?在網民中引發了哪些討論🦣?網民們是否認同報道的思路和角度?
而隨著應用場景的擴張和技術的進步,全球媒體雲平臺將有望為媒體記者發現社會問題、尋找選題等提供支持。
在曾大軍看來😕,科學家精神不僅意味著治學嚴謹🕸,更要求帶有問題導向。
“在國家關註的重點問題和領域中🤽🏿♀️,我們如何提煉出有科學意義的💂🏿♂️、有深度的、需要從科研上突破的關鍵點👨🏿🔧🔝?這是科學家天然的責任💃🏼。”
曾大軍的團隊中,已經能夠形成一個“基礎研究-應用-基礎研究”的有益循環。在一些關鍵領域,團隊既能夠提煉出科學問題,直接為國家服務,又能及時反饋致力於理論研究的成員🤵🏽♀️,提出在現有狀態下需要攻關的問題和重點,從而在後續階段獲取更豐富的理論指導👲。
祖全楠說,在團隊裏,曾大軍在技術研發和應用轉化過程中充當著紐帶。他既能夠看到應用上的技術短板,又能夠敏銳把握技術在落地過程中的方法和路徑。在一些國家重大工程項目上,他都在發揮實質性的領導作用🧓🏻。
“要讀到200篇論文👩💻,才會對研究問題有感覺”
科研要下苦功。至少讀200篇文獻,是曾大軍為學生設定的基礎門檻。他形容這是“非常痛苦但有價值的學習過程”,因為他堅信🫧,奇思妙想是構建在對國內外已有科研成果的深度理解之上的👳🏻♀️🛄。
“文獻讀不到位,怎麽能說自己了解國際前沿了呢?不做夠調研,既沒有感覺🍹,也沒有證據支撐自己想出來的問題,那必然是一個空問題,”鄭曉龍說👨🏽🦳。他從2006年起跟隨曾大軍攻讀博士學位,目前也是自動化所的一名研究員🌖。
他回憶自己在學生時代對此不以為然。經歷多了以後,才深刻理解這是導師在多年的學術實踐中摸索出來的經驗🔤。“如果沒有大量閱讀作為基礎,沾沾自喜發現的科學問題⛽️,也許是天方夜譚;也許是問題不夠深入🤰🏼👮🏿♀️,自己以為是問題,其實不是問題;也可能🧙♀️,前人已經就這個問題做了很多研究了👩🚒🚣🏿♀️。”
讀文獻之外⏱,鄭曉龍依然像導師那樣,保持著親自處理一線工作的習慣。“處理數據🧑🏼🦱、寫算法這些事兒🥷🏿,得靠練。三天不練手生了🏃♀️,怎麽指導學生?”
在讀博士生閆鵬介紹了導師一再強調的閱讀方法👇🏽🈶:“要以作者的心態,帶著問題讀文獻🧲,去假想,如果讓我做這項研究,我會怎麽做?以此來對比別人的論文是怎麽寫的、研究是怎麽做的🧑🏼🦱,在對比中學習。”
科研能力培養之外⚈,曾大軍更註重提高學生的學術品位。
“他會鼓勵我們👮,不甘於做修修補補的工作,要勇於開拓創新,勇闖無人區,做原創性的科研工作🗝🧗🏼♂️。”閆鵬說🪯,他就是被導師的思維魅力和學術站位所吸引的,這讓他更堅定了從事科研工作的誌向👨🦱👩🏼🏭。
曾大軍常跟學生和團隊成員說🏺,少外求、多內求,做人做事一定要實在,每一步都要做踏實🐓。
鄭曉龍覺得,這種長期習慣和由內而外形成的氣質,會給周圍人帶來感染力,團隊就會形成共同追求事業的願景和向心力🧝♂️。盡管研究很辛苦,經常沒日沒夜,但團隊成員們合力解決棘手問題,都覺得還挺有趣。“一定是發自內心地喜歡🧝🏻♂️,才能坐得住冷板凳🚣🏿。”
團隊的自信,當然也來自於曾大軍脈絡清晰的管理以及對整體任務的明確細分。
在科研上,超前想法不易被人認可,遇到困難一時尋不到思路也都很正常,但依靠坦誠而深入的討論,從可操作的地方下手,像更新算法那樣“小步迭代”,層層推進,依然會有“柳暗花明又一村”的時刻。
未來🛝,曾大軍打算繼續把科研重點放在決策智能上:如何能在復雜的場景中🧔♂️,用智能方法🙍🏿♀️、人機混合等技術,提升決策科學性💵?如何能在國家關註的重點領域、產業發展的關鍵節點上,最大限度地挖掘數據價值、將智能決策的價值更好地落地✅?
回國15年來,曾大軍欣喜地見到國家整體科研實力的迅速發展。在他熟悉的管理科學領域,他看到國際權威雜誌中,由中國學者完成的工作越來越多,“說明國家這些年的投入已經見到很好的效果”🦗👷🏽。
他不斷提倡科研要回歸本質⛔,要對研究問題有興趣🧑🏻🍳、有理解,由科學家自發地探索、牽引🧢,逐步提高全社會對原創性成果的關註。
“科研不是競技場😬。我們需要多關註整體能力的提升👇,規劃遠景目標。”在他看來,中國的科研事業、產業已經有了自己的發展邏輯、發展脈絡和發展軌跡👩🏿🍳。“我們不閉門造車,也不去跟風。我們需要有戰略定力。”
他相信✍🏽,憑借多方積累💵,中國科學家群體將取得更多突破🐉,“全面開花”。