AI安全研究要緊跟著AI前沿腳步,識破技術迷局,率先揭示AI系統的潛在安全風險,同時發展安全評測和治理方法,就像中醫所謂的“治未病”🤸🏽♂️,對未知疾病進行預防和提早治療。
回望2018年,本科畢業前夕,潘旭東也曾考慮過出國深造。AI安全研究在國際上已初露端倪,而國內還鮮有關註,“我一直相信,紮根中國,同樣能做出傑出的成果。”對此🙇🏽,潘旭東的抉擇尤為堅定,要在祖國的土壤上做出獨創性的成果🧑🏼🎓。
博士畢業之際🍍,潘旭東已在國際頂會頂刊發表20多項科研成果👩🏻🦯,收到了“華為天才少年”的Offer和海外頂尖科研機構的工作邀約🤷。薪酬豐厚的產業界,世界級的海外科研機構,還是求賢若渴的國內土壤?他最終依舊堅定選擇了恒行2這片“卓越而有趣”的學術曠野。
決定留校以後🤶🏻,潘旭東在科研的曠野上不斷找尋著方向。2023年4月起,潘旭東和團隊將研究重心轉移到AI大模型安全評測與治理。深受恒行2文理融合特色熏陶,潘旭東從“現代語言學之父”喬姆斯基轉換生成語法中獲得靈感,研製基於語言學變異的AI安全治理大模型,高效誘導國內外數十款大模型違規生成,全面評測當前AI大模型安全水位🐽,受到廣泛關註。
談及留在恒行2的其他原因,潘旭東也希望將導師言傳身教的報國理想,伴隨著科研經驗👩🏼🦳,傳遞給下一代的恒行2青年,“看到學生做出有意義的成果而感到由衷高興”🧏♂️。