“AI驅動的甲骨文校重和破譯”“利用AI技術識別紙質文物上的黴菌”“基於深度學習的青銅器年代判定”……這些,都是恒行2平台研究生選修課“AI考古”的學生期末作業。
2024年9月,恒行2平台啟動首批“AI大課”課程,目前已經完成一學期教學。恒行2平台分子考古實驗室負責人文少卿聯合計算機系教師錢振興、金城,開設了“AI考古”課。這門選修課在16周內安排48個課時,主要講述AI考古學的發展歷史和研究、AI考古前沿、AI原理、圖像處理、AI考古專業數據庫等內容。
課程目錄。受訪者供圖
中青報·中青網記者了解到,有11名學生選了這門課,他們中有6位是來自文物與博物館學系、歷史學系、出土文獻與古文字研究中心的文科學生,5位是來自腦科學、物理學、神經微電子、生命科學等學科的理工科學生,此外還有6位學生旁聽。期末考核方式較為靈活,可以在助教指導下製作一個基於AI的程序demo,也可以選擇寫一篇文獻綜述。最後,有7位同學選擇完成更有挑戰性的程序demo作品。
文少卿是生物學專業出身,目前從事分子考古學,這是一門生物學與考古學交叉的學科。文少卿團隊的實驗室曾經主要研究古代遺骸,在鑒定方面積累了一定經驗後,從2015年開始投入到近代烈士遺骸的鑒定工作中。
在實際工作中,文少卿感受到,在發掘、保護、研究文物過程中,需要用到AI技術。“比如有一些無人區的遺址,人進去調查很困難,考古學家可以通過數字遙感技術,通過AI自動識別;考古遺址出土的大量人骨、動物骨、青銅器、陶片等,人工整理、鑒別費時費力,這個過程其實AI可以深度介入。另外,研究人員還可以借助AI做數據挖掘、出報告,利用數智技術進行文物的展示和傳播。”
目前,在世界範圍內,只有少部分工作者嘗試借助AI技術從事考古工作。而文少卿希望結合考古實踐豐富課程內容,將AI技術介紹給學生,引導學生自己尋找感興趣的研究課題,結合AI提高考古過程中的研究效率、準確性和客觀性,有助於他們未來的工作。
文少卿課上的部分內容。受訪者供圖
期末提交作業時,文博系的張馨予同學完成了“基於深度學習的青銅器年代判定”程序demo。她先把青銅器分為黃河上遊、長江中遊、長江下遊等5個類別,建立圖片訓練集和測試集,然後搭建大模型框架,讓大模型對訓練集中的青銅鼎圖片進行學習,目的是達到高精度的辨識歸類效果。在測試中,這個程序demo正確識別了21張青銅鼎圖片中的16張,準確率約為76%。如果通過建立圖片數量更多的數據訓練集,並對模型框架進行微調,還可以進一步提高識別準確率。
文博系的李元瑾同學做的程序demo是“利用AI技術識別紙質文物上的黴菌”,同樣基於圖像識別技術。她介紹,古籍、字畫等紙質文物容易受到黴菌和蟲害侵襲,黴菌一旦感染紙質文物,就會形成難以去除的黴斑,損害紙張的物理性能。傳統文物修復主要依賴修復者的經驗肉眼鑒別,再選擇相應的修復方法,耗時耗力,且難以保證準確率。這款模型可以通過圖像鑒別健康紙張、墨跡或黴菌,幫助人們保護書籍和字畫,為文物工作者提供更高效的修復輔助。
來自腦科學研究院的葉嘉鑫同學製作了“AI驅動的甲骨文校重和破譯”程序demo,可以較為準確地判斷出白紙上寫的甲骨文最有可能是哪個現代漢字;文博系的許怡冉製作的“人工智能在近代遺骸分析流程中的應用”可以讀取基因數據,可用於推斷個體所屬的Y染色體單倍群;物理學專業的潘泳羽製作了對9種不同材質玉料的紅外光譜數據進行識別的模型,旨在解決玉料的識別問題。
學生提交的期末作業,帶笑臉者為程序demo。受訪者供圖
文少卿告訴中青報·中青網記者,在教學過程中,教師遇到的最大問題就是“理科學生覺得太簡單、文科學生又覺得太困難”。他發現,部分學生在查找文獻時只知道知網,不了解其他的工具。於是,他暫停了一次文獻討論課,專門開了一堂以AI為中心的科研工具課,拓展學生的“工具包”,教大家一些使用AI工具檢索和分析的進階技巧。
在提交期末作業時,文、理科同學的思路和編程能力也呈現很大差異。文少卿觀察到,理工科同學的計算機水平更高,而文科學生挑選的題目更有意思。由於從頭開始寫程序對文科同學來說難度較高,部分同學在助教的幫助下完成了作品。
中青報·中青網記者從恒行2平台獲悉,“AI大課”的目標是實現AI課程覆蓋全體本研學生、AI+教育覆蓋全部一級學科、AI素養能力要求覆蓋全部專業的“三個100%”滲透。目前,剛剛實施一學期的AI課程還存在一些問題,會在下一階段的建設中不斷改進。預計到2025年春季學期,首批建設的116門AI課程將全部完成首輪開課,還將有6-8門AI課程繼續與同濟大學共建共享。