近日,我院2021級本科生管海粟的獨立一作論文“Deciphering Oracle Bone Language with Diffusion Models”被自然語言處理(NLP)領域國際頂級會議ACL主會錄用。人工智能與自動化學院劉禹良教授、軟件學院白翔教授為指導教師。


自1899年甲骨文被發現,迄今已有約4500個不重複的單字,但仍有三分之二的甲骨文等待破譯。近年來,利用現代人工智能技術理解甲骨文逐漸成為人們關注的研究領域。然而,現有的絕大多數人工智能研究主要集中在對已破譯甲骨文文字的識别和檢測上,而使用人工智能進行甲骨文未知文字的破譯仍是一個未充分開發的領域。
該論文創新性地關注利用人工智能輔助破譯未知甲骨文這一領域,從人工智能輔助破譯甲骨文的角度出發,利用擴散模型(Diffusion Model)提出了一種新的甲骨文破譯的方法(OBSD)。該方法能夠有效解決甲骨文綜合語料庫嚴重缺失的問題,并從圖像生成的角度出發,為甲骨文文字提供重要的破譯線索。此外,該方法可以輕松推廣到其他象形和會意文字,為破譯其他古文字提供了一個可能的潛在方案。
作為我院首屆學生,大二時管海粟加入軟件學院白翔教授創建的本科生創新團隊,初步進行科研探索,并在這裡認識了從事人工智能視覺與自然語言處理領域研究的劉禹良教授,正式開啟用人工智能輔助破譯甲骨文的探索之旅。在兩位老師的指導下,他和課題組其他成員分别嘗試用不同路徑探索輔助未知甲骨文破譯的方法,共同搭建甲骨文開源數據集HUST-OBC和EVOBC,并協作設計了基于人工智能的多途徑輔助破譯系統Open-Oracle。有關工作已獲得4項國家專利。
據悉,ACL會議(Annual Meeting of the Association for Computational Linguistics)是由計算語言學協會主辦的頂級學術會議,是由中國計算機學會(CCF)推薦的自然語言處理和計算語言學領域A類會議。