我校蒙古文智能信息處理技術(shù)國(guó)家地方聯(lián)合工程研究中心4篇論文被ACL 2025錄用,其中2篇主會(huì)、2篇findings,分別聚焦知識(shí)圖譜表示學(xué)習(xí)、多模態(tài)虛假新聞檢測(cè)、大語(yǔ)言模型偏見(jiàn)消除、共情對(duì)話語(yǔ)音合成,4篇論文第一作者分別是內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院(軟件學(xué)院)、人工智能學(xué)院李江(博士生)、胡樹國(guó)(碩士生)、蘭天(碩士生)、胡一帆(博士生)。ACL(Annual Meeting of the Association for Computational Linguistics)是人工智能自然語(yǔ)言處理(Natural Language Processing,NLP)領(lǐng)域最權(quán)威的國(guó)際會(huì)議之一,是CCF A類會(huì)議。
(1)A Mutual Information Perspective on Knowledge Graph Embedding(主會(huì))
作者:李江, 蘇向東*, 多澤華, 蘭天, 郭曉濤, 高光來(lái)
內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院
論文提出一種基于互信息的知識(shí)圖譜嵌入表示方法。 知識(shí)圖譜 (KGs) 在人工智能應(yīng)用中潛力巨大,知識(shí)圖譜嵌入 (KGE) 技術(shù)旨在通過(guò)向量化實(shí)體和關(guān)系來(lái)預(yù)測(cè)缺失鏈接。然而,現(xiàn)有 KGE 方法在處理1-N 和 N-1 等復(fù)雜關(guān)系模式時(shí),常面臨高組內(nèi)相似性、語(yǔ)義信息丟失和推理能力不足等局限。為克服這些挑戰(zhàn),本論文提出了一種新型的知識(shí)圖譜嵌入方法,其核心是引入互信息 (MI) 最大化策略,以顯著增強(qiáng)實(shí)體和關(guān)系的語(yǔ)義表示能力。通過(guò)最大化知識(shí)三元組 (h, r, t)中不同組件(例如 (h, r) 與 t)之間的互信息,該方法不僅能有效保留幾何結(jié)構(gòu),更能顯著提升模型表示復(fù)雜語(yǔ)義關(guān)系的能力,有效緩解高組內(nèi)相似性問(wèn)題。在多個(gè)基準(zhǔn)數(shù)據(jù)集上的廣泛實(shí)驗(yàn)驗(yàn)證了我們方法的有效性,性能優(yōu)于多種基線模型。這項(xiàng)工作為知識(shí)圖譜嵌入提供了一個(gè)新穎的理論與實(shí)踐結(jié)合的解決方案,為提升模型在復(fù)雜語(yǔ)義理解和推理任務(wù)中的提供新的視角。

(2)Synergizing LLMs with Global Label Propagation for Multimodal Fake News Detection(主會(huì))
作者:胡樹國(guó)1,胡駿2*,張懷文1
1 內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院, 2 新加坡國(guó)立大學(xué)
論文提出一種基于全局標(biāo)簽傳播網(wǎng)絡(luò)(GLPN)的多模態(tài)虛假新聞檢測(cè)新方法。當(dāng)前多模態(tài)虛假新聞檢測(cè)技術(shù)面臨兩個(gè)問(wèn)題:1)現(xiàn)有標(biāo)簽傳播方法局限于訓(xùn)練集內(nèi)部標(biāo)簽,難以利用測(cè)試集數(shù)據(jù)輔助標(biāo)簽傳播;2)大模型生成的偽標(biāo)簽置信度波動(dòng)大,直接融合易引入噪聲。 針對(duì)這些問(wèn)題,研究團(tuán)隊(duì)創(chuàng)新性地:1)重新設(shè)計(jì)全局標(biāo)簽傳播機(jī)制,采用全局隨機(jī)掩碼方式,同步利用訓(xùn)練集與測(cè)試集數(shù)據(jù)實(shí)現(xiàn)標(biāo)簽的動(dòng)態(tài)傳播;2)開發(fā)基于置信度篩選的偽標(biāo)簽優(yōu)化方法,僅保留高置信度的測(cè)試集偽標(biāo)簽用于高質(zhì)量的全局標(biāo)簽傳播。 實(shí)驗(yàn)表明,該方法在Twitter、PHEME和Weibo數(shù)據(jù)集上較現(xiàn)有方法取得顯著提升,顯著優(yōu)于現(xiàn)有方法。

(3)McBE: A Multi-task Chinese Bias Evaluation Benchmark for Large Language Models(findings)
作者:蘭天, 蘇向東*, 劉旭, 王瑞瑞,暢珂,李江, 高光來(lái)
內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院
論文提出一個(gè)多任務(wù)中文偏見(jiàn)評(píng)估基準(zhǔn)(McBE)。隨著大型語(yǔ)言模型(LLMs)在各種自然語(yǔ)言處理任務(wù)中應(yīng)用的日益廣泛,其內(nèi)在的偏見(jiàn)逐漸在交互過(guò)程中暴露出來(lái),評(píng)估大模型中的偏見(jiàn)對(duì)于減輕其倫理風(fēng)險(xiǎn)至關(guān)重要。現(xiàn)在大多數(shù)現(xiàn)有的偏見(jiàn)評(píng)估數(shù)據(jù)集都集中在英語(yǔ)和北美文化上,它們的內(nèi)容并不完全適用于其他文化?;谥形暮椭袊?guó)文化的數(shù)據(jù)集非常稀缺。更重要的是,這些數(shù)據(jù)集通常只支持單一評(píng)估任務(wù),無(wú)法從多個(gè)方面評(píng)估大模型中的偏見(jiàn),缺乏綜合視角。為了解決這些問(wèn)題,本論文提出一個(gè)多任務(wù)中文偏見(jiàn)評(píng)估基準(zhǔn)(McBE),包括4,077個(gè)偏見(jiàn)評(píng)估實(shí)例,涵蓋12個(gè)單一偏見(jiàn)類別,和5個(gè)評(píng)估任務(wù),并將這12個(gè)單一偏見(jiàn)類別劃分為82個(gè)子類別,提供廣泛的類別覆蓋,更全面的偏見(jiàn)評(píng)估。

(4)Chain-Talker: Chain Understanding and Rendering for Empathetic Conversational Speech Synthesis(findings)
作者:胡一帆1,劉瑞1*,任意2,殷翔2,李海洲3
1 內(nèi)蒙古大學(xué)計(jì)算機(jī)學(xué)院, 2字節(jié)跳動(dòng)(新加坡),3香港中文大學(xué)(深圳)
論文提出一種模擬人類情感感知和表達(dá)過(guò)程的共情對(duì)話語(yǔ)音合成(Conversational Speech Synthesis , CSS)框架,為實(shí)現(xiàn)共情人機(jī)交互提供了創(chuàng)新解決方案。當(dāng)前生成式CSS模型由于情感感知能力不足和離散語(yǔ)音編碼信息冗余等問(wèn)題,導(dǎo)致情感感知和表達(dá)可解釋性不足。為解決上述問(wèn)題,我們?yōu)镃SS任務(wù)提出了模擬人類認(rèn)知的鏈?zhǔn)角楦懈兄捅磉_(dá)框架ChainTalker?!扒楦欣斫狻睆膶?duì)話歷史中推導(dǎo)上下文感知的情感語(yǔ)言描述,以增強(qiáng)情感理解可解釋性;“語(yǔ)義理解”通過(guò)序列化預(yù)測(cè)生成緊湊的語(yǔ)義編碼;“共情渲染”通過(guò)整合這兩個(gè)組件來(lái)合成富有表現(xiàn)力的語(yǔ)音,增強(qiáng)情感表達(dá)可解釋性?;贜CSSD, MultiDialog和DailyTalk三個(gè)基準(zhǔn)數(shù)據(jù)集的實(shí)驗(yàn)表明,Chain-Talker在生成更具表現(xiàn)力和共情力的語(yǔ)音方面優(yōu)于現(xiàn)有方法,而CSS-EmCap為穩(wěn)健的對(duì)話情感建模提供了有力支持。

上述研究工作獲得了國(guó)家自然科學(xué)基金項(xiàng)目、內(nèi)蒙古大學(xué)駿馬計(jì)劃項(xiàng)目、內(nèi)蒙古自治區(qū)高校青年科技英才等項(xiàng)目的支持。
供稿:計(jì)算機(jī)學(xué)院(軟件學(xué)院) 編輯:武濤 審核:劉雪峰 終審:阿茹娜