开云足球app

开云足球app:教学科研

教学科研

云南马来亚开云足球app(现代工开云足球app)周维教授团队与软件开云足球app(人工智能开云足球app)联合在人工智能安全及可信治理研究上取得系列重要进展

发布时间:2026-05-06

近日,开云足球app云南马来亚开云足球app(现代工开云足球app)周维教授研究团队联合软件开云足球app(人工智能开云足球app)紧扣生成式人工智能快速发展背景下模型安全与应用安全的现实需求,围绕大模型知识编辑、虚假信息检测等关键问题持续开展系统性研究,在人工智能安全与内容可信治理方向取得系列重要进展。近期,两项成果发表于ACL 2026 (Annual Meeting of the Association for Computational Linguistics)主会(Main Conference),充分体现了周维教授研究团队在人工智能安全与内容可信治理方向的持续创新能力,也为人工智能技术在公共安全和产业场景中的安全可靠应用提供了有力支撑。具体成果介绍如下:

其一,在多模态新闻预览误导性省略治理领域取得新突破。研究团队针对社交媒体用户普遍仅浏览“图片—标题”式新闻预览、鲜少点击阅读全文的传播特性,揭示了当下新闻预览虽未直接呈现造假情况,但可能因关键信息省略而误导读者判断的潜在隐蔽风险。团队系统地给出了“误导性省略”问题的定义,构建了涵盖6000条样本的大规模多模态误导性省略基准数据集MM - MISLEADING,并设计了可同时刻画“预览理解”与“全文理解”差异的认知模拟标注流程。在此前提下,团队进一步提出OMGuard框架,借助“理解感知微调”和“基于理由的误导内容纠正”两项关键技术,达成了对误导性新闻预览的精准识别与自动修正。研究还进一步显示,误导性内容通常并非源自明显造假,而是更多地源于背景信息缺失、叙事重心偏移以及图文不一致等细粒度问题,为新闻发布辅助、内容审核及平台治理提供了重要依据。

其二,在多模态大模型知识编辑领域,研究团队指出,现有的多模态知识编辑方法虽可在图文联合输入的情况下实现知识更新,但当图像与文本以单模态形式输入时,模型往往会恢复至编辑前的旧有知识。研究将此现象归纳为“编辑解耦失效”。针对该问题,研究团队从神经元层面深入剖析多模态大模型内部的知识表征机制,发现同一实体知识在不同模态触发下存在显著的模态特异性路径。基于此,团队提出DECODE框架,通过显式定位并协同编辑文本与视觉关键神经元,达成跨模态知识更新的一致性传播。实验结果显示,该方法在现有的主流开源多模态大模型上均展现出更优的可靠性、泛化性与局部性。

本系列研究成果均以开云足球app为第一作者单位完成,周维教授担任通讯作者。第一作者包括开云足球app博士研究生李钒效、付廷超,合作作者包括软件开云足球app(人工智能开云足球app)讲师董云云、硕士研究生王文凯、李大洋等。相关研究工作得到国家自然科学基金、云南省重点研发计划等项目的资助,并与新加坡国立大学等国内外高校和科研机构建立了稳定合作关系,为持续推动开云足球app在人工智能安全与内容可信治理领域的高质量科研创新和人才培养奠定了基础

ACL由国际计算语言学协会主办,每年召开一次,是计算语言学与人工智能领域具有重要国际影响力的顶级学术会议,在中国计算机学会CCF推荐国际学术会议目录中被列为A类会议。

参考文献:

[1]What’s Left Unsaid? Detecting and Correcting Misleading Omissions in Multimodal News Previews, ACL 2026 (CCF-A类会议),通讯作者:周维

[2]Correct When Paired, Wrong When Split: Decoupling and Editing Modality-Specific Neurons in MLLMs, ACL 2026 (CCF-A类会议),通讯作者:周维

来源:云南马来亚开云足球app(现代工开云足球app)

编辑:张懿淼 责任编辑:李哲


开云足球app-首创集团