近日,中国科学技术大学何向南团队参与撰写的论文获人工智能领域国际顶级会议ICLR2025(International Conferenceon Learning Representations)的杰出论文奖。
本次获奖论文名为《AlphaEdit: Null-Space Constrained Model Editing for Language Models》,即《AlphaEdit:基于零空间约束的语言模型知识编辑》。
在当前大语言模型中,主流策略在更新特定知识时,往往无法避免对原有知识造成破坏,导致模型在多次编辑后出现知识遗忘、文本生成质量下降乃至模型崩溃等严重问题。
为了解决这一问题,研究团队提出了全新的AlphaEdit方法。该方法通过将模型参数扰动严格投影到保留知识的零空间中,实现在编辑目标知识的同时,最大程度保护模型原有知识不被破坏。尤其值得一提的是,研究者设计了一种仅需一行代码即可实现的高效投影操作,使得AlphaEdit能够灵活集成到现有多种编辑框架中,大幅提升了其性能与实用性。整体而言,AlphaEdit开创性地提出了以零空间投影为核心的语言模型编辑新范式,为未来实现可持续、可靠的语言模型知识更新提供了重要方法论支持。
据了解,ICLR是人工智能领域专注于表征学习的顶级会议,该会议由深度学习巨头Bengio和LeCun牵头举办,与NeurIPS、ICML并称为机器学习领域的三大顶级会议。
值得一提的是,这并不是合肥市人工智能领域科学家第一次获得国际认可。去年7月,中国科学技术大学教授王翔就凭借在大模型领域的卓越研究成果,入选“35岁以下科技创新35人”(TR35)中国名单。这一评选活动由《麻省理工科技评论》发起,旨在每年从多个前沿科技及产业领域中挑选出优秀的青年科技创新人才,以推动全球科技创新的进程。(张玉莲)