时间:2026-01-24 01:30作者:
正在新加坡举行的人工智能领域顶级会议aaai2026年会上传来喜讯,同济大学计算机科学与技术学院胡亮教授,与其指导的博士研究生黄伟泉、硕士研究生武澳奇,联手微软、澳大利亚麦考瑞大学的学者合作完成的研究成果,入选aaai“杰出论文奖”(此次全球共有5篇论文获奖)。

该获奖论文题为“llm2clip:powerfullanguagemodelunlocksrichercross-modalityrepresentation”。clip是当前人工智能领域具有重要影响力的多模态基础模型,其核心思想是通过大规模图像与文本数据的联合训练,使计算机能够在同一语义空间中理解图像和语言,从而支持图像识别、检索等多种任务。
随着大型语言模型(llm)的快速发展,其在语言理解和世界知识建模方面展现出显著优势。基于这一背景,研究团队深入探讨了如何将llm的强大语言理解能力引入clip框架,以提升模型对复杂、冗长文本描述的理解能力和视觉感知能力。为此,团队提出了一种高效的模型微调方法,在保留原有clip结构的基础上,将llm有机嵌入其中,实现对多模态表示能力的增强。
aaai(associationfortheadvancementofartificialintelligence)会议由国际人工智能促进协会主办,是人工智能领域历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会推荐的a类国际学术会议,每年举办一届。