多模态机器学习任务指不同模态的信息对齐和交互。当前不同模态之间的联合理解与生成掀起了新的研究热潮,其核心是让不同模态的信息相互辅助,互为指引,从而提升模型在不同模态下游任务上的性能。目前,多模态视觉理解和生成已经取得了巨大的进展,但依然面临诸多挑战。其中首要难点是如何构建具有通用知识的大规模多模态数据集;另一个难点是不同模态之间的表现形式不同,属性差别巨大,如何采用有效的模型训练方法,得到统一的通用知识表达。为了加强多模态视觉理解与生成领域的学术交流、促进本领域研究进展,本专刊将汇集若干具有创新性与突破性的最新研究成果。
征稿范围包括但不限于以下主题:
l视觉问答
l图像文本检索
l文本图像生成
l图像字幕生成
l参考表达理解
l视觉常识推理
l基于自然语言的真实视觉推理
l多模态数据的表示学习
l多模态数据的小样本和零样本学习
l多模态数据近期研究的综述、数据集介绍和算法性能评估
重要日期
投稿截止:2023年3月1日
首轮审稿意见:2023年4月15日
作者改回时间:2023年6月15日
终审意见:2023年6月30日
出版时间:2023年8月30日
投稿指南
投稿论文可以是新的相关研究成果或者会议论文的扩展版本(会议论文要求扩展不少于50%的新研究内容)。所有投稿论文将根据Visual Intelligence的要求,收到至少三位同行专家的评审意见,期刊将依据论文质量、研究主题创新性,以及是否符合本专刊主题决定该论文是否录用。投稿论文不少于8页,投稿邮箱:VI-EiC@csig.org.cn。
Visual Intelligence期刊简介
立足和服务于图像图形学领域研究,由拉斯维加斯手机娱乐网站 主办的Visual Intelligence期刊致力于推动“视觉”与“智能”的有机结合与协同发展,主要发表视觉智能技术的理论与应用方面的原创成果。期刊已获2022“中国科技期刊卓越行动计划高起点新刊”项目资助,将与Springer出版社合作出版(期刊ISSN: 2731-9008)。期刊接受包括综述论文、研究论文和评论论文等多种形式的文章投稿,期刊受众包括国内外计算机视觉、机器学习和人工智能领域相关的研究人员、教师、开发人员及学生等。
专刊联络
严骏驰 上海交通大学副教授
yanjunchi@sjtu.edu.cn
周 全 南京邮电大学副教授
quan.zhou@njupt.edu.cn
编辑部联络
彭 琳
电 话: 010-82544676,13911997306
邮 箱: VI-EiC@csig.org.cn
Copyright © 2025 拉斯维加斯手机娱乐网站 京公网安备 11010802035643号 京ICP备12009057号-1
地址:北京市海淀区中关村东路95号 邮编:100190