第15期CSIG企业行—走进奇虎360将于6月29日举办

学会动态

当前位置：首页>学会动态>活动预告

第15期CSIG企业行—走进奇虎360将于6月29日举办

发布时间：2023-06-19 来源：拉斯维加斯手机娱乐网站分享：

为更好地服务领域内企业，拉斯维加斯手机娱乐网站拟于2023年6月29日在北京举办第15期CSIG企业行—走进奇虎360，通过搭建学术界与企业交流合作平台，为企业创新发展提供科技支撑。

本次活动的主题为“ 大模型时代下的多模态与跨模态学习 ”，特邀北京大学、浙江大学、哈尔滨工业大学、悉尼科技大学专家和学者以及高校师生，与奇虎360技术团队一道探讨行业前沿趋势。

组织机构

主办单位：拉斯维加斯手机娱乐网站（CSIG）

承办单位：北京奇虎科技有限公司、CSIG青年工作委员会

活动时间：2023年6月29日下午

活动地点：北京市朝阳区酒仙桥路6号院2号楼（电子城·国际电子总部）

直播链接：本次活动将在CSIG官方视频号进行直播，欢迎关注CSIG官方视频号，点击预约即可到时观看。

报名链接：https://csig-forms.mikecrm.com/p7NIknX

或扫描下方二维码报名

（线下参会限30人，以收到报名成功确认短信为准）

活动日程

致辞嘉宾

刘越教授

专家简介：刘越，拉斯维加斯手机娱乐网站副秘书长，北京理工大学教授，光电信息技术与颜色工程研究所所长，北京市混合现实与新型显示工程技术研究中心副主任。2000年获吉林大学通信与信息系统博士学位，先后在美国哈佛大学、加州大学伯克利分校、佐治亚理工学院、天普大学以及澳大利亚国立大学等有关实验室访问研究，主要研究领域包括虚拟现实与增强现实、自然人机交互以及计算机视觉等，兼任中国计算机学会虚拟现实专业委员会副主任；中国电子学会虚拟现实产业分会副主任；中国人工智能学会智能交互专业委员会副主任；拉斯维加斯手机娱乐网站理事、副秘书长、成像探测与感知专业委员会副主任、三维成像与显示专业委员会副主任；北京图象图形学学会常务理事、秘书长等，目前主持国家重点研发计划项目、国家自然科学基金重点国际（地区）合作项目等多项课题的研究工作，已发表论文100余篇，申请专利50余项，研究成果“曾荣获教育部发明奖一等奖和国家发明奖二等奖各一项。

殷宇辉

殷宇辉为360集团副总裁、360技术中台负责人、专业委员会主席，其在云计算、大数据、人工智能等方面有着十余年的工程技术经验，加入360以来，其带领团队在智能流媒体处理、智能物联网、大数据智能等方向实现了技术和业务上的突破，利用数据智能等相关技术推进了360安全大脑在网络安全和城市产业的落地实践。

报告嘉宾

赵洲教授

专家简介：赵洲，浙江大学计算机学院教授、博士生导师。主要研究方向为自然语言理解、计算机视觉计算和生成式模型，在国际期刊和会议上发表50余篇论文。完成了多个多模态生成式模型的工作，如生成式语音模型（NATSpeech、DiffSinger、Make-An-Audio和Make-An-Voice）和生成式视觉模型（PNDM、PDAE、GeneFace）等，应用于微软、华为、Stable-Diffusion和字节等科技公司产品中，获教育部科技进步一等奖、中国电子学会科技进步一等奖。

报告题目：跨模态音视频生成模型研究

报告摘要：AIGC在最近几个月获得了巨大的突破，用户可以输入自然语言生成图像、视频、音频、甚至是3D模型。本次报告主要介绍面向多模态人机交互场景的实时性、高质量、轻量级、可泛化的语音合成NATSpeech工作；高表现、多任务、可迁移的歌声合成DiffSinger工作；开放性、时序性、多任务的AudioGPT工作和可控泛化、高效鲁棒、模态通用的人脸视频合成GeneFace工作。

常晓军教授

专家简介：常晓军，澳大利亚悉尼科技大学工程与信息技术学院教授，澳大利亚人工智能研究所ReLER实验室主任，澳大利亚研究理事会青年研究奖获得者。主要从事多模态学习、计算机视觉和绿色人工智能及其在社会公益方面的应用。主持包括澳大利亚研究理事会科研基金、企业联合基金(Linkage Program)等国家级项目十项。相关科研成果发表在T-PAMI、TIP等国际顶级期刊和CCF A类会议上150多篇，论文的Google Scholar引用次数10000余次，其中14篇入选ESI高被引/热点论文。2019年至2021年多次入选科睿唯安高被引学者。担任IEEE TCSVT、ACM TOMM等国际顶级期刊的副主编和CCF A类会议的领域主席(Area Chair)。

报告题目：基于多模态预训练模型的跨模态学习及其在医学图像理解上的应用

报告摘要：本报告介绍了一种基于多模态预训练模型的跨模态学习方法，并探讨了其在医学图像理解上的应用。随着数字医学领域中各种类型的医学图像数据的广泛应用，跨模态学习成为提高图像理解能力的有效方法。我们提出的方法利用大规模多模态数据进行预训练，学习到了丰富的跨模态表示。该模型包含图像模态和文本模态的编码器，能够联合表示图像和对应的文本描述。通过在大规模数据集上进行实验，我们验证了基于多模态预训练模型的方法的性能优势。结果表明，通过融合多模态信息，我们的模型能够更准确地捕捉图像中的重要特征，并在图像分类、目标检测等任务上取得显著的改进。此外，我们还探索了跨模态学习在医学图像领域的潜在应用。我们展示了如何利用预训练模型生成医学图像报告，为自动化报告生成提供了新的思路。我们还讨论了跨模态学习在医学图像的迁移学习和数据增强方面的应用，以进一步挖掘多模态数据的潜力。

张正副教授

专家简介：张正，哈尔滨工业大学(深圳)副教授，博士生导师，首批校内"青年拔尖人才"，鹏城实验室双聘研究员兼博士生导师，深圳市视觉目标检测与判识重点实验室副主任，IEEE/CCF高级会员。主要从事多媒体内容分析与理解的研究，发表IEEE/ACM Trans.汇刊及CCF A类会议论文90余篇(5600+谷歌引用)，获得3个国际会议最佳论文(提名)奖，申请/授权中美专利十余项。主持国家级和省部级基础研究基金、技术攻关重点基金及企业横向等科研项目10余项。受邀担任IEEE Trans. on Affective Computing、IEEE Journal of Biomedical and Health Informatics、Information Fusion等权威期刊编委，担任ACMM等顶会领域主席，以大会组委会成功举办了多个国际会议。获得中国电子学会优秀博士学位论文奖，深圳市优秀青年基础科研基金，入选斯坦福大学发布的2021/2022全球前2%顶尖科学家榜单。

报告题目：多源交互式情感理解与分析

报告摘要：情感计算的目的是赋予机器具备人类所擅长的感知、分析、理解和表达情感的高级智能，能够自适应人机交互和协同共情，是实现认知人工智能的核心技术之一。报告人将着重介绍在人脸、语音和多模态情感理解与分析的最新研究进展，涉及视听情感特征抽取、跨域情感分析和多模态情感识别的算法及相关应用。详细介绍如何有效探究不同模态不同特征对情感理解的影响，挖掘不同模态之间的潜在情感表示关系，实现多模态交互式的精准情感语义对齐和内容理解，从多种不同角度分析和验证所提出算法模型的有效性。

何相腾助理研究员

专家简介：何相腾，北京大学王选计算机研究所助理研究员，2022年入选中国科协青年人才托举工程项目、2020年入选CCF优博。2014年本科毕业于南开大学计算机与控制工程学院，2020年博士毕业于北京大学王选计算机研究所。主要研究方向为跨媒体分析、细粒度图像分类、计算机视觉和人工智能。主持国家自然科学基金面上、腾讯微信犀牛鸟专项等项目，已发表论文20余篇，包括IEEE Trans.和CCF A类论文17篇。多次参加由美国国家标准技术局NIST举办的国际评测TRECVID视频语义搜索比赛，均获第一名。研究成果已经应用于央视、人民日报、新华社等单位。获2018年百度奖学金（全球10名获奖者），2020年北京大学优秀博士学位论文奖，2020年北京大学优秀毕业生、2020年北京市普通高等学校优秀毕业生。担任国际会议ICME 2023领域主席、IJCAI 2021高级程序委员（SPC）、CVPR 2022/2023细粒度视觉分类Workshop共同组织者。

报告题目：细粒度跨媒体分类与检索

报告摘要：细粒度跨媒体分类与检索旨在使计算机能够对跨媒体内容进行精细化分析，在智慧农业、智慧医疗、智慧交通等智能行业具有广泛的应用前景。其关键问题在于：如何获取细粒度子类别的辨识性信息并有效表达，突破细粒度分析。现阶段细粒度分析研究主要聚焦于图像单一媒体数据。然而，信息传播已经从图像、文本、视频、音频等单一媒体过渡到相互融合的多媒体形态，因此细粒度分析需要向从单媒体向多媒体拓展。本报告将梳理细粒度跨媒体分类与检索方向的研究现状与进展，并探讨未来研究方向。

冷大炜 360人工智能研究院视觉引擎负责人

专家简介：冷大炜，360人工智能研究院视觉方向负责人，2011年博士毕业于清华大学电子系，一直深耕于人工智能及其在IT、法律、互联网等领域的落地。目前带领研究院视觉团队在多模态大模型，AIGC，跨模态图文学习，开放世界目标检测，开放词表视频分析，AIoT等方向进行前沿探索和工业落地工作。相关成果落地于提供安全大数据、互联网信息分发、企业数字化、AIoT等 360 集团全量业务场景，支持千万级硬件设备，服务亿级用户。

报告题目：大模型时代下的多模态与跨模态学习

报告摘要：AIGC特别是chatGPT和GPT4的推出，让大模型开始走出实验室，真正进入生产环境下的普及阶段，多模态大模型MLLM的研究也开始井喷。报告将从工业界的视角，梳理近期MLLM方向的工作进展，对当前的两大研究路线：原生多模态路线和单模态专家模型缝合路线，分析各自的优势和缺点，并引出360人工智能研究院在MLLM方向上的研发思考、近期成果以及未来的工作方向。

承办方介绍

360人工智能研究院成立于2015年，我们聚焦于研发业界领先的计算机视觉、深度自然语言理解、语音语义交互、大规模深度学习、机器人运动等人工智能技术，并应用于智慧物联网（IOT）、智能安全大数据、互联网信息分发、企业数字化、智能汽车等多种场景。团队多次在国际大赛中取得优异成绩，承担过国家和北京市多个重点攻关项目，参与建设国家级重点大数据工程实验室，参与建设的安全大脑入选国家新一代人工智能开放创新平台。我们打造的算法和服务，已应用于多条业务线，支持千万级硬件设备，亿级用户，产生的数据量达千亿规模。团队多名成员毕业于新加坡国立、清华、北大等国内外知名高校，大多数小伙伴曾任职于微软、百度、阿里等业界知名公司。我们的价值观是“研究业界一流技术，创造产业落地价值”。