登录会员系统  |  联系我们  |  加入学会  
学会活动
CSIG图像图形学科前沿讲习班—“机器学习与图文识别前沿技术”
发布时间:2019-04-29      来源:拉斯维加斯手机娱乐网站       分享:

        2019年4月28日,拉斯维加斯手机娱乐网站 主办的CSIG图像图形学科前沿讲习班第10期(IGAL 10)在中国科学院自动化研究所圆满闭幕。本次活动由拉斯维加斯手机娱乐网站 文档图像分析与识别专委会、中国科学院自动化研究所联合承办,马上科普支持,华南理工大学金连文教授担任学术主任,共有来自全国各地的老师、学生以及企业工程师约120人参加会议,讲习班现场座无虚席、气氛热烈。


image.png

讲习班现场


        4月27日上午,讲习班在拉斯维加斯手机娱乐网站 副理事长兼秘书长马惠敏的致辞中拉开序幕。马老师首先感谢学术主任和八位专家为大家带来领域内核心观点和技术,希望所有与会科技工作者能在为期两天的学习和交流中有所收获,并欢迎大家加入拉斯维加斯手机娱乐网站 。


image.png

马惠敏老师致辞


        随后,本期活动的学术主任、华南理工大学金连文教授作开班致辞。金连文老师在致辞中提到,本期讲习班聚焦在人工智能中应用面非常广的机器学习和文档图像分析文字识别这两个领域。


image.png

金连文教授开班致辞


        中国科学院自动化研究所刘成林研究员首先开讲,刘老师作了题为《文档图像版面分析技术》的报告,指出版面分析是文档图像分析与识别的关键一步。报告简要介绍了文档版面分析的研究历史,技术概况,然后重点介绍了近十年来针对复杂文档分析识别的一些主要方法:基于聚类的方法、基于弹性轮廓的方法、基于连通部件分类的方法、基于全卷积神经网络(FCN)的方法等。最后讨论了当前存在的技术问题及未来发展趋势。


image.png

刘成林研究员讲课


        华中科技大学白翔教授围绕《不规则场景文字检测与识别》这一主题作分享,首先介绍了场景文字检测和识别最近几年的一些最新研究进展和新方法,然后介绍一种新的基于通量表示的骨架检测方法,之后展示了这种通量表示也可以在多方向和曲形文本检测中起到关键作用,可以克服目前文字检测方法中存在的部分问题,给不规则文字检测提供了一种全新的思路。


image.png

白翔教授讲课


        下午,旷视科技有限公司姚聪研究员为大家带来了题为《任意形状文字的检测与识别研究》的报告,引起了大家极大的兴趣。近年来,针对自然场景中任意形状文字的检测和识别技术逐渐成为学术界和工业界的研究和应用热点。姚老师介绍了这一领域的基本思路和最新进展。包括:自然场景文字检测和识别技术背景和问题定义;任意形状文字的检测和识别的基本思路和代表性工作;探讨待解决的问题以及下一步的研究方向。


image.png

姚聪研究员讲课


        上海交通大学严骏驰研究员作了题为《图匹配及其嵌入技术初探》的报告。严老师首先对现有图匹配相关技术进行介绍与回顾,随后进一步介绍自己基于图嵌入和深度学习的相关工作,并聚焦于图嵌入与图匹配技术在计算机视觉领域的应用。严老师在报告中提到,基于卷积神经网络(CNN)与图神经网络(GNN),实现了一个端到端的深度图匹配模型。该模型包含了一个排列损失函数以及节点特征提取、图特征嵌入、相似度映射等模块。这些模块均包含可学习的参数,能够在现有的深度学习框架下通过梯度传播端到端地学习。其中,GNN能够学习图相似度信息,进而将该信息用于匹配问题的求解。由于图匹配问题具有NP-难性质,相比于传统的、基于松弛优化的、不可学习的图匹配算法,深度图匹配算法更准确、更高效,同时支持端到端的学习。


image.png

严骏驰研究员讲课


        第一天四位讲者的分享激发了大家的研究兴趣,与会者通过与讲者大咖们的相互交流,扩展了视野和思路。报告结束后,大家踊跃提问,相互深入地交流。


image.png

老师与学员互动交流


        讲习班第二天,现场气氛依然热烈,讲者们为大家带来了《机器学习公理化研究的现状和未来》、《面向物理世界的强化学习》、《视觉结构学习理论和应用》及《面向开放环境的自适应视觉感知》四场精彩报告。


        28日上午,北京交通大学于剑教授以《机器学习公理化研究的现状和未来》为题,给大家带来了精彩的学术报告。机器学习成为一个独立的研究方向已经接近40年,新的机器学习任务和算法不断涌现,居于新一代人工智能的核心。2015年,Jordan与Mitchell在Science上联合撰文指出,机器学习的一个核心问题是:是否存在统管一切人、生物、机器的学习规律? 这个问题更加提炼锐化,即:机器学习是否存在公共的假设,如果存在,是什么?如果不存在,为什么?更简单的说法是,机器学习是否可以公理化?于老师的报告着重针对这几个问题,对于机器学习公理化的研究现状与未来进行分析与讨论。


image.png

于剑教授讲课


        南京大学俞扬教授作了题为《面向物理世界的强化学习》的报告。俞扬老师指出,强化学习旨在从环境交互中自主学习最优决策,近期在围棋、视频游戏对弈中有夺目表现,可取得超越人类的决策能力,但同时强化学习的一些局限,使其在工业应用中难以实施。俞老师从基本概念和基本方法开始介绍强化学习,并介绍了近期在强化学习落地应用方面的一些研究进展。


image.png

俞扬教授讲课


        下午,浙江大学李玺教授作了题为《视觉结构学习理论和应用》的报告,主要围绕数据驱动的人工智能学习方法,从目标视觉感知特性、视觉特征表达、深度学习器构建机制、高层语义理解等多维度视角进行了深入剖析,并引入了大规模视觉结构学习所涉及的主要研究问题和技术方法。李老师系统地回顾了视觉结构表达和学习领域的不同发展阶段,介绍了近年来李老师团队利用视觉结构学习进行视觉语义分析和理解所做的一系列代表性的研究工作及其实际应用。


image.png

李玺教授讲课


        南开大学程明明教授作了讲习班的最后一场报告,题为《开放环境下的自适应视觉感知》。程老师在报告中指出,现有视觉学习技术通常依赖于大规模精确标注的训练数据,在典型实验室环境下设计和训练的人工智能模型,在行业应用场景变换时,容易导致系统性能急剧下降。程老师从弱监督视觉理解的角度,介绍了他的团队在降低模型对特定应用场景数据依赖方面所开展的一些研究工作,主要包括如何学习一些通用属性,并利用这些通用属性构建弱监督学习模型。


image.png

程明明教授讲课


        8位专家的报告拓展了学员的视野,激发了大家的研究兴趣和热情。与会者通过相互交流,认识了新的同行,碰撞出诸多合作点,更加坚定了从事机器学习与图文识别前沿技术研究的信心。


        本期讲习班学术主任金连文老师主持了结营仪式,感谢了与会同行及合作单位的大力支持。


image.png

部分参会学员合照


        第10期CSIG图像图形学科前沿讲习班在拉斯维加斯手机娱乐网站 文档图像分析与识别专委会、中国科学院自动化研究所的各位老师和广大同行的大力支持下,取得了圆满成功。


Copyright © 2025 拉斯维加斯手机娱乐网站  京公网安备 11010802035643号   京ICP备12009057号-1

地址:北京市海淀区中关村东路95号 邮编:100190

技术支持:中科服

Baidu
map