我们人类天生会被各种各样的图像信息所吸引。人类视觉感知占所有信息的70%。仅仅作为一台相机而言,人眼胜过世界上任何一台人造的照相机。我们的两只眼睛能够看到世界的立体投影,从而获得了三维感知。人脑从二维图像(或视频)中提取三维信息的速度在毫秒量级,包括成像,分析,理解以及决策。计算机视觉这门学科的意义之一,也许就是要挑战人类数百万年来的进化。

本次活动我们很荣幸的邀请到了上海科技大学博士在读生金石学长为我们带来计算机视觉方向的技术分享。

在本次讨论中,我们重点讨论两个具体的主题。一是探索拍摄室内场景的全景图像。我们将看到一张全景图就能告诉我们从几何到场景高级语义理解的大量内容。第二个例子是探索双目图像。当把空间和时间上有关联的图像放在一起时,其中包含的信息将引导生成全新的图像,而且极其真实,这意味着计算机已经开始接近人类视觉系统的奥秘了。

分享内容

  • 计算机视觉简介

  • 基于单张全景的室内场景建模

  • 基于深度学习的多目成像探索

主讲人简介

金石目前是上海科技大学博士第四年,师从虞晶怡教授。加入上科大之前,他于2015年从清华大学自动化系毕业。金石的主要研究方向集中在计算机视觉,计算摄影学以及虚拟现实。他的文章被CVPR、ECCV等计算机视觉领域的顶会收录。他的研究兴趣集中在三维重建上并且非常积极地尝试为该方向的进步贡献自己的力量。他同时长期实习于叠境数字科技(上海)有限公司的研发部,从事人体高精度极速三维重建的研究与开发工作。