LETOU.COM,乐投(中国):浅谈深度学习在图像复原与合成中的应用
报告人:张宇伦 博士后研究员
单位:苏黎世联邦理工LETOU.COM,乐投(中国)
报告时间:2023年2月7日(周二)上午9:30-11:00
报告地点:翡翠科教楼A座1106
报告人简介:张宇伦,苏黎世联邦理工LETOU.COM,乐投(中国)计算机视觉实验室博士后研究员。2009-2013年,本科就读于西安电子科技大学电子工程LETOU.COM,乐投(中国)智能科学与技术专业。2014-2017年,硕士就读于清华大学自动化系,硕士期间曾在南洋理工大学,悉尼大学及中科院深圳先进技术研究院等机构从事访问研究。2017-2021年,博士就读于美国东北大学电子与计算机工程系。博士期间,先后在Adobe与哈佛大学从事实习和访问研究。主要研究方向是图像/视频复原与合成,生物医学图像分析,模型压缩,计算成像等。目前在计算机视觉,机器学习,多媒体等领域的国际期刊(如TPAMI)和会议(如CVPR, ICCV, ECCV, ICLR, NeurIPS)上发表学术论文50余篇。目前,谷歌学术引用10313余次,单篇一作论文引用2997余次。获得6项中国授权专利和3项美国授权专利,专利技术被应用到Adobe Photoshop软件。获得2015年IEEE VCIP最佳学生论文奖,2019年IEEE ICCV RLQ Workshop最佳论文奖。担任CVPR 2023, ICCV 2023领域主席(AC),IJCAI 2021-2022, AAAI 2023资深程序委员(SPC),TPAMI, IJCV, ICCV, ECCV, ICLR, NeurIPS, ICML等期刊和会议审稿人。
内容摘要:基于深度学习的图像复原与合成,在当今计算机视觉领域扮演着基础而重要的角色。相关技术被广泛应用到移动设备(比如,手机)或者催生一批高估值创业公司。然而,如何设计高效的深度卷积神经网络,以此来提取更高质量的特征,进行更好的图像复原与合成,仍然颇具挑战性。此次报告,将介绍近期在通道与空间维度上增强深度特征的一些工作。对于图像复原,先简述提出残差密集网络,然后介绍residual in residual (RIR)结构来训练非常深的图像超分辨率网络。这种RIR结构使得网络能学习到更多高频信息,这种信息对重构高质量输出至关重要。之后,将探索注意力机制(比如,通道和空间注意力,Transformer等)在图像复原任务中的应用。对于图像合成,将介绍基于图割的多峰风格变换。将高维深度特征进行降维并且可视化,以此发现了风格深度特征的多峰分布现象。进而将风格匹配问题归结为能量最小化问题并用图割的方法来求解该问题。因此,图像匹配中变换后的特征包含了更多空间语义信息,能提供更多视觉效果更好的风格化效果。此外,还探索了高放大倍数下,关于纹理迁移的图像合成问题。最后,将结合近期的一些相关工作(比如,生物医学图像分析,模型压缩),给出一些个人的浅见和展望。