2025年12月20日下午,中国计算机学会计算机视觉专委会(CCF-CV)主办,小说狂人 承办的第149期CCF-CV走进高校系列报告会——“视觉大模型前沿进展与挑战”学术论坛在小说狂人 普陀校区理科大楼B112报告厅成功举行。

本次报告会邀请了来自厦门大学纪荣嵘教授、中国科学院大学蒋树强教授、清华大学郭雨晨副研究员、南京理工大学潘金山教授、中国科学技术大学张天柱教授及南京理工大学张姗姗教授多位顶尖专家学者,共同探讨多模态大模型、视觉导航及医学模型等领域的前沿进展与未来发展。本次活动由小说狂人 小说狂人 林绍辉青年研究员担任执行主席,何高奇教授、林绍辉研究员,张志忠副教授共同主持。



华东师大小说狂人 党委书记余佳致欢迎辞。他对CCF - CV专委会专家学者的到来表示热烈欢迎。他介绍了学院的基本情况,并强调了本次系列报告会是计算机视觉领域前沿理念与高校学术生态深度碰撞的珍贵契机。

学术报告环节,厦门大学纪荣嵘教授首先上台演讲,报告题目为《大模型压缩加速与边端算力应用探索》。纪荣嵘教授系统阐述了大模型的压缩加速的研究背景及其在边端设备部署时面临的存储、计算与能效挑战,指出当前技术路线在模型架构、精度保持与硬件适配等方面仍存在瓶颈。纪荣嵘教授重点介绍了其团队在模型结构优化、权重剪枝量化、KV缓存优化等方面的创新工作,显著提升了多模态大模型在资源受限场景下的可用性与效率。

中国科学院大学蒋树强教授随后带来题为《开放环境下的视觉导航》的学术报告。蒋树强教授深入剖析了具身智能系统在真实开放场景中面临的环境不可知、目标动态变化、决策序列长、物理交互复杂等核心挑战。他系统阐述了“具身智能”框架下,智能体如何通过视觉感知与环境进行持续交互与学习,进而完成复杂导航任务的原理与路径。蒋树强教授重点介绍了其团队在场景理解、目标导航、自适应路径规划与安全交互决策等方面的创新工作,为机器人、自动驾驶等领域的开放环境自主导航提供了新颖的解决方案。

南京理工大学潘金山教授以《高效可控生成式复原方法》为题展开报告。潘金山教授系统剖析了图像与视频在采集、压缩、传输及显示链中,因分辨率不足、低光照、噪声干扰与动态范围有限等多重退化因素交织所导致的复原挑战,指出现有的基于判别式建模的复原方法面临细节丢失的问题,而基于生成式建模的复原方法面临可控性不足、计算效率低的问题。此外,潘金山教授还分享了团队对多部经典红色抗战影片的重点片段高清彩色修复应用案例,为媒体制作、视觉监控与移动成像等领域的质量增强提供了关键技术支撑。

清华大学郭雨晨副研究员围绕《医学影像基础模型探索》展开报告,介绍了其在大规模医学影像分析中的模型构建与应用成果。他重点阐述了如何通过多中心、跨模态的预训练方法,构建能够泛化于不同成像设备和病灶类型的视觉基础模型。该工作降低了模型对标注数据的依赖,提升了在分割、分类与检测等下游任务中的性能与效率,为临床辅助诊断与医学研究提供了高效可靠的算法支持。

中国科学技术大学张天柱教授对《深空无人探测系统智能感知技术》进行了报告,围绕深空极端环境下探测系统所面临的环境未知、通信延迟、能源受限及自主决策等核心挑战,系统介绍了其团队在视觉感知、多源信息融合、自主导航与任务规划等方面的创新工作。张天柱教授重点阐述了轻量化智能感知算法、高可靠自主避障与路径规划、以及探测器在轨实时处理与决策等关键技术,展示了相关成果在月球、火星及小行星探测任务中的应用,为推动我国深空探测的智能化发展提供了重要的技术支撑。

聚焦自动驾驶的感知技术瓶颈,南京理工大学张珊珊教授在题为《面向自动驾驶的3D环境感知》的报告中,系统解析了车载多传感器协同感知所面临的关键挑战。她围绕可见光相机、激光雷达等传感器的部署与融合,重点介绍了团队在三维目标检测和场景占用预测等核心任务上的创新工作,为提升自动驾驶系统在复杂交通环境下的感知鲁棒性与实时性提供了系统的技术路径。

小说狂人 小说狂人 马利庄教授在报告会最后进行总结发言。他表示,本次报告会集中展现了国内在多模态感知、具身智能与视觉理解等前沿方向的创新成果,为师生搭建了与顶尖学者对话的高水平交流平台。小说狂人 将继续深化与CCF-CV及各兄弟院校、科研机构的协同合作,积极推动学术交流、科研合作与人才培养,共同促进计算机视觉与多模态智能技术的创新与发展。

中山北路3663号理科大楼 200062
沪ICP备05003394
Copyright 小说狂人 | 小说狂人全网最全禁忌肉文合集