课程号 |
04835670 |
学分 |
1 |
英文名称 |
Fundamentals of 3D Vision and Research Training |
先修课程 |
推荐先修完计算机视觉和可视计算两门课程。 |
中文简介 |
本课程介绍三维视觉的基础知识,并为对三维视觉感兴趣的同学提供系统的科研训练。课程涵盖三维感知、三维重建和三维生成等核心内容,包括相机模型、三维重建方法(SFM、NeRF)、三维传感技术(LiDAR、结构光成像)以及大模型生成 3D 数据的最新进展。课程不仅通过理论讲解帮助学生掌握三维视觉的关键技术,还将结合实践训练和科研方法指导,培养学生的科研思维和创新能力。学生将在课程项目中夯实三维视觉基础,探索前沿研究问题,并通过学术讨论和实践训练,逐步提升从基础学习到科研探索的综合能力。 |
英文简介 |
This course introduces fundamental concepts in 3D vision while providing systematic research training for students interested in the field. It covers key topics such as 3D perception, 3D reconstruction, and 3D generation, including camera models, reconstruction methods (SFM, NeRF), 3D sensing technologies (LiDAR, structured light imaging), and the latest advancements in large-model-generated 3D data. The course not only helps students grasp essential 3D vision techniques through theoretical lectures but also fosters research thinking and innovation through hands-on training and research methodology guidance. Through course projects, students will strengthen their understanding of 3D vision fundamentals, explore cutting-edge research topics, and enhance their ability to transition from foundational learning to independent research through academic discussions and practical training.
|
开课院系 |
信息科学技术学院 |
成绩记载方式 |
|
通识课所属系列 |
|
授课语言 |
中文 |
教材 |
|
参考书 |
|
教学大纲 |
本课程旨在帮助学生建立三维视觉的系统认知,掌握常见的三维重建、感知和生成方法,并通过科研训练培养学生的研究思维和创新能力,使其具备从基础学习到科研探索的完整能力。
本暑期课程共分为五堂课,涵盖三维视觉的基础知识、核心技术、前沿探索以及系统的科研训练,旨在帮助学生建立三维视觉的系统认知,并培养科研能力。每堂课的内容和学时为:
第一讲:课程简介与三维视觉基础(3 学时) 本讲介绍三维视觉的基本概念、研究背景及其在计算机视觉、计算摄影、机器人等领域的应用。重点讲解三维投影模型,包括透视投影、弱透视投影、正交投影等,帮助学生理解相机成像原理及其数学描述。此外,还将介绍三维视觉的主要研究方向,包括三维重建、三维感知、三维生成等,为后续课程奠定理论基础。
第二讲:三维重建与研究方法(3 学时) 本讲围绕三维重建技术展开,涵盖立体视觉、运动恢复结构(SFM)、基于深度学习的三维重建(如 NeRF)等方法。学生将学习如何利用多视角图像推测场景的三维结构,以及不同三维表征(如点云、网格、体素、隐式表征)在重建任务中的优势与应用。此外,本讲将结合经典论文,指导学生进行论文阅读和分析,帮助他们理解研究方法的演进,并掌握撰写科研报告的基本技巧。
第三讲:三维感知与实验设计(3 学时) 本讲重点介绍三维传感技术,包括 LiDAR 和结构光成像的基本原理、硬件架构及其在自动驾驶、机器人导航、工业检测等领域的应用。学生将学习如何基于传感器数据进行三维点云处理,包括降噪、配准、分割、特征提取等。此外,本讲还涉及实验方案设计,指导学生如何制定合理的实验流程,确保数据采集的科学性和可复现性,为后续课程项目奠定基础。
第四讲:三维生成与前沿探索(4 学时) 本讲介绍基于深度学习的大模型在三维数据生成方面的最新进展,包括文本到 3D 生成(如 OpenAI 的 Point-E)、基于扩散模型的三维生成(如 3D Gaussian Splatting)、神经辐射场(NeRF)等方法。学生将学习如何使用这些模型进行 3D 生成,并讨论当前研究热点,如 3D 生成与物理约束的结合、可控生成等。此外,本讲还将引导学生思考未来三维视觉的研究方向,并鼓励他们提出创新性的研究问题。
第五讲:科研训练与项目实践(4 学时) 本讲以科研训练为核心,通过小组合作开展课程项目,帮助学生将所学知识应用于实际问题。学生将选择一个研究主题,设计实验方案,并进行数据处理与分析。课程将提供学术讨论环节,帮助学生提升学术表达能力,并最终完成研究报告撰写与展示。通过这一过程,学生不仅能够深化对三维视觉的理解,还能掌握科研方法,提高独立研究和团队协作能力,为未来的科研工作打下坚实基础。
本课程结合理论讲授、实践训练和科研指导,以多元化方式培养学生的三维视觉研究能力:
课堂讲授(50%):介绍三维视觉的基本理论、前沿研究方法,并结合经典论文讲解。 代码实操(25%):使用 COLMAP、NeRF、LiDAR 处理工具等进行实验,并完成小型科研实验。 科研训练与讨论(25%):文献阅读、小组讨论、科研方法指导,培养学术表达能力,并组织论文报告和研究讨论会。
本课程采用多维度评估方式,结合理论掌握、实践能力和科研探索成果:
课堂表现与参与(课堂提问、学术讨论) 20% 课后作业(理论分析+实验实践) 25% 科研训练任务(论文阅读、研究方法应用) 15% 课程项目(含展示与研究报告) 40%
本课程通过系统的科研训练,帮助学生在掌握三维视觉基础的同时,培养独立思考和创新研究能力,为后续学术研究奠定坚实基础。
|
教学评估 |
|
|