Трехмерное компьютерное зрение

Целью курса является обзор математических и нейросетевых методов и подходов используемых для анализа данных с целью формирования трехмерной картины сцены применительно к задачам автономного движения транспорта (в городской среде и при решении сельскохозяйственных задач). Курс затрагивает классическую теорию решения задач описанную в книгах Foundations of Computer Vision или Computer Vision: Algorithms and Applications и современную нейросетевую теорию решения задач описанную преимущественно в научных статьях. На лекционных занятиях рассматривается обширное число вопросов, связанных с калибровкой нескольких камер, совместной калибровкой лидара и камеры, камеры и инерциального модуля, рассматриваются вопросы формирования пространственных траекторий объектов сцены, собственной траектории движения, построение карт препятствий. Краткий проморолик курса [mp4]. Практические занятия выполняются с использованием языка программирования python и фреймворка глубокого обучения pytorch. Программный код практических занятий оформлен в виде git репозиториев. Видеовизитка лектора о курсе [mp4].


Лекция №1 "Введение в трехмерное компьютерное зрение"

Лекция №2 "Определение глубины. Стереозрение"

Лекция №3 "Определение глубины по одному изображению"

Лекция №4 "Визульная одометрия и визуально-инерциальные системы"

Лекция №5 "Оптический поток"

Лекция №6 "Structure from motion"

Лекция №7 "Оценка глубины с помощью лидара"

Лекция №8 "Лидарная одометрия"

Лекция №9 "Детектирование объектов на облаках точек"

Лекция №10 "Калибровка лидарных данных"

Практические задания

Тестовые задания

Литература