Введение в компьютерное зрение
А.В.Шокуров
Аннотация курса: специальный курс для студентов о способах обработки растровых изображений. Изучаются как простейшие методы, такие как линейные/нелинейные фильтры, так и более сложные, такие как морфологические операторы, определение особых точек и другие. Результатом обработки считаются некие числовые характеристики, которые либо сами по себе имеют важность, либо предполагают дальнейший их анализ: ручной или автоматизированный.
Тематическое содержание курса
1 семестр
Введение в цифровую обработку изображений
- Фотометрия. Физика света и психика цвета. Преобразование цветов.
- Формирование растрового изображения. Формулировка Теоремы Котельникова.
- Простейшие преобразования растрового изображения. Попиксельные преобразования.
- Глобальные преобразования изображения. Фурье преобразование и другие.
- Оконные преобразования. Весовая функция.
- Линейные фильтры: сглаживание, поиск градиента.
- Бинарные изображения. Морфологические преобразования.
- Геометрические преобразования. Устранение дисторсии.
- Выделение ребер, отрезков, линий, контуров в растровом изображении.
- Методы сегментации изображения.
- Соединение отрезков в кривые (контура). Определение окружностей и эллипсов. Преобразование Хаффа.
- Хэш функции на изображениях. Инварианты бинарных изображений.
- Поиск по образцу. Определение движения от кадра к кадру.
- Особые окрестности, точки, отрезки. Сопоставление оных.
- Проективная геометрия. Гомография. Сшивка изображений.
- Калибровка одной камеры. Взаимная калибровка камер.
- Восстановление трехмерного объекта исходя из его изображения с разных ракурсов.
2 семестр
Введение в машинное обучение
- Интерполяция, Аппроксимация.
- Деревья решений.
- Геометрические подходы.
- Персептрон.
- Линейная модель.
- Ядровый подход в персептроне.
- Нейронные сети. Многослойные сети.
- Метод опорных векторов.
- Вероятностные подходы.
- Максимизация ожидания.
- Аппаратная поддержка методов обучения.
- Приведение изображения к нормализованному/каноническому виду.
- Характеристические точки растрового изображения.
- Распознавание плоских объектов в изображении.
- Распознавание трехмерных объектов в сцене.
- Распознавание движения нескольких объектов.
- Сегментация изображения на классы объектов.
Типовые контрольные задания
- Растровое представление изображения: а) преобразовать изображение в оттенки серого; б) изменить (увеличить/уменьшить) яркость изображения.
- Баланс белого: а) корректировка баланса белого изображения по выбранной точке (белой/черной/серой); б)реализовать автоматизированный метод, основанный на модели «серого мира».
- Бинаризация: а) для заданного изображения, выбрав пороговое значение, выполнить бинаризацию изображения; б)используя гистограмму построенную по интенсивностям, найти «хорошее» пороговое значение. Можно считать, что в изображении есть только фон и объект; в)разработать метод цветового квантования изображения, т.е. метод уменьшающий количество цветов в изображении. Фактически строиться палитра для данного изображения.
- Подсчет количества объектов: а)применив к изображению бинаризацию из предыдущего задания, посчитать количество объектов; б) посчитать количество объектов в зависимости от некой характеристики, например, исходя из площади. Написать программу, которая считает количество монет разных достоинств (фото сделано с верху, т.е. перспективные искажения отсутствуют.);
- Приближение контуров: а) Пусть имеется некий (бинарный) объект, например, монета. В общем случае, учитывая перспективную коррекцию, объект будет представлять эллипс. Необходимо найти уравнение этой кривой. *б) Найдя уравнения для каждой из монет, выполнить перспективную коррекцию.
- Откуда берется трех-компонентное представление цветов? Все ли цвета в таком представлении достижимы?
- Каким образом формируется цифровое растровое изображение? В чем суть теоремы Котельникова?
- Какие классы преобразований на растровыми изображениями существуют?
- Что есть глобальное преобразование изображения? Назвать известные глобальные преобразования.
- Что есть оконное преобразование? В чем их суть? Привести примеры.
Перечень учебной литературы
- William Pratt, «Digital Image Processing», John Wiley & Sons, Inc., 4th ed. (2007), 3rd ed. (2001), 2nd ed. (1991)
- Rafael Gonzalez, Richard Woods, «Digital Image Processing», Prentice Hall, 3rd ed. (2007), 2nd ed. (2002)
- David A. Forsyth, Jean Ponce, «Computer Vision: A modern Approach», Pearson, 2nd ed. (2011), 1st ed. (2002)
- Richard Szeliski, «Computer Vision: Algorithms and Applications», Springer, 2011, draft