Введение в компьютерное зрение

А.В.Шокуров


Аннотация курса: специальный курс для студентов о способах обработки растровых изображений. Изучаются как простейшие методы, такие как линейные/нелинейные фильтры, так и более сложные, такие как морфологические операторы, определение особых точек и другие. Результатом обработки считаются некие числовые характеристики, которые либо сами по себе имеют важность, либо предполагают дальнейший их анализ: ручной или автоматизированный.


Тематическое содержание курса
1 семестр
Введение в цифровую обработку изображений
  1. Фотометрия. Физика света и психика цвета. Преобразование цветов.
  2. Формирование растрового изображения. Формулировка Теоремы Котельникова.
  3. Простейшие преобразования растрового изображения. Попиксельные преобразования.
  4. Глобальные преобразования изображения. Фурье преобразование и другие.
  5. Оконные преобразования. Весовая функция.
  6. Линейные фильтры: сглаживание, поиск градиента.
  7. Бинарные изображения. Морфологические преобразования.
  8. Геометрические преобразования. Устранение дисторсии.
  9. Выделение ребер, отрезков, линий, контуров в растровом изображении.
  10. Методы сегментации изображения.
  11. Соединение отрезков в кривые (контура). Определение окружностей и эллипсов. Преобразование Хаффа.
  12. Хэш функции на изображениях. Инварианты бинарных изображений.
  13. Поиск по образцу. Определение движения от кадра к кадру.
  14. Особые окрестности, точки, отрезки. Сопоставление оных.
  15. Проективная геометрия. Гомография. Сшивка изображений.
  16. Калибровка одной камеры. Взаимная калибровка камер.
  17. Восстановление трехмерного объекта исходя из его изображения с разных ракурсов.

2 семестр
Введение в машинное обучение
  1. Интерполяция, Аппроксимация.
  2. Деревья решений.
  3. Геометрические подходы.
  4. Персептрон.
  5. Линейная модель.
  6. Ядровый подход в персептроне.
  7. Нейронные сети. Многослойные сети.
  8. Метод опорных векторов.
  9. Вероятностные подходы.
  10. Максимизация ожидания.
  11. Аппаратная поддержка методов обучения.
  12. Приведение изображения к нормализованному/каноническому виду.
  13. Характеристические точки растрового изображения.
  14. Распознавание плоских объектов в изображении.
  15. Распознавание трехмерных объектов в сцене.
  16. Распознавание движения нескольких объектов.
  17. Сегментация изображения на классы объектов.

Типовые контрольные задания
  • Растровое представление изображения: а) преобразовать изображение в оттенки серого; б) изменить (увеличить/уменьшить) яркость изображения.
  • Баланс белого: а) корректировка баланса белого изображения по выбранной точке (белой/черной/серой); б)реализовать автоматизированный метод, основанный на модели «серого мира».
  • Бинаризация: а) для заданного изображения, выбрав пороговое значение, выполнить бинаризацию изображения; б)используя гистограмму построенную по интенсивностям, найти «хорошее» пороговое значение. Можно считать, что в изображении есть только фон и объект; в)разработать метод цветового квантования изображения, т.е. метод уменьшающий количество цветов в изображении. Фактически строиться палитра для данного изображения.
  • Подсчет количества объектов: а)применив к изображению бинаризацию из предыдущего задания, посчитать количество объектов; б) посчитать количество объектов в зависимости от некой характеристики, например, исходя из площади. Написать программу, которая считает количество монет разных достоинств (фото сделано с верху, т.е. перспективные искажения отсутствуют.);
  • Приближение контуров: а) Пусть имеется некий (бинарный) объект, например, монета. В общем случае, учитывая перспективную коррекцию, объект будет представлять эллипс. Необходимо найти уравнение этой кривой. *б) Найдя уравнения для каждой из монет, выполнить перспективную коррекцию.
  • Откуда берется трех-компонентное представление цветов? Все ли цвета в таком представлении достижимы?
  • Каким образом формируется цифровое растровое изображение? В чем суть теоремы Котельникова?
  • Какие классы преобразований на растровыми изображениями существуют?
  • Что есть глобальное преобразование изображения? Назвать известные глобальные преобразования.
  • Что есть оконное преобразование? В чем их суть? Привести примеры.

Перечень учебной литературы
  • William Pratt, «Digital Image Processing», John Wiley & Sons, Inc., 4th ed. (2007), 3rd ed. (2001), 2nd ed. (1991)
  • Rafael Gonzalez, Richard Woods, «Digital Image Processing», Prentice Hall, 3rd ed. (2007), 2nd ed. (2002)
  • David A. Forsyth, Jean Ponce, «Computer Vision: A modern Approach», Pearson, 2nd ed. (2011), 1st ed. (2002)
  • Richard Szeliski, «Computer Vision: Algorithms and Applications», Springer, 2011, draft

Перечень ресурсов информационно-телекоммуникационной сети «Интернет»