====== Введение в компьютерное зрение ====== === А.В.Шокуров === ---- **Аннотация курса**: специальный курс для студентов о способах обработки растровых изображений. Изучаются как простейшие методы, такие как линейные/нелинейные фильтры, так и более сложные, такие как морфологические операторы, определение особых точек и другие. Результатом обработки считаются некие числовые характеристики, которые либо сами по себе имеют важность, либо предполагают дальнейший их анализ: ручной или автоматизированный. ---- == Тематическое содержание курса == == 1 семестр == == Введение в цифровую обработку изображений == - Фотометрия. Физика света и психика цвета. Преобразование цветов. - Формирование растрового изображения. Формулировка Теоремы Котельникова. - Простейшие преобразования растрового изображения. Попиксельные преобразования. - Глобальные преобразования изображения. Фурье преобразование и другие. - Оконные преобразования. Весовая функция. - Линейные фильтры: сглаживание, поиск градиента. - Бинарные изображения. Морфологические преобразования. - Геометрические преобразования. Устранение дисторсии. - Выделение ребер, отрезков, линий, контуров в растровом изображении. - Методы сегментации изображения. - Соединение отрезков в кривые (контура). Определение окружностей и эллипсов. Преобразование Хаффа. - Хэш функции на изображениях. Инварианты бинарных изображений. - Поиск по образцу. Определение движения от кадра к кадру. - Особые окрестности, точки, отрезки. Сопоставление оных. - Проективная геометрия. Гомография. Сшивка изображений. - Калибровка одной камеры. Взаимная калибровка камер. - Восстановление трехмерного объекта исходя из его изображения с разных ракурсов. ---- == 2 семестр == == Введение в машинное обучение == - Интерполяция, Аппроксимация. - Деревья решений. - Геометрические подходы. - Персептрон. - Линейная модель. - Ядровый подход в персептроне. - Нейронные сети. Многослойные сети. - Метод опорных векторов. - Вероятностные подходы. - Максимизация ожидания. - Аппаратная поддержка методов обучения. - Приведение изображения к нормализованному/каноническому виду. - Характеристические точки растрового изображения. - Распознавание плоских объектов в изображении. - Распознавание трехмерных объектов в сцене. - Распознавание движения нескольких объектов. - Сегментация изображения на классы объектов. ---- == Типовые контрольные задания == * Растровое представление изображения: а) преобразовать изображение в оттенки серого; б) изменить (увеличить/уменьшить) яркость изображения. * Баланс белого: а) корректировка баланса белого изображения по выбранной точке (белой/черной/серой); б)реализовать автоматизированный метод, основанный на модели "серого мира". * Бинаризация: а) для заданного изображения, выбрав пороговое значение, выполнить бинаризацию изображения; б)используя гистограмму построенную по интенсивностям, найти "хорошее" пороговое значение. Можно считать, что в изображении есть только фон и объект; в)разработать метод цветового квантования изображения, т.е. метод уменьшающий количество цветов в изображении. Фактически строиться палитра для данного изображения. * Подсчет количества объектов: а)применив к изображению бинаризацию из предыдущего задания, посчитать количество объектов; б) посчитать количество объектов в зависимости от некой характеристики, например, исходя из площади. Написать программу, которая считает количество монет разных достоинств (фото сделано с верху, т.е. перспективные искажения отсутствуют.); * Приближение контуров: а) Пусть имеется некий (бинарный) объект, например, монета. В общем случае, учитывая перспективную коррекцию, объект будет представлять эллипс. Необходимо найти уравнение этой кривой. *б) Найдя уравнения для каждой из монет, выполнить перспективную коррекцию. * Откуда берется трех-компонентное представление цветов? Все ли цвета в таком представлении достижимы? * Каким образом формируется цифровое растровое изображение? В чем суть теоремы Котельникова? * Какие классы преобразований на растровыми изображениями существуют? * Что есть глобальное преобразование изображения? Назвать известные глобальные преобразования. * Что есть оконное преобразование? В чем их суть? Привести примеры. ---- == Перечень учебной литературы == * William Pratt, "Digital Image Processing", John Wiley & Sons, Inc., 4th ed. (2007), 3rd ed. (2001), 2nd ed. (1991) * Rafael Gonzalez, Richard Woods, "Digital Image Processing", Prentice Hall, 3rd ed. (2007), 2nd ed. (2002) * David A. Forsyth, Jean Ponce, "Computer Vision: A modern Approach", Pearson, 2nd ed. (2011), 1st ed. (2002) * Richard Szeliski, "Computer Vision: Algorithms and Applications", Springer, 2011, draft ---- == Перечень ресурсов информационно-телекоммуникационной сети «Интернет» == * [[http://машинноезрение.рф]]