Denis Perevalov -- Computer Vision with OpenCV 2UralcsclubThe lectures are devoted to the basics of Computer Vision through some examples of using OpenCV library. The possibilities and limitations of applicability of the known algorithms to real projects are also considered. (IN RUSSIAN)
2. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Содержание
Введение
Local Image Interest Point
Template Matching Based on Fourier
Coefficients
Linear Scale and Rotation Invariant Matching
Дополненная реальность
Заключение
2
3. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Введение
Постановка задачи
3
Устойчивый относительно геометрических
искажений поиск шаблона на изображении
4. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Введение
Геометрические преобразования
Параллельный перенос
Подобие (перенос,
масштабирование, поворот)
Аффинное
Проективное
4
5. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Введение
Простейший подход – «грубой силы»
1. Выбирается модель преобразования
2. Определяется набор параметров, описывающих
модель
3. Выбирается функция сопоставления изображений
Sum of Absolute Differences (SAD), Sum of Squared
Differences (SSD), Normalized Cross Correlation (NCC), etc.
4. Перебираются всевозможные значения параметров
в разумных пределах
5
6. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Содержание
Введение
Local Image Interest Point
Template Matching Based on Fourier
Coefficients
Linear Scale and Rotation Invariant Matching
Дополненная реальность
Заключение
6
7. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Local Image Interest Point
Схема работы
7
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
1. Выбираем ключевые точки
2. Применяем классическое вейвлет-преобразование
к окрестностям ключевых точек и высокочастотные
компоненты считаем особенностями
3. Сопоставляем ключевые точки
Название предложенного метода:
Rotation and Scale Invariant Matching (RASIM)
8. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Блобы
А. Конушин, «Сопоставление изображений и локальные
особенности», лекции по курсу «Введение в компьютерное
зрение», 2012
8
Сигнал
Край
Сигнал
Блоб
Пример блобов
Поиск блобов
осуществляется
с помощью разницы
Гауссиан (DoG)
9. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Выбор ключевых точек
9
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
Для поиска применяется псевдо-лог-полярная сетка
дискретизации
Ключевые точки находятся при поиске максимумов
и минимумов в масштабированном изображении
Масштабируется при помощи
разницы Гауссиан (DoG)
Псевдо-лог-полярная
сетка дискретизации
10. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Вейвлет-преобразование
10
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
– высокочастотный и низкочастотный фильтры
Быстрое вейвлет-
преобразование
– входной сигнал
– высокочастотная и низкочастотная компоненты
– старая высокочастотная компонента
– фильтр прогнозирования
– операция свертки
,
,
11. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
– размерность фильтра прогнозирования
– количество выбранных больших высокочастотных
компонент с индексами
Вейвлет-преобразование
Фильтр прогнозирования
11
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
Фильтр прогнозирования получается решением
системы для компонент, полученных от шаблонного
изображения
12. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Взвешенная адаптация
12
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
– система с предыдущего слайда
– максимальная и минимальная компонента,
– некоторая константа
– операция поэлементного умножения
13. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Измерение подобия (1)
13
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
Метод разделен на две части: «оффлайн» и «онлайн»
«Оффлайн»:
1. Выбираем вейвлет преобразование и значения
параметров и
2. Вычисляем фильтр прогнозирования
14. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Измерение подобия (2)
14
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
«Онлайн»:
1. Применяем вейвлет преобразование
2. Заполняем вектор
3. Суммируем вектор в окне
такой же длины (2L), как
и сигнал шаблона
Максимальное значение суммы достигается
при наилучшем соответствии
15. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Постобработка
Преобразование Хафа
15
http://en.wikipedia.org/wiki/Hough_transform
Метод предназначен для поиска объектов,
принадлежащих определённому классу фигур
с использованием процедуры голосования
Угол
Расстояние
Входное изображение Преобразованное изображение
16. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Результат
Статистика качества детектирования
16
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
Правильно
обнаружены(%)
Масштабшаблона
(множитель)
Угол поворота (градусы)
17. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Результат
Сравнение с конкурентом
17
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
18. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Статистика
производительности
18
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
Время работы на одном изображении
19. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Выводы
Достоинство:
Устойчивость к поворотам
и масштабированию
Недостатки:
Низкая скорость работы
Неустойчивость к изменениям перспективы
19
M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale
Invariant Matching of Local Image Interest Points,”
IEEE Transactions on Image Processing, 2011
20. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Содержание
Введение
Local Image Interest Point
Template Matching Based on Fourier
Coefficients
Linear Scale and Rotation Invariant Matching
Дополненная реальность
Заключение
20
21. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Template Matching Based
on Fourier Coefficients
Обозначения:
Forapro – название предложенного алгоритма
A – исходное изображение
Q – шаблон
Стабильной называется точка,
которая имеет некоторую
окрестность, в которой направление
градиента сохраняется
21
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
Белые – стабильные
точки, красные – нет
22. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Значения цвета на радиальной
и круговой проекциях в точке
представляют собой значения
дискретных функций
Приблизим их непрерывными
функциями и разложим
последние в ряды Фурье
Вычислим первые L(K) комплексных
коэффициентов ci(ri) разложения круговой
(радиальной) функции в ряд Фурье
Forapro
Идеи метода (1)
22
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
Радиальная
проекция
в точке
C(A(x,y))
Круговая
проекция
в точке
R(A(x,y))
23. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Вычислим вектор особенностей vf, инвариантных
к поворотам и масштабированию
, – полярный угол и длина комплексного числа
Forapro
Идеи метода (2)
23
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
– функция расстояния между
двумя векторами особенностей
24. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
1. Вычисляются значения коэффициентов ci, ri и vf
для всех точек A и Q
2. Выбираются N стабильных точек из Q, которые
образуют множество {T}
3. Для i от 1 до N
Для каждого пикселя (x,y) из A вычисляются
Находится пиксель с самым малым отклонением
и добавляется в массив
4. С помощью преобразования Хафа уточняется
результат
Forapro
Шаги алгоритма
24
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
25. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Результаты (1)
25
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
Исходное изображение Результат
26. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Результаты (2)
26
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
Исходное изображение Результат
27. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Выводы
Достоинства:
Устойчивость:
к изменениям по яркости и контрасту
к поворотам и масштабированию
Недостатки:
Невысокая скорость работы
Неустойчивость к изменениям перспективы
27
H.Y. Kim, “Rotation-Discriminating Template Matching Based
on Fourier Coefficients of Radial Projections with Robustness
to Scaling and Partial Occlusion,” Pattern Recognition, 2010
28. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Содержание
Введение
Local Image Interest Point
Template Matching Based on Fourier
Coefficients
Linear Scale and Rotation Invariant
Matching
Дополненная реальность
Заключение
28
29. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Linear Scale and Rotation
Invariant Matching
29H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
Обозначения:
– множество точек шаблона
– множество пар точек из
– некоторые точки из множества
– точки, соответствующие
– стоимость сопоставления
(зависит от векторов особенностей)
30. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Основная идея метода
30H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
Сопоставляем точки шаблона и изображения,
решая задачу линейного программирования (ЛП)
Стандартная постановка задачи ЛП:
Максимизировать функцию
при условиях для i = 1, 2, …, m,
где cj, aij, bi – некоторые константы
n
j
jj xcxF
1
)(
i
n
j
jij bxa 1
31. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Идеи метода
Критерий сопоставления (1)
31H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
– локальная стоимость сопоставления
– пространственная стоимость
сопоставления
– весовой коэффициент
32. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
– стоимость сопоставления,
инвариантная относительно
масштабирования и поворота
– коэффициент масштабирования
– матрица поворота (2×2)
Идеи метода
Критерий сопоставления (2)
32H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
33. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Идеи метода
Критерий сопоставления (3)
33H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
– бинарная матрица сопоставления
точек шаблона и изображения
– транспонированная матрица
стоимостей сопоставления
– матрица инцидентности ребер
– координаты точки шаблона
– координаты точки изображения
34. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Добавляются масштабированные шаблоны поиска
Изменяется матрица поворота
Идеи метода
Линеаризация
34H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
Линеаризованные параметры:
Исходные параметры:
– бинарная матрица сопоставления точек
масштабированного шаблона и изображения
35. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Шаги алгоритма
35H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
1. Вычисление матрицы С стоимостей сопоставления
точек шаблона и изображения
2. Выбор региона доверия для каждой точки шаблона
3. Вычисление минимальной выпуклой оболочки вершин
из региона доверия для каждой точки шаблона
4. Решение задачи линейного программирования
5. Уменьшение регионов доверия. Если точки
сопоставились хорошо, то выводятся результаты,
иначе – перейти на шаг 3
36. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Пример работы алгоритма
36H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
(а) – шаблон, (b) – начальное приближение,
(c)–(i) – итерации алгоритма, (j) – результат
Цветные прямоугольники – регионы доверия
37. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Результат
Сравнение с конкурентами
37H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
O. Duchenne, et al.
“Tensor-Based
Algorithm for High-Order
Graph Matching,” 2009
Предложенный
алгоритм
Шаблон Кадры видеопоследовательности
S. Belongie, et al.
“Shape Matching Using
Shape Contexts,” 2002
38. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Результат
Объекты с сильной деформацией (1)
38H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
Шаблон Кадры видеопоследовательности
Кадры видеопоследовательности
39. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Результат
Объекты с сильной деформацией (2)
39H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
Шаблон Кадры видеопоследовательности
Кадры видеопоследовательности
40. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Статистика
производительности
40H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
#frames – количество кадров в видеопоследовательности
#model – количество точек в шаблоне
#target – количество точек на изображении
time – время работы на 1 кадре (сек) на 2.8 GHz PC
accuracy – средняя точность по всей видеопоследовательности
41. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Выводы
Достоинства:
Стабильность
Высокая скорость работы
Недостаток:
Не оговаривается, как выбирать точки для
сопоставления
41H. Jiang, S.X. Yu, D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Trans. on PAMI, 2011
42. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Содержание
Введение
Local Image Interest Point
Template Matching Based on Fourier
Coefficients
Linear Scale and Rotation Invariant Matching
Дополненная реальность
Заключение
42
43. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Пример применения
Дополненная реальность – добавление
к поступающим из реального мира
ощущениям мнимых объектов
43
http://vitodibari.com/ru/hit-lab.html
Пример
дополненной
реальности
44. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Дополненная реальность
Как это работает?
44
http://www.artag.net/index.html
Находятся и распознаются специальные маркеры,
затем дорисовывается нужная информация
45. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Дополненная реальность
Системы маркеров
45Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
Некоторые системы маркеров
46. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Дополненная реальность
Библиотеки
На данный момент существует несколько
неплохих открытых реализаций поиска
и трекинга маркеров:
ARToolKit (и дочерние)
ZBar
…
В OpenCV по умолчанию трекинга
маркеров нет
46
47. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Дополненная реальность
Поиск маркеров
47Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
Один из методов поиска маркеров
48. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Результат
Сравнение с конкурентами (1)
48Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
Предложенный алгоритм
49. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Результат
Сравнение с конкурентами (2)
49Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
ARToolKit
50. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Результат
Сравнение с конкурентами (3)
50Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
Предложенный
алгоритм
ARToolKit
51. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Выводы
Достоинства:
Устойчивость к частичным перекрытиям
Высокая скорость работы
Недостаток:
Неустойчивость к изменениям яркости
(не работает на темных объектах)
51Martin Hirzer, “Marker Detection for Augmented Reality
Applications,” Project Image Analysis Graz, 2008
52. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Содержание
Введение
Local Image Interest Point
Template Matching Based on Fourier
Coefficients
Linear Scale and Rotation Invariant Matching
Дополненная реальность
Заключение
52
53. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Заключение
Рассмотренные алгоритмы с разных сторон
подходят к решению задачи поиска
и сопоставления шаблона и изображения
У каждого есть свои плюсы и минусы,
область применения
53
54. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Проделанная работа
Протестирована работоспособность
библиотеки ZBar по поиску маркеров
Входные данные: изображения (19 мегапикселей),
приближенные к «боевым»
Время работы: 2–3 секунды
Результат: все метки найдены
54
55. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Проделанная работа
Результаты
55
Изображение, приближенное к реальному
тестированию устройств
56. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Дальнейшие планы
Создание программы-визарда для
автоматического тестирования 3D-устройств
Тестирование новых и уже имеющихся
3D-устройств
Разработка системы тестирования
стереоскопического зрения
56
57. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Литература
1. M. Amiri and H.R. Rabiee, “RASIM: A Novel Rotation and Scale Invariant
Matching of Local Image Interest Points,” IEEE Transactions on Image
Processing, vol. 20, 2011, pp. 3580–3591.
2. H.Y. Kim, “Rotation-discriminating Template Matching Based on Fourier
Coefficients of Radial Projections with Robustness to Scaling and Partial
Occlusion,” Elsevier Pattern Recognition, vol. 43, 2010, pp. 859–872.
3. H. Jiang, S.X. Yu, and D.R. Martin, “Linear Scale and Rotation Invariant
Matching,” IEEE Transactions on Pattern Analysis and Machine
Intelligence, vol. 33, no. 7, 2011, pp. 1339–1355.
4. Martin Hirzer, “Marker Detection for Augmented Reality Applications,”
Project Image Analysis Graz, 2008, pp. 1–25.
5. А. Конушин, «Сопоставление изображений и локальные
особенности», лекции по курсу «Введение в компьютерное зрение»,
2012, стр. 45–79.
57
58. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Вопросы?
Предложения?
Наряды?
58
59. CS MSU Graphics & Media Lab (Video Group)
www.compression.ru/video/
Only for
Maxus
Лаборатория компьютерной
графики и мультимедиа
Видеогруппа — это:
Выпускники в аспирантурах
Англии, Франции, Швейцарии
(в России в МГУ и ИПМ им. Келдыша)
Выпускниками защищены 5 диссертаций
Наиболее популярные в мире сравнения
видеокодеков
Более 3 миллионов скачанных фильтров
обработки видео
59