Восьмиточковий алгоритм

Восьмиточковий алгоритм — це алгоритм, який використовується в комп'ютерному баченні для оцінки істотної матриці або фундаментальної матриці, що відповідає парі камер, за допомогою множини відповідних точок двох зображень. Х'ю Крістофер Лонгет-Хіггінс запропонував цей алгоритм у випадку істотної матриці у 1981 році. Теоретично цей алгоритм може бути використано і для визначення фундаментальної матриці, але на практиці нормалізований восьмиточковий алгоритм, описаний Річардом Хартлі 1997 року, більше підходить для цього випадку.

Назва алгоритму походить від того факту, що він оцінює істотну матрицю або фундаментальну матрицю по множині з восьми (або більше) відповідних точок зображення. Однак варіації алгоритму можуть бути використані у випадку менш ніж на восьми точок.

Умова копланарності

Приклад епіполярної геометрії. Дві камери з відповідними центрами проекційних точок O _L і O _R спостерігають точку P. Проекція P на кожну з площин зображення позначається p _L і p _R. Точки E _L і E _R є епіполями.

Можна виразити епіполярну геометрію двох камер та точки простору за допомогою алгебраїчного рівняння. Зверніть увагу, незалежно від того де знаходиться точка $P$ у просторі, вектори ${\overline {O_{L}P}}$ , ${\overline {O_{R}P}}$ і ${\overline {O_{R}O_{L}}}$ належать одній площині. Позначимо як $X_{L}$ координати точки $P$ у системі координат лівого ока та як $X_{R}$ координати точки $P$ у системі координат правого ока; позначимо як $R,T$ обертання та переміщення при переході між системами координат, тобто $X_{R}=R(X_{L}-T)$ - це співвідношення між координатами $P$ у двох системах координат. Наступне рівняння завжди виконується, оскільки вектор, отриманий як $T\wedge X_{L}$ є ортогональним до обох векторів $T$ і $X_{L}$ :

X_{L}^{T}T\wedge X_{L}-T^{T}T\wedge X_{L}=(X_{L}-T)^{T}T\wedge X_{L}=0

Оскільки матриця обертання є ортогональною, тобто $I=R^{T}R$ , ми отримуємо

(X_{L}-T)^{T}R^{T}RT\wedge X_{L}=0

.

Замінивши $(X_{L}-T)^{T}R^{T}$ на $X_{R}^{T}$ , ми отримуємо

X_{R}^{T}RT\wedge X_{L}=X_{R}^{T}RSX_{L}=X_{R}^{T}EX_{L}=0

Зверніть увагу на те, що векторний добуток $T\wedge$ може розглядатися як множення вектора на матрицю; Символом $S$ було позначено цю матрицю. Добуток $RT\wedge =RS$ часто називають істотною матрицею і позначають $E$ .

Вектори ${\overline {O_{L}p_{L}}},{\overline {O_{R}p_{R}}}$ паралельні векторам ${\overline {O_{L}P}},{\overline {O_{R}P}}$ і тому обмеження копланарності виконується, якщо ми підставляємо ці вектори. Якщо ми позначимо як $y,y'$ координати проекцій $P$ на площини лівого та правого зображення, тоді умова копланарності може бути записана як

y'^{T}\mathbf {E} y=0

Базовий алгоритм

Далі описано базовий восьмиточковий алгоритм для оцінки істотної матриці $\mathbf {E}$ . Він складається з трьох кроків. Спочатку формулюється однорідне лінійне рівняння, де розв'язком є матриця $\mathbf {E}$ , а потім розв’язується це рівняння, враховуючи, що воно може не мати точного розвʼязку. Нарешті, накладаються внутрішні обмеження результуючої матриці. Перший крок описаний у роботі Лонгет-Гіггінса, другий і третій кроки є стандартними підходами в теорії оцінки.

Умова компланарності накладена суттєвою матрицею $\mathbf {E}$ :

(\mathbf {y} ')^{T}\,\mathbf {E} \,\mathbf {y} =0

для відповідних точок зображення, представлених у нормалізованих координатах зображення $\mathbf {y} ,\mathbf {y} '$ . Задача, яку вирішує алгоритм, полягає у визначенні $\mathbf {E}$ для набору відповідних точок зображення. На практиці на координати зображення точок зображення впливає шум, і рішення також може бути надмірно визначеним, що означає, що не вдасться знайти $\mathbf {E}$ яка задовольняє вищезазначеним умовам точно для всіх точок. Це питання розглядається на другому етапі алгоритму.

Крок 1: Формулювання однорідного лінійного рівняння

Запишемо

\mathbf {y} ={\begin{pmatrix}y_{1}\\y_{2}\\1\end{pmatrix}}

і

\mathbf {y} '={\begin{pmatrix}y'_{1}\\y'_{2}\\1\end{pmatrix}}

і

\mathbf {E} ={\begin{pmatrix}e_{11}&e_{12}&e_{13}\\e_{21}&e_{22}&e_{23}\\e_{31}&e_{32}&e_{33}\end{pmatrix}}

тоді умову компланарності можна переписати як

y'_{1}y_{1}e_{11}+y'_{1}y_{2}e_{12}+y'_{1}e_{13}+y'_{2}y_{1}e_{21}+y'_{2}y_{2}e_{22}+y'_{2}e_{23}+y_{1}e_{31}+y_{2}e_{32}+e_{33}=0\,

або

\mathbf {e} \cdot {\tilde {\mathbf {y} }}=0

де

{\tilde {\mathbf {y} }}={\begin{pmatrix}y'_{1}y_{1}\\y'_{1}y_{2}\\y'_{1}\\y'_{2}y_{1}\\y'_{2}y_{2}\\y'_{2}\\y_{1}\\y_{2}\\1\end{pmatrix}}

і

\mathbf {e} ={\begin{pmatrix}e_{11}\\e_{12}\\e_{13}\\e_{21}\\e_{22}\\e_{23}\\e_{31}\\e_{32}\\e_{33}\end{pmatrix}}

це, $\mathbf {e}$ представляє істотну матрицю у вигляді 9-мірного вектора, і цей вектор повинен бути ортогональним вектору ${\tilde {\mathbf {y} }}$ .

Кожна пара відповідних точок зображення створює вектор ${\tilde {\mathbf {y} }}$ . Дано набір 3D-точок $\mathbf {P} _{k}$ що відповідає набору векторів ${\tilde {\mathbf {y} }}_{k}$ , всі вони повинні задовольнити

\mathbf {e} \cdot {\tilde {\mathbf {y} }}_{k}=0

для вектора $\mathbf {e}$ . Якщо надано достатньо (принаймні вісім) лінійно незалежних векторів ${\tilde {\mathbf {y} }}_{k}$ вектор $\mathbf {e}$ можна визначити вирішивши систему лінійних рівнянь. Запишемо усі вектори ${\tilde {\mathbf {y} }}_{k}$ як стовпці матриці $\mathbf {Y}$ і тоді:

\mathbf {e} ^{T}\,\mathbf {Y} =\mathbf {0}

Це означає що $\mathbf {e}$ є рішенням системи лінійних однорідних рівнянь.

Крок 2: Розв’язок рівняння

Стандартний підхід до вирішення цього рівняння передбачає, що $\mathbf {e}$ є лівим сингулярним вектором $\mathbf {Y}$ якому відповідає нульове сингулярне значення. За умови, що принаймні вісім лінійно незалежних векторів ${\tilde {\mathbf {y} }}_{k}$ використовуються для побудови $\mathbf {Y}$ випливає, що цей особливий вектор є унікальним і, отже, $\mathbf {e}$ і $\mathbf {E}$ можна визначити.

У випадку, коли для побудови $\mathbf {Y}$ використовується більше восьми відповідних точок не виключено, що вона не має жодного особливого значення, рівного нулю. Цей випадок трапляється на практиці, коли на координати зображення впливають різні типи шумів. Поширеним підходом до вирішення цієї задачі є використання методу найменших квадратів; знаходиться $\mathbf {e}$ що мінімізує

\|\mathbf {e} ^{T}\,\mathbf {Y} \|

коли $\|\mathbf {e} \|=1$ . Роз'язок полягає у виборі $\mathbf {e}$ як лівого сингулярного вектора, що відповідає найменшому особливому значенню $\mathbf {Y}$ . Переписавши цей вектор $\mathbf {e}$ знову як матрицю $3\times 3$ отримаємо результат цього кроку, що далі позначено як $\mathbf {E} _{\rm {est}}$

Крок 3: Накладення внутрішніх обмежень

Іншим наслідком роботи з шумними координатами зображень є те, що отримана матриця може не задовольняти внутрішнім обмеженням істотної матриці, тобто два її особливих значення є рівними і ненульовими, а інше дорівнює нулю. Залежно від імплементації, менші або більші відхилення від внутрішніх обмежень можуть бути, а можуть і не бути проблемою. Якщо критично важливо, щоб знайдена матриця задовольняла внутрішнім обмеженням, це може бути досягнуто шляхом пошуку матриці $\mathbf {E} '$ рангу 2, яка мінімізує

\|\mathbf {E} '-\mathbf {E} _{\rm {est}}\|

де $\mathbf {E} _{\rm {est}}$ є матрицею отриманою на кроці 2 та використовується норма матриці Фробеніуса . Рохзвʼязок задається обчисленням сингулярного розкладу значення $\mathbf {E} _{\rm {est}}$ :

\mathbf {E} _{\rm {est}}=\mathbf {U} \,\mathbf {S} \,\mathbf {V} ^{T}

де $\mathbf {U} ,\mathbf {V}$ є ортогональними матрицями та $\mathbf {S}$ є діагональною матрицею, яка містить особливі значення $\mathbf {E} _{\rm {est}}$ . В ідеальному випадку один з діагональних елементів $\mathbf {S}$ має бути нульовим або принаймні малим порівняно з двома іншими, які повинні бути однаковими. У будь-якому випадку вважаємо

\mathbf {S} '={\begin{pmatrix}s_{1}&0&0\\0&s_{2}&0\\0&0&0\end{pmatrix}},

де $s_{1},s_{2}$ - найбільше та друге за величиною сингулярні значення $\mathbf {S}$ відповідно. Нарешті, $\mathbf {E} '$

\mathbf {E} '=\mathbf {U} \,\mathbf {S} '\,\mathbf {V} ^{T}

Матриця $\mathbf {E} '$ є результуючою оцінкою істотної матриці, отриманою за допомогою алгорита.

Реалізації

Восьмиточковий алгоритм реалізовано в бібліотеці OpenCV, де йому відповідає функція cv::findFundamentalMat, яка викликається із параметром cv::FM_8POINT.

Див. також

Посилання

Richard I. Hartley (June 1997). In Defense of the Eight-Point Algorithm. IEEE Transactions on Pattern Recognition and Machine Intelligence 19 (6): 580–593. doi:10.1109/34.601246.

Richard Hartley and Andrew Zisserman (2003). Multiple View Geometry in computer vision. Cambridge University Press. ISBN 978-0-521-54051-3.

H. Christopher Longuet-Higgins (September 1981). A computer algorithm for reconstructing a scene from two projections. Nature 293 (5828): 133–135. doi:10.1038/293133a0.

This article is issued from Wikipedia. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.