Факторизация Томаси – Канаде - Tomasi–Kanade factorization

В Факторизация Томаси – Канаде является плодотворной работой Карло Томази и Такео Канаде в начале 1990-х гг.[1] Было предложено элегантное и простое решение, основанное на СВД схема факторизации для анализа измерений изображений жесткого объекта, снятых с разных ракурсов с использованием слабая перспектива модель камеры. Важнейшее наблюдение, сделанное авторами, заключалось в том, что если все измерения (то есть координаты изображений всех точек во всех видах) собраны в единой матрице, то траектории точек будут находиться в определенном подпространстве. Размер подпространства, в котором находятся данные изображения, является прямым следствием двух факторов:

  1. Тип камеры, проецирующей сцену (например, аффинная или перспективная).
  2. Характер проверяемого объекта (например, жесткий или нежесткий).

Низкая размерность подпространства отражается (фиксируется) тривиально как пониженный ранг матрицы измерений. Этот пониженный ранг матрицы измерений может быть мотивирован тем фактом, что положение проекции точки объекта на плоскости изображения ограничено, поскольку движение каждой точки глобально описывается точной геометрической моделью.

Метод

Факторизация твердого тела, представленная в, обеспечивает описание трехмерной структуры жесткого объекта в терминах набора характерных точек, извлеченных из характерных особенностей изображения. После отслеживания точек на всех изображениях, составляющих временную последовательность, становится доступен набор траекторий. Эти траектории глобально ограничены в каждом кадре жесткой трансформацией, которой подвергается форма, т.е. траектория каждой точки будет иметь одинаковый профиль.

Пусть расположение точки j в кадре я быть определенным как пij = (Иксij, уij)Т куда Иксij и уij - координаты изображения по горизонтали и вертикали соответственно.

Компактное представление измерений изображения может быть выражено путем сбора всех неоднородных координат в единую матрицу, называемую матрицей наблюдения. п такой, что

п это 2F × N матрица, где F количество кадров и N количество характерных точек. В идеале матрица наблюдения должна содержать точную информацию об отслеживаемом объекте. К сожалению, на практике большинство современных трекеров могут предоставлять только точечные треки, которые являются неполными (из-за окклюзии) и неточными (из-за шума сенсора), если они размещены в неструктурированной среде.

Как упоминалось ранее, основная предпосылка факторизации заключается в том, что матрица измерений п ограничен по рангу. Кроме того, можно фактор п на две подматрицы: матрицу движения и форму, M и S размера 2F × r и N × r соответственно.

Размер и структура S обычно зависит от свойств формы (например, жесткая она или нежесткая) и M зависит как от типа модели камеры, которую мы предполагаем, так и от свойств формы. Суть метода факторизации заключается в вычислении

Оптимальный р-ранговое приближение п с уважением к Норма Фробениуса можно узнать по схеме на основе СВД.

Рекомендации

  1. ^ Карло Томази и Такео Канаде. (Ноябрь 1992 г.). «Форма и движение из потоков изображений при орфографии: метод факторизации». Международный журнал компьютерного зрения. 9 (2): 137–154. CiteSeerX  10.1.1.131.9807. Дои:10.1007 / BF00129684. S2CID  2931825.

Смотрите также