論文の概要: HOT-POT: Optimal Transport for Sparse Stereo Matching
- arxiv url: http://arxiv.org/abs/2601.12423v1
- Date: Sun, 18 Jan 2026 14:10:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.622677
- Title: HOT-POT: Optimal Transport for Sparse Stereo Matching
- Title(参考訳): HOT-POT:スパースステレオマッチングのための最適輸送
- Authors: Antonin Clerc, Michael Quellmalz, Moritz Piening, Philipp Flotho, Gregor Kornhardt, Gabriele Steidl,
- Abstract要約: 我々は、最適輸送(OT)の観点から、カメラ幾何学の直線制約を考察する。
カメラ投影点を(半)線として定式化し、古典的エピポーラ距離と3次元光線距離を用いてマッチング品質を定量化する。
私たちは顔分析の応用に焦点を合わせ、異なるランドマークの慣習に適合することを目指しています。
- 参考スコア(独自算出の注目度): 6.824432626095973
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Stereo vision between images faces a range of challenges, including occlusions, motion, and camera distortions, across applications in autonomous driving, robotics, and face analysis. Due to parameter sensitivity, further complications arise for stereo matching with sparse features, such as facial landmarks. To overcome this ill-posedness and enable unsupervised sparse matching, we consider line constraints of the camera geometry from an optimal transport (OT) viewpoint. Formulating camera-projected points as (half)lines, we propose the use of the classical epipolar distance as well as a 3D ray distance to quantify matching quality. Employing these distances as a cost function of a (partial) OT problem, we arrive at efficiently solvable assignment problems. Moreover, we extend our approach to unsupervised object matching by formulating it as a hierarchical OT problem. The resulting algorithms allow for efficient feature and object matching, as demonstrated in our numerical experiments. Here, we focus on applications in facial analysis, where we aim to match distinct landmarking conventions.
- Abstract(参考訳): 画像間のステレオビジョンは、オクルージョン、モーション、カメラの歪みなど、自律運転、ロボティクス、顔分析など、さまざまな課題に直面している。
パラメータの感度のため、顔のランドマークのようなスパースな特徴とステレオマッチングするためにさらに複雑になる。
この不明瞭さを克服し、教師なしスパースマッチングを可能にするために、最適な輸送(OT)の観点からカメラ幾何学のライン制約を検討する。
カメラ投影点を(半)線として定式化し、古典的エピポーラ距離と3次元光線距離を用いてマッチング品質を定量化する。
これらの距離を(部分)OT問題のコスト関数として利用し、効率的に解ける代入問題にたどり着く。
さらに、階層OT問題として定式化することで、教師なしオブジェクトマッチングへのアプローチを拡張した。
得られたアルゴリズムは、我々の数値実験で示されているように、効率的な特徴とオブジェクトマッチングを可能にする。
ここでは、顔分析の応用に焦点を当て、異なるランドマークの慣習に適合することを目指している。
関連論文リスト
- Spatiotemporal Multi-Camera Calibration using Freely Moving People [32.288669810272864]
マルチビュー動画における移動自由度を用いたマルチカメラキャリブレーション手法を提案する。
我々は、時間外時空間の棚から得られた3D人間のポーズを用いて、それらを単位球上の3Dポイントに変換する。
我々は、時間データの整合と対応の確立という両問題を共同で解決する確率論的アプローチを採用する。
論文 参考訳(メタデータ) (2025-02-18T05:15:52Z) - DisCO: Portrait Distortion Correction with Perspective-Aware 3D GANs [24.483597004603812]
近距離で撮影されたクローズアップ顔画像は、しばしば視点歪みに悩まされる。
本研究では,1つのクローズアップ面における視点歪みを補正する簡易かつ効果的な方法を提案する。
論文 参考訳(メタデータ) (2023-02-23T18:59:56Z) - DETR4D: Direct Multi-View 3D Object Detection with Sparse Attention [50.11672196146829]
サラウンドビュー画像を用いた3次元物体検出は、自動運転にとって必須の課題である。
マルチビュー画像における3次元オブジェクト検出のためのスパースアテンションと直接特徴クエリを探索するトランスフォーマーベースのフレームワークであるDETR4Dを提案する。
論文 参考訳(メタデータ) (2022-12-15T14:18:47Z) - Multitask AET with Orthogonal Tangent Regularity for Dark Object
Detection [84.52197307286681]
暗黒環境下でのオブジェクト検出を強化するために,新しいマルチタスク自動符号化変換(MAET)モデルを提案する。
自己超越的な方法で、MAETは、現実的な照明劣化変換を符号化して復号することで、本質的な視覚構造を学習する。
我々は,合成および実世界のデータセットを用いて最先端のパフォーマンスを達成した。
論文 参考訳(メタデータ) (2022-05-06T16:27:14Z) - Degradation-agnostic Correspondence from Resolution-asymmetric Stereo [96.03964515969652]
テレワイドカメラシステムで取得した解像度の異なる2枚の画像からステレオマッチングの問題を考察する。
特徴量整合性という画像空間の代わりに特徴空間に2つのビュー間の整合性を課すことを提案する。
測光損失をトレーニングしたステレオマッチングネットワークは最適ではないが, 特徴抽出器は劣化に依存しない, マッチング特有の特徴を生成できる。
論文 参考訳(メタデータ) (2022-04-04T12:24:34Z) - Hybrid Tracker with Pixel and Instance for Video Panoptic Segmentation [50.62685357414904]
ビデオパノプティカル係数(VPS)は、コヒーレントなパノプティカルセグメンテーションを生成し、ビデオフレーム全体の全ピクセルのアイデンティティを追跡することを目的としている。
単一トラッカーの限界を取り除くために,軽量かつ共同的な追跡モデルであるHybridTrackerを提案する。
総合的な実験により、HybridTrackerはCityscapes-VPSとVIPERデータセットの最先端メソッドよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2022-03-02T16:21:55Z) - Efficient Global Optimization of Non-differentiable, Symmetric
Objectives for Multi Camera Placement [0.0]
複数台のカメラを3Dシーンに最適に配置・配向するための新しい反復手法を提案する。
サンプルアプリケーションには、3D再構築の精度の向上、監視対象エリアの最大化、多視点歩行者追跡のカバレッジ向上が含まれる。
論文 参考訳(メタデータ) (2021-03-20T17:01:15Z) - Nothing But Geometric Constraints: A Model-Free Method for Articulated
Object Pose Estimation [89.82169646672872]
本稿では,ロボットアームの関節構成を,モデルに先入観を持たずにRGBまたはRGB-D画像のシーケンスから推定する,教師なし視覚ベースシステムを提案する。
我々は,古典幾何学的定式化と深層学習を組み合わせることで,この課題を解決するために,極性多剛体制約を拡張した。
論文 参考訳(メタデータ) (2020-11-30T20:46:48Z) - Spherical formulation of moving object geometric constraints for
monocular fisheye cameras [0.0]
自律走行に使用される魚眼カメラの移動物体検出アルゴリズムを提案する。
直交画像の3つの制約を球面座標に再構成する。
論文 参考訳(メタデータ) (2020-03-06T14:59:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。