論文の概要: Multi-view dense image matching with similarity learning and geometry priors
- arxiv url: http://arxiv.org/abs/2505.11264v1
- Date: Fri, 16 May 2025 13:55:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-19 14:36:15.181784
- Title: Multi-view dense image matching with similarity learning and geometry priors
- Title(参考訳): 類似性学習と幾何学的先行性を考慮した多視点高密度画像マッチング
- Authors: Mohamed Ali Chebbi, Ewelina Rupnik, Paul Lopes, Marc Pierrot-Deseilligny,
- Abstract要約: MV-DeepSimNetsは、マルチビュー類似性学習用に設計されたディープニューラルネットワークのスイートである。
我々のアプローチは、ピクセル関係を特徴づける前に、オンライン幾何学を取り入れている。
幾何的プレコンディショニング法は,多視点再構成のためのエピポーラ的特徴を効果的に適用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We introduce MV-DeepSimNets, a comprehensive suite of deep neural networks designed for multi-view similarity learning, leveraging epipolar geometry for training. Our approach incorporates an online geometry prior to characterize pixel relationships, either along the epipolar line or through homography rectification. This enables the generation of geometry-aware features from native images, which are then projected across candidate depth hypotheses using plane sweeping. Our method geometric preconditioning effectively adapts epipolar-based features for enhanced multi-view reconstruction, without requiring the laborious multi-view training dataset creation. By aggregating learned similarities, we construct and regularize the cost volume, leading to improved multi-view surface reconstruction over traditional dense matching approaches. MV-DeepSimNets demonstrates superior performance against leading similarity learning networks and end-to-end regression models, especially in terms of generalization capabilities across both aerial and satellite imagery with varied ground sampling distances. Our pipeline is integrated into MicMac software and can be readily adopted in standard multi-resolution image matching pipelines.
- Abstract(参考訳): MV-DeepSimNetsは、多視点類似性学習用に設計された深層ニューラルネットワークの包括的スイートで、エピポーラ幾何学をトレーニングに活用する。
我々のアプローチは、エピポーラ線に沿って、あるいはホモグラフィの修正を通して、ピクセル関係を特徴づける前に、オンライン幾何学を取り入れている。
これにより、ネイティブ画像から幾何学的特徴を生成でき、平面スイーピングを用いて候補深度仮説を越えて投影される。
幾何的プレコンディショニングは,多視点学習データセットの作成を必要とせず,多視点再構成の強化のために,エピポーラ的な特徴を効果的に適用する。
学習した類似性を集約することにより、コストボリュームの構築と調整を行い、従来の密マッチングアプローチよりも多面的な表面再構成が改善される。
MV-DeepSimNetsは主要な類似性学習ネットワークとエンドツーエンド回帰モデルに対して、特に地上サンプリング距離の異なる航空画像と衛星画像の一般化能力において優れた性能を示す。
私たちのパイプラインはMicMacソフトウェアに統合されており、標準のマルチ解像度画像マッチングパイプラインに容易に適用できます。
関連論文リスト
- Blending 3D Geometry and Machine Learning for Multi-View Stereopsis [3.259672998844162]
GC MVSNet plusは、学習中に多視点、多スケールの教師あり幾何的一貫性を強制するための新しいアプローチである。
この統合GCチェックは、幾何学的に一貫性のないピクセルを直接ペナル化することにより、学習プロセスを著しく加速する。
提案手法は,DTUおよびBlendedMVSデータセット上での新たな技術状況を実現し,タンク・アンド・テンプルのベンチマークで2位を確保した。
論文 参考訳(メタデータ) (2025-05-06T12:22:45Z) - Hyper-VolTran: Fast and Generalizable One-Shot Image to 3D Object
Structure via HyperNetworks [53.67497327319569]
画像から3Dまでを1つの視点から解く新しいニューラルレンダリング手法を提案する。
提案手法では, 符号付き距離関数を表面表現として使用し, 幾何エンコードボリュームとハイパーネットワークスによる一般化可能な事前処理を取り入れた。
本実験は,一貫した結果と高速な生成による提案手法の利点を示す。
論文 参考訳(メタデータ) (2023-12-24T08:42:37Z) - DeepSim-Nets: Deep Similarity Networks for Stereo Image Matching [0.0]
本稿では,3つのマルチスケール類似学習アーキテクチャ,DeepSimネットワークを提案する。
これらのモデルは、対照的な損失を伴う画素レベルのマッチングを学習し、考慮されたシーンの幾何学に非依存である。
エピポーラ対のすべてのピクセルを同時に高密度に割り当てることを学ぶことによって、ハイブリッドとエンド・ツー・エンドのアプローチの中間点を確立する。
論文 参考訳(メタデータ) (2023-04-17T08:15:47Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - Geo-Neus: Geometry-Consistent Neural Implicit Surfaces Learning for
Multi-view Reconstruction [41.43563122590449]
多視点再構成のための幾何一貫性のあるニューラルサーフェス学習を提案する。
提案手法は, 複雑な薄板構造と大きな平滑領域の両方において, 高品質な表面再構成を実現する。
論文 参考訳(メタデータ) (2022-05-31T14:52:07Z) - Weak Multi-View Supervision for Surface Mapping Estimation [0.9367260794056769]
密接なアノテーションを使わずにカテゴリ別表面マッピングを学習する,弱監督型マルチビュー学習手法を提案する。
人間の顔、車、飛行機といった一般的なカテゴリの基盤となる表面形状を、それらのカテゴリの例から学習する。
論文 参考訳(メタデータ) (2021-05-04T09:46:26Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z) - Continual Adaptation for Deep Stereo [52.181067640300014]
本稿では,難易度と変化の激しい環境に対処するために,深層ステレオネットワークの継続的適応パラダイムを提案する。
我々のパラダイムでは、オンラインモデルに継続的に適応するために必要な学習信号は、右から左への画像ワープや従来のステレオアルゴリズムによって自己監督から得られる。
我々のネットワークアーキテクチャと適応アルゴリズムは、初めてのリアルタイム自己適応型ディープステレオシステムを実現する。
論文 参考訳(メタデータ) (2020-07-10T08:15:58Z) - Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。
まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。
これらの深度マップは、異なるビューを粗く整列するために使用される。
本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-27T21:28:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。