論文の概要: Learning Intra-view and Cross-view Geometric Knowledge for Stereo
Matching
- arxiv url: http://arxiv.org/abs/2402.19270v2
- Date: Wed, 6 Mar 2024 08:52:09 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-07 11:57:29.358793
- Title: Learning Intra-view and Cross-view Geometric Knowledge for Stereo
Matching
- Title(参考訳): ステレオマッチングのためのイントラビューとクロスビューの幾何学知識の学習
- Authors: Rui Gong, Weide Liu, Zaiwang Gu, Xulei Yang, Jun Cheng
- Abstract要約: 我々はICGNet(Intra-view and Cross-view Geometric Knowledge Learning Network)を提案する。
ICGNetは、ビュー内幾何学的理解のためのチャンネルとして機能するために、関心点の力を利用する。
我々の実験は、現代の先行モデルよりもICGNetの方が優れていることを示した。
- 参考スコア(独自算出の注目度): 14.538768962289046
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Geometric knowledge has been shown to be beneficial for the stereo matching
task. However, prior attempts to integrate geometric insights into stereo
matching algorithms have largely focused on geometric knowledge from single
images while crucial cross-view factors such as occlusion and matching
uniqueness have been overlooked. To address this gap, we propose a novel
Intra-view and Cross-view Geometric knowledge learning Network (ICGNet),
specifically crafted to assimilate both intra-view and cross-view geometric
knowledge. ICGNet harnesses the power of interest points to serve as a channel
for intra-view geometric understanding. Simultaneously, it employs the
correspondences among these points to capture cross-view geometric
relationships. This dual incorporation empowers the proposed ICGNet to leverage
both intra-view and cross-view geometric knowledge in its learning process,
substantially improving its ability to estimate disparities. Our extensive
experiments demonstrate the superiority of the ICGNet over contemporary leading
models.
- Abstract(参考訳): 幾何学的知識はステレオマッチングに有用であることが示されている。
しかし、幾何学的洞察をステレオマッチングアルゴリズムに統合する以前の試みは、単一画像からの幾何学的知識に主に焦点を合わせ、オクルージョンや一意性といった重要なクロスビュー要素は見過ごされている。
このギャップに対処するため,我々は,ビュー内知識とクロスビュー幾何学知識の両相同化を目的として,ICGNet(Intra-view and Cross-view Geometric Knowledge Learning Network)を提案する。
ICGNetは、ビュー内幾何学的理解のためのチャンネルとして機能するために、関心点の力を利用する。
同時に、これらの点間の対応を利用して、断面幾何学的関係を捉える。
この二重編入により、提案されたIGGNetは、その学習プロセスにおいて、ビュー内およびクロスビュー幾何学的知識の両方を活用することができ、その格差を推定する能力を大幅に向上する。
我々の広範な実験は、icgnetが現代の先行モデルよりも優れていることを示している。
関連論文リスト
- Geometry-guided Feature Learning and Fusion for Indoor Scene Reconstruction [14.225228781008209]
本稿では3次元シーン再構成のための新しい幾何学的統合機構を提案する。
提案手法は,特徴学習,特徴融合,ネットワーク監視という3段階の3次元幾何学を取り入れている。
論文 参考訳(メタデータ) (2024-08-28T08:02:47Z) - On the Geometry of Deep Learning [15.327649172531606]
本稿では,深層ネットワークのアフィンスプラインマッピングの幾何特性の解明について概説する。
ご覧のように、アフィンスプライン接続と幾何学的視点は、ディープネットワークの内部構造を閲覧、分析、改善するための強力なポータルを提供する。
論文 参考訳(メタデータ) (2024-08-09T01:40:12Z) - GC-MVSNet: Multi-View, Multi-Scale, Geometrically-Consistent Multi-View
Stereo [10.732653898606253]
本稿では,学習中の複数のソースビューにまたがる参照ビュー深度マップの幾何的整合性を明確に促進する新しいアプローチを提案する。
この幾何整合性損失を加えることで、幾何学的に矛盾したピクセルを明示的にペナル化することで学習を著しく加速することがわかった。
実験の結果,本手法はDTUおよびBlendedMVSデータセットの新たな最先端化を実現し,Turts and Templesベンチマークの競争結果が得られた。
論文 参考訳(メタデータ) (2023-10-30T14:41:53Z) - GFNet: Geometric Flow Network for 3D Point Cloud Semantic Segmentation [91.15865862160088]
本稿では,異なるビュー間の幾何対応性を検討するための幾何フローネットワーク (GFNet) を提案する。
具体的には、異なる視点にまたがって補完情報を双方向に整列し、伝播する新しい幾何フローモジュール(GFM)を考案する。
論文 参考訳(メタデータ) (2022-07-06T11:48:08Z) - Geometric Deep Learning: Grids, Groups, Graphs, Geodesics, and Gauges [50.22269760171131]
過去10年間、データサイエンスと機械学習の実験的な革命が、ディープラーニングの手法によって生まれた。
このテキストは、統一幾何学的原理によって事前に定義された規則性を公開することに関するものである。
CNN、RNN、GNN、Transformersなど、最も成功したニューラルネットワークアーキテクチャを研究するための一般的な数学的フレームワークを提供する。
論文 参考訳(メタデータ) (2021-04-27T21:09:51Z) - Fusing the Old with the New: Learning Relative Camera Pose with
Geometry-Guided Uncertainty [91.0564497403256]
本稿では,ネットワークトレーニング中の2つの予測系間の確率的融合を含む新しい枠組みを提案する。
本ネットワークは,異なる対応間の強い相互作用を強制することにより学習を駆動する自己追跡グラフニューラルネットワークを特徴とする。
学習に適したモーションパーマリゼーションを提案し、難易度の高いDeMoNおよびScanNetデータセットで最新のパフォーマンスを達成できることを示します。
論文 参考訳(メタデータ) (2021-04-16T17:59:06Z) - SOSD-Net: Joint Semantic Object Segmentation and Depth Estimation from
Monocular images [94.36401543589523]
これら2つのタスクの幾何学的関係を利用するための意味的対象性の概念を紹介します。
次に, 対象性仮定に基づくセマンティックオブジェクト・深さ推定ネットワーク(SOSD-Net)を提案する。
私たちの知識を最大限に活用するために、SOSD-Netは同時単眼深度推定とセマンティックセグメンテーションのためのジオメトリ制約を利用する最初のネットワークです。
論文 参考訳(メタデータ) (2021-01-19T02:41:03Z) - Learning Connectivity of Neural Networks from a Topological Perspective [80.35103711638548]
本稿では,ネットワークを解析のための完全なグラフに表現するためのトポロジ的視点を提案する。
接続の規模を反映したエッジに学習可能なパラメータを割り当てることにより、学習プロセスを異なる方法で行うことができる。
この学習プロセスは既存のネットワークと互換性があり、より大きな検索空間と異なるタスクへの適応性を持っている。
論文 参考訳(メタデータ) (2020-08-19T04:53:31Z) - Neural Topological SLAM for Visual Navigation [112.73876869904]
意味論を生かし、近似幾何学的推論を行う空間のトポロジ的表現を設計する。
本稿では,ノイズのあるアクティベーションの下でそのような表現を構築し,維持し,使用することができる教師付き学習ベースアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2020-05-25T17:56:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。