論文の概要: DeepSim-Nets: Deep Similarity Networks for Stereo Image Matching
- arxiv url: http://arxiv.org/abs/2304.08056v1
- Date: Mon, 17 Apr 2023 08:15:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-18 16:03:46.389532
- Title: DeepSim-Nets: Deep Similarity Networks for Stereo Image Matching
- Title(参考訳): DeepSim-Nets:ステレオ画像マッチングのためのディープ類似ネットワーク
- Authors: Mohamed Ali Chebbi, Ewelina Rupnik, Marc Pierrot-Deseilligny, Paul
Lopes
- Abstract要約: 本稿では,3つのマルチスケール類似学習アーキテクチャ,DeepSimネットワークを提案する。
これらのモデルは、対照的な損失を伴う画素レベルのマッチングを学習し、考慮されたシーンの幾何学に非依存である。
エピポーラ対のすべてのピクセルを同時に高密度に割り当てることを学ぶことによって、ハイブリッドとエンド・ツー・エンドのアプローチの中間点を確立する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present three multi-scale similarity learning architectures, or DeepSim
networks. These models learn pixel-level matching with a contrastive loss and
are agnostic to the geometry of the considered scene. We establish a middle
ground between hybrid and end-to-end approaches by learning to densely allocate
all corresponding pixels of an epipolar pair at once. Our features are learnt
on large image tiles to be expressive and capture the scene's wider context. We
also demonstrate that curated sample mining can enhance the overall robustness
of the predicted similarities and improve the performance on radiometrically
homogeneous areas. We run experiments on aerial and satellite datasets. Our
DeepSim-Nets outperform the baseline hybrid approaches and generalize better to
unseen scene geometries than end-to-end methods. Our flexible architecture can
be readily adopted in standard multi-resolution image matching pipelines.
- Abstract(参考訳): 本稿では,3つのマルチスケール類似学習アーキテクチャ,DeepSimネットワークを提案する。
これらのモデルは、コントラスト損失とピクセルレベルのマッチングを学習し、考慮されたシーンの形状に依存しない。
我々は,エピポーラ対のすべての画素を一度に密にアロケートすることを学ぶことにより,ハイブリッドアプローチとエンドツーエンドアプローチの中間の基盤を確立する。
我々の特徴は大きな画像タイルで学習して表現し、シーンのより広いコンテキストを捉えます。
また, キュレーション試料の採掘により, 予測された類似性の全体的ロバスト性が向上し, 放射学的に均質な領域での性能が向上することを示した。
航空および衛星のデータセットで実験を行う。
DeepSim-Netsは、ベースラインハイブリッドアプローチよりも優れており、エンドツーエンドメソッドよりも、見えないシーンジオメトリをより一般化しています。
我々のフレキシブルアーキテクチャは、標準のマルチ解像度画像マッチングパイプラインに容易に適用できる。
関連論文リスト
- RGM: A Robust Generalizable Matching Model [49.60975442871967]
RGM(Robust Generalist Matching)と呼ばれる疎密マッチングのための深部モデルを提案する。
合成トレーニングサンプルと実世界のシナリオのギャップを狭めるために、我々は、疎対応基盤真理を持つ新しい大規模データセットを構築した。
さまざまな密集したスパースなデータセットを混ぜ合わせることができ、トレーニングの多様性を大幅に改善しています。
論文 参考訳(メタデータ) (2023-10-18T07:30:08Z) - GraphCSPN: Geometry-Aware Depth Completion via Dynamic GCNs [49.55919802779889]
本稿では,グラフ畳み込みに基づく空間伝搬ネットワーク(GraphCSPN)を提案する。
本研究では、幾何学的表現学習において、畳み込みニューラルネットワークとグラフニューラルネットワークを相補的に活用する。
提案手法は,数段の伝搬ステップのみを使用する場合と比較して,最先端の性能を実現する。
論文 参考訳(メタデータ) (2022-10-19T17:56:03Z) - Multi-Frame Self-Supervised Depth with Transformers [33.00363651105475]
本稿では,コストボリューム生成のためのトランスフォーマーアーキテクチャを提案する。
深度分布型エピポーラサンプリングを用いて、マッチング候補を選択する。
私たちは、一連の自己と横断的なレイヤを通じて予測を洗練します。
論文 参考訳(メタデータ) (2022-04-15T19:04:57Z) - Extracting Triangular 3D Models, Materials, and Lighting From Images [59.33666140713829]
多視点画像観測による材料と照明の協調最適化手法を提案する。
従来のグラフィックスエンジンにデプロイ可能な,空間的に変化する材料と環境を備えたメッシュを活用します。
論文 参考訳(メタデータ) (2021-11-24T13:58:20Z) - Multi-scale Matching Networks for Semantic Correspondence [38.904735120815346]
提案手法は,高い計算効率を有する3つの一般的なベンチマークに対して,最先端の性能を実現する。
我々のマルチスケールマッチングネットワークは、学習可能なパラメータをほとんど必要とせずに、エンドツーエンドで簡単に訓練できる。
論文 参考訳(メタデータ) (2021-07-31T10:57:24Z) - ACORN: Adaptive Coordinate Networks for Neural Scene Representation [40.04760307540698]
現在の神経表現は、数十万以上のポリゴンを持つメガピクセルまたは3Dシーン以上の解像度で画像を正確に表現できません。
トレーニングや推論中にリソースを適応的に割り当てる新しいハイブリッド暗黙的ネットワークアーキテクチャとトレーニング戦略を紹介します。
ギガピクセル画像を40dB近いピーク信号対雑音比に収まる最初の実験を実証します。
論文 参考訳(メタデータ) (2021-05-06T16:21:38Z) - Monocular Depth Parameterizing Networks [15.791732557395552]
実現可能な形状を持つ深度マップの集合のパラメータ化を提供するネットワーク構造を提案する。
これにより、他の画像に関して、写真に一貫性のあるソリューションの形状を検索できる。
実験により,本手法はより正確な深度マップを生成し,競合する最先端手法よりも一般化することを示す。
論文 参考訳(メタデータ) (2020-12-21T13:02:41Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z) - Recursive Multi-model Complementary Deep Fusion forRobust Salient Object
Detection via Parallel Sub Networks [62.26677215668959]
完全畳み込みネットワークは、正体検出(SOD)分野において優れた性能を示している。
本稿では,全く異なるネットワークアーキテクチャを持つ並列サブネットワークからなる,より広いネットワークアーキテクチャを提案する。
いくつかの有名なベンチマークの実験では、提案されたより広範なフレームワークの優れた性能、優れた一般化、強力な学習能力が明らかに示されている。
論文 参考訳(メタデータ) (2020-08-07T10:39:11Z) - Deep 3D Capture: Geometry and Reflectance from Sparse Multi-View Images [59.906948203578544]
本稿では,任意の物体の高品質な形状と複雑な空間変化を持つBRDFを再構成する学習に基づく新しい手法を提案する。
まず、深層多視点ステレオネットワークを用いて、ビューごとの深度マップを推定する。
これらの深度マップは、異なるビューを粗く整列するために使用される。
本稿では,新しい多視点反射率推定ネットワークアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-03-27T21:28:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。