論文の概要: A Comparative Study on Deep-Learning Methods for Dense Image Matching of
Multi-angle and Multi-date Remote Sensing Stereo Images
- arxiv url: http://arxiv.org/abs/2210.14031v1
- Date: Tue, 25 Oct 2022 14:10:04 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-26 15:16:20.431011
- Title: A Comparative Study on Deep-Learning Methods for Dense Image Matching of
Multi-angle and Multi-date Remote Sensing Stereo Images
- Title(参考訳): 多角・多点リモートセンシングステレオ画像の高密度画像マッチングのためのディープラーニング法の比較検討
- Authors: Hessah Albanwan, Rongjun Qin
- Abstract要約: 本稿では,数百のマルチサイト衛星ステレオペアによる4つのディープラーニング(DL)ステレオマッチング手法の評価を行う。
実験の結果、E2Eアルゴリズムは幾何精度の上限を達成できるが、見当たらないデータに対してはうまく一般化できないことが示された。
全てのDLアルゴリズムはステレオペアの幾何学的構成に対して堅牢であり、Census-SGMと比較して感度が低い。
- 参考スコア(独自算出の注目度): 1.0152838128195467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep learning (DL) stereo matching methods gained great attention in remote
sensing satellite datasets. However, most of these existing studies conclude
assessments based only on a few/single stereo images lacking a systematic
evaluation on how robust DL methods are on satellite stereo images with varying
radiometric and geometric configurations. This paper provides an evaluation of
four DL stereo matching methods through hundreds of multi-date multi-site
satellite stereo pairs with varying geometric configurations, against the
traditional well-practiced Census-SGM (Semi-global matching), to
comprehensively understand their accuracy, robustness, generalization
capabilities, and their practical potential. The DL methods include a
learning-based cost metric through convolutional neural networks (MC-CNN)
followed by SGM, and three end-to-end (E2E) learning models using Geometry and
Context Network (GCNet), Pyramid Stereo Matching Network (PSMNet), and
LEAStereo. Our experiments show that E2E algorithms can achieve upper limits of
geometric accuracies, while may not generalize well for unseen data. The
learning-based cost metric and Census-SGM are rather robust and can
consistently achieve acceptable results. All DL algorithms are robust to
geometric configurations of stereo pairs and are less sensitive in comparison
to the Census-SGM, while learning-based cost metrics can generalize on
satellite images when trained on different datasets (airborne or ground-view).
- Abstract(参考訳): 深層学習(DL)ステレオマッチング手法はリモートセンシング衛星データセットにおいて大きな注目を集めた。
しかし, これらの研究の多くは, 衛星ステレオ画像にラジオメトリと幾何学的構成が変化する場合, DL法が頑健であることを示す体系的な評価を欠いた, 少数のステレオ画像のみに基づく評価を結論付けている。
本稿では,様々な幾何学的構成の多地点衛星ステレオペアを用いた4種類のdlステレオマッチング手法の評価を行い,その精度,ロバスト性,一般化能力,実用可能性について包括的に理解する。
DL手法には、畳み込みニューラルネットワーク(MC-CNN)による学習ベースのコストメトリックと、Geometry and Context Network(GCNet)、Praamid Stereo Matching Network(PSMNet)、LEAStereoという3つのエンドツーエンド(E2E)学習モデルが含まれている。
実験の結果、E2Eアルゴリズムは幾何精度の上限を達成できるが、見当たらないデータに対してはうまく一般化できないことが示された。
学習ベースのコストメトリックとCensus-SGMは比較的堅牢であり、一貫して許容可能な結果が得られる。
すべてのdlアルゴリズムはステレオペアの幾何学的構成に頑健であり、国勢調査sgmと比較して感度が低いが、学習ベースのコストメトリクスは異なるデータセット(空中または地上ビュー)でトレーニングされた場合、衛星画像に一般化することができる。
関連論文リスト
- Analysis of different disparity estimation techniques on aerial stereo image datasets [0.0]
本研究は,異なる手法を用いて空中画像の立体対応解析を行う。
従来の手法では,異なるコスト関数を用いてStereo SGBMのアーキテクチャを実装した。
標準データセットにおけるほとんどの手法の分析は優れた性能を示しているが、空中データセットの場合、ベンチマークはそれほど多くはない。
論文 参考訳(メタデータ) (2024-10-09T09:33:48Z) - Single-Stage 3D Geometry-Preserving Depth Estimation Model Training on
Dataset Mixtures with Uncalibrated Stereo Data [4.199844472131922]
GP$2$, 汎用および幾何保存型トレーニングスキームを単視点深度推定のために提案する。
GP$2$のトレーニングモデルでは,PCMに依存した手法よりも精度と速度が優れていることを示す。
また、SVDEモデルでは、幾何的完全データがトレーニングセットのマイナーな部分を含む場合でも、幾何学的に正しい深さを予測することができることを示す。
論文 参考訳(メタデータ) (2023-06-05T13:49:24Z) - A Model-data-driven Network Embedding Multidimensional Features for
Tomographic SAR Imaging [5.489791364472879]
多次元特徴量に基づくトモSARイメージングを実現するためのモデルデータ駆動型ネットワークを提案する。
画像シーンの多次元的特徴を効果的に向上するために、2つの2次元処理モジュール(畳み込みエンコーダ-デコーダ構造)を追加します。
従来のCS-based FISTA法とDL-based gamma-Net法と比較して,提案手法は良好な画像精度を有しつつ,完全性を向上させる。
論文 参考訳(メタデータ) (2022-11-28T02:01:43Z) - Fine-tuning deep learning models for stereo matching using results from
semi-global matching [1.0152838128195467]
ディープラーニング (DL) 法は, 高い精度が報告されているステレオ画像マッチングタスクに対して広く研究されている。
衛星画像は、場所、内容、土地被覆、空間パターンにばらつきのある大規模領域をカバーしており、その性能に影響を及ぼすことを期待している。
本研究では,対象ステレオデータ上でのSGM(Census-based semi-global-matching)から得られる不均一性マップを利用した微調整手法を提案する。
論文 参考訳(メタデータ) (2022-05-27T15:38:10Z) - Neural Radiance Fields Approach to Deep Multi-View Photometric Stereo [103.08512487830669]
多視点測光ステレオ問題(MVPS)に対する現代的な解法を提案する。
我々は、光度ステレオ(PS)画像形成モデルを用いて表面配向を取得し、それを多視点のニューラルラディアンス場表現とブレンドして物体の表面形状を復元する。
本手法は,多視点画像のニューラルレンダリングを行い,深部光度ステレオネットワークによって推定される表面の正規性を活用している。
論文 参考訳(メタデータ) (2021-10-11T20:20:03Z) - Towards Interpretable Deep Metric Learning with Structural Matching [86.16700459215383]
より透過的な埋め込み学習のための深層解釈可能なメトリック学習(DIML)法を提案する。
本手法は,既製のバックボーンネットワークやメトリック学習手法に適用可能な,モデルに依存しない手法である。
我々は,CUB200-2011,Cars196,Stanford Online Productsの3つの大規模メトリクス学習ベンチマークで評価を行った。
論文 参考訳(メタデータ) (2021-08-12T17:59:09Z) - ResDepth: A Deep Prior For 3D Reconstruction From High-resolution
Satellite Images [28.975837416508142]
ResDepthは畳み込みニューラルネットワークで、例データからそのような表現幾何学を学習する。
一連の実験において,提案手法はステレオDSMを定量的かつ定性的に一貫的に改善することがわかった。
ネットワーク重みに符号化された先行符号化は、都市デザインの意義ある幾何学的特徴を捉えていることを示す。
論文 参考訳(メタデータ) (2021-06-15T12:51:28Z) - Multi-view Depth Estimation using Epipolar Spatio-Temporal Networks [87.50632573601283]
一つのビデオから多視点深度を推定する新しい手法を提案する。
提案手法は,新しいEpipolar Spatio-Temporal Transformer(EST)を用いて時間的コヒーレントな深度推定を行う。
最近のMixture-of-Expertsモデルにインスパイアされた計算コストを削減するため、我々はコンパクトなハイブリッドネットワークを設計する。
論文 参考訳(メタデータ) (2020-11-26T04:04:21Z) - Improving Deep Stereo Network Generalization with Geometric Priors [93.09496073476275]
地上の真実が密集した多様な現実世界のシーンの大規模なデータセットを得ることは困難である。
多くのアルゴリズムは、似たようなシーンや合成データセットの小さな実世界のデータセットに依存している。
本稿では,シーン幾何学の事前知識をエンド・ツー・エンドのステレオネットワークに統合し,ネットワークの一般化を支援することを提案する。
論文 参考訳(メタデータ) (2020-08-25T15:24:02Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z) - MetricUNet: Synergistic Image- and Voxel-Level Learning for Precise CT
Prostate Segmentation via Online Sampling [66.01558025094333]
本稿では,前立腺領域を高速に局在させる第1段階と,前立腺領域を正確に区分する第2段階の2段階のフレームワークを提案する。
マルチタスクネットワークにおけるボクセルワイドサンプリングによる新しいオンラインメトリック学習モジュールを提案する。
本手法は,従来のクロスエントロピー学習法やDice損失学習法と比較して,より代表的なボクセルレベルの特徴を効果的に学習することができる。
論文 参考訳(メタデータ) (2020-05-15T10:37:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。