論文の概要: Unsupervised Stereo Matching Network For VHR Remote Sensing Images Based On Error Prediction
- arxiv url: http://arxiv.org/abs/2408.07419v1
- Date: Wed, 14 Aug 2024 09:59:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-15 13:54:15.287746
- Title: Unsupervised Stereo Matching Network For VHR Remote Sensing Images Based On Error Prediction
- Title(参考訳): 誤差予測に基づくVHRリモートセンシング画像のための教師なしステレオマッチングネットワーク
- Authors: Liting Jiang, Yuming Xiang, Feng Wang, Hongjian You,
- Abstract要約: VHRリモートセンシング画像のための新しい教師なしステレオマッチングネットワークを提案する。
予測誤差で信頼性をブリッジする軽量モジュールを導入し、コアモデルを洗練する。
US3DおよびWHU-Stereoデータセットの実験結果は、提案したネットワークが他の教師なしネットワークと比較して精度が高いことを示す。
- 参考スコア(独自算出の注目度): 5.68487023151187
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stereo matching in remote sensing has recently garnered increased attention, primarily focusing on supervised learning. However, datasets with ground truth generated by expensive airbone Lidar exhibit limited quantity and diversity, constraining the effectiveness of supervised networks. In contrast, unsupervised learning methods can leverage the increasing availability of very-high-resolution (VHR) remote sensing images, offering considerable potential in the realm of stereo matching. Motivated by this intuition, we propose a novel unsupervised stereo matching network for VHR remote sensing images. A light-weight module to bridge confidence with predicted error is introduced to refine the core model. Robust unsupervised losses are formulated to enhance network convergence. The experimental results on US3D and WHU-Stereo datasets demonstrate that the proposed network achieves superior accuracy compared to other unsupervised networks and exhibits better generalization capabilities than supervised models. Our code will be available at https://github.com/Elenairene/CBEM.
- Abstract(参考訳): リモートセンシングにおけるステレオマッチングは、主に教師付き学習に焦点をあてて、近年注目を集めている。
しかし、高価なリダルによって生成された地上の真実を持つデータセットは、限られた量と多様性を示し、教師付きネットワークの有効性を制限している。
対照的に、教師なし学習手法は、超高解像度(VHR)リモートセンシング画像の高可用性を生かし、ステレオマッチングの領域でかなりの可能性を秘めている。
そこで本研究では,VHRリモートセンシング画像のための非教師なしステレオマッチングネットワークを提案する。
予測誤差で信頼性をブリッジする軽量モジュールを導入し、コアモデルを洗練する。
ネットワーク収束を高めるために、ロバストな教師なし損失が定式化される。
US3DおよびWHU-Stereoデータセットの実験結果から,提案したネットワークは他の教師なしネットワークと比較して精度が高く,教師付きモデルよりも優れた一般化能力を示すことが示された。
私たちのコードはhttps://github.com/Elenairene/CBEM.comで公開されます。
関連論文リスト
- RS-YOLOX: A High Precision Detector for Object Detection in Satellite Remote Sensing Images [20.582343125606403]
本稿では,衛星リモートセンシング画像の自動検出のための改良型YOLOXモデルを提案する。
ネットワークの機能学習能力を高めるために,YOLOXのバックボーンネットワークにおいて,効率的なチャネル注意(ECA)を用いた。
トレーニングにおける正と負のサンプル数のバランスをとるために,Varifocal Loss関数を用いた。
Slicing Aided Hyper Inferenceと呼ばれるオープンソースのフレームワークを用いて,高速なリモートセンシングオブジェクト検出器を実現する。
論文 参考訳(メタデータ) (2025-02-05T03:05:33Z) - Strip R-CNN: Large Strip Convolution for Remote Sensing Object Detection [74.01846006894635]
本稿では,リモートセンシングオブジェクト検出において,大きなストリップ畳み込みが優れた特徴表現学習者であることを示す。
我々はStrip R-CNNと呼ばれる,シンプルで効率的でパワフルなネットワークアーキテクチャを構築した。
論文 参考訳(メタデータ) (2025-01-07T13:30:54Z) - Rethinking the Key Factors for the Generalization of Remote Sensing Stereo Matching Networks [15.456986824737067]
ステレオマッチングタスクは高価な空中LiDARデータに依存している。
本稿では,3つの視点から重要なトレーニング要因について検討する。
一般化性能のよい教師なしステレオマッチングネットワークを提案する。
論文 参考訳(メタデータ) (2024-08-14T15:26:10Z) - Left-right Discrepancy for Adversarial Attack on Stereo Networks [8.420135490466851]
本稿では,左画像特徴と右画像特徴との差を最大化するために,摂動雑音を発生させる新しい対向攻撃手法を提案する。
実験により,ステレオニューラルネットワークにおいて予測誤差を増大させる手法の優れた性能を示す。
論文 参考訳(メタデータ) (2024-01-14T02:30:38Z) - Evaluating the Label Efficiency of Contrastive Self-Supervised Learning
for Multi-Resolution Satellite Imagery [0.0]
遠隔センシング領域における自己教師付き学習は、容易に利用可能なラベル付きデータを活用するために応用されている。
本稿では,ラベル効率のレンズを用いた自己教師型視覚表現学習について検討する。
論文 参考訳(メタデータ) (2022-10-13T06:54:13Z) - Self-supervised Audiovisual Representation Learning for Remote Sensing Data [96.23611272637943]
遠隔センシングにおける深層ニューラルネットワークの事前学習のための自己教師型アプローチを提案する。
ジオタグ付きオーディオ記録とリモートセンシングの対応を利用して、これは完全にラベルなしの方法で行われる。
提案手法は,既存のリモートセンシング画像の事前学習方法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-08-02T07:50:50Z) - Stereo Matching by Self-supervision of Multiscopic Vision [65.38359887232025]
カメラ位置の整列で撮影した複数の画像を利用したステレオマッチングのための新しい自己監視フレームワークを提案する。
ネットワークを最適化するために、クロスフォトメトリックロス、不確実性を認識した相互監督損失、および新しい平滑性損失が導入されます。
我々のモデルは、KITTIデータセット上の以前の教師なし手法よりも、より良い不均一性マップを得る。
論文 参考訳(メタデータ) (2021-04-09T02:58:59Z) - Self-supervised Learning of Depth Inference for Multi-view Stereo [36.320984882009775]
マルチビューステレオネットワークのための自己監視型学習フレームワークを提案する。
まず、教師なし学習フレームワークの下で、深度マップを初期擬似ラベルとして見積もることから始める。
我々は注意深く設計されたパイプラインを用いて初期擬似ラベルを洗練する。
論文 参考訳(メタデータ) (2021-04-07T07:45:02Z) - Auto-Rectify Network for Unsupervised Indoor Depth Estimation [119.82412041164372]
ハンドヘルド環境に現れる複雑な自我運動が,学習深度にとって重要な障害であることが確認された。
本稿では,相対回転を除去してトレーニング画像の修正を効果的に行うデータ前処理手法を提案する。
その結果、従来の教師なしSOTA法よりも、難易度の高いNYUv2データセットよりも優れていた。
論文 参考訳(メタデータ) (2020-06-04T08:59:17Z) - A Compressive Sensing Approach for Federated Learning over Massive MIMO
Communication Systems [82.2513703281725]
フェデレートラーニング(Federated Learning)は、無線デバイスとのコラボレーションによって、中央サーバでグローバルモデルをトレーニングするための、プライバシ保護のアプローチである。
本稿では,大規模マルチインプット多出力通信システム上でのフェデレーション学習のための圧縮センシング手法を提案する。
論文 参考訳(メタデータ) (2020-03-18T05:56:27Z) - Firearm Detection and Segmentation Using an Ensemble of Semantic Neural
Networks [62.997667081978825]
本稿では,意味的畳み込みニューラルネットワークのアンサンブルに基づく兵器検出システムを提案する。
特定のタスクに特化した単純なニューラルネットワークのセットは、計算リソースを少なくし、並列にトレーニングすることができる。
個々のネットワークの出力の集約によって与えられるシステムの全体的な出力は、ユーザが偽陽性と偽陰性とをトレードオフするように調整することができる。
論文 参考訳(メタデータ) (2020-02-11T13:58:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。