論文の概要: Deep Learning-based Bathymetry Retrieval without In-situ Depths using Remote Sensing Imagery and SfM-MVS DSMs with Data Gaps
- arxiv url: http://arxiv.org/abs/2504.11416v1
- Date: Tue, 15 Apr 2025 17:31:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-16 22:06:41.072561
- Title: Deep Learning-based Bathymetry Retrieval without In-situ Depths using Remote Sensing Imagery and SfM-MVS DSMs with Data Gaps
- Title(参考訳): リモートセンシング画像とデータギャップ付きSfM-MVS DSMを用いた深層学習に基づく位置推定
- Authors: Panagiotis Agrafiotis, Begüm Demir,
- Abstract要約: 本研究では,SfM-MVS法の高忠実度3次元再構成機能と最先端屈折補正技術を組み合わせた手法を提案する。
この統合により、SfM-MVSから派生したデータギャップを持つDSMをトレーニングデータとして使用して完全なバスメトリックマップを生成する、シナジスティックなアプローチが可能になる。
本稿では,U-Net と Swin Transformer の自己アテンション層と相互アテンション機構を組み合わせた Swin-BathyUNet を提案する。
- 参考スコア(独自算出の注目度): 3.063197102484114
- License:
- Abstract: Accurate, detailed, and high-frequent bathymetry is crucial for shallow seabed areas facing intense climatological and anthropogenic pressures. Current methods utilizing airborne or satellite optical imagery to derive bathymetry primarily rely on either SfM-MVS with refraction correction or Spectrally Derived Bathymetry (SDB). However, SDB methods often require extensive manual fieldwork or costly reference data, while SfM-MVS approaches face challenges even after refraction correction. These include depth data gaps and noise in environments with homogeneous visual textures, which hinder the creation of accurate and complete Digital Surface Models (DSMs) of the seabed. To address these challenges, this work introduces a methodology that combines the high-fidelity 3D reconstruction capabilities of the SfM-MVS methods with state-of-the-art refraction correction techniques, along with the spectral analysis capabilities of a new deep learning-based method for bathymetry prediction. This integration enables a synergistic approach where SfM-MVS derived DSMs with data gaps are used as training data to generate complete bathymetric maps. In this context, we propose Swin-BathyUNet that combines U-Net with Swin Transformer self-attention layers and a cross-attention mechanism, specifically tailored for SDB. Swin-BathyUNet is designed to improve bathymetric accuracy by capturing long-range spatial relationships and can also function as a standalone solution for standard SDB with various training depth data, independent of the SfM-MVS output. Experimental results in two completely different test sites in the Mediterranean and Baltic Seas demonstrate the effectiveness of the proposed approach through extensive experiments that demonstrate improvements in bathymetric accuracy, detail, coverage, and noise reduction in the predicted DSM. The code is available at https://github.com/pagraf/Swin-BathyUNet.
- Abstract(参考訳): 正確な、詳細な、そして頻繁な水位測定は、高度の気候と人為的な圧力に直面する浅海底地域では不可欠である。
現在、空中または衛星の光学画像を利用して、主に屈折補正のSfM-MVSまたは分光導波バスメトリー(SDB)に頼っている。
しかし, SfM-MVSは屈折補正後の課題に対処するのに対し, SDB法は手作業や高価な参照データを必要とすることが多い。
深度データギャップや均質な視覚的テクスチャを持つ環境のノイズは、海底の正確で完全なデジタル表面モデル(DSM)の作成を妨げる。
これらの課題に対処するために,SfM-MVS法の高忠実度3次元再構成機能と最先端屈折補正技術を組み合わせた手法を導入するとともに,新しい深層学習に基づく水量測定予測手法のスペクトル解析機能を導入する。
この統合により、SfM-MVSから派生したデータギャップを持つDSMをトレーニングデータとして使用して完全なバスメトリックマップを生成する、シナジスティックなアプローチが可能になる。
本稿では,U-Net と Swin Transformer の自己アテンション層を組み合わせた Swin-BathyUNet と,SDB に適したクロスアテンション機構を提案する。
Swin-BathyUNetは、長距離空間関係をキャプチャすることで、水量測定精度を向上させるように設計されており、SfM-MVS出力とは独立に、様々なトレーニング深度データを持つ標準SDBのスタンドアロンソリューションとしても機能する。
地中海とバルト海の2つの全く異なる試験場における実験結果は、予測されたDSMの精度、詳細、カバレッジ、騒音低減の改善を実証する広範囲な実験を通じて、提案手法の有効性を実証している。
コードはhttps://github.com/pagraf/Swin-BathyUNetで公開されている。
関連論文リスト
- Dfilled: Repurposing Edge-Enhancing Diffusion for Guided DSM Void Filling [2.3020018305241337]
デジタル表面モデル(DSM)は、地理空間解析において地球の地形を正確に表現するために不可欠である。
DSMは、都市計画、植生研究、そして3D再構築などの応用に欠かせない自然と人工の特徴の詳細な高度を捉えている。
これまでの研究は、主にデジタル標高モデル(DEM)とデジタル地形モデル(DTM)の空隙充填に焦点を当ててきた。
エッジエンハンス拡散による光リモートセンシング画像を利用する誘導DSM空隙充填法であるDfilledを紹介する。
論文 参考訳(メタデータ) (2025-01-26T08:03:02Z) - PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [76.95536611263356]
PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文 参考訳(メタデータ) (2024-12-17T09:59:53Z) - TanDepth: Leveraging Global DEMs for Metric Monocular Depth Estimation in UAVs [5.6168844664788855]
本研究は,推定時間における相対的推定から距離深度を求めるための実用的スケール回復手法であるTanDepthを提示する。
提案手法は,GDEM(Global Digital Elevation Models)のスパース計測をカメラビューに投影することで活用する。
推定深度マップから接地点を選択して、投影された基準点と相関するクラスフィルタシミュレーションへの適応を示す。
論文 参考訳(メタデータ) (2024-09-08T15:54:43Z) - Multi-Source and Test-Time Domain Adaptation on Multivariate Signals using Spatio-Temporal Monge Alignment [59.75420353684495]
コンピュータビジョンやバイオメディカルデータなどの信号に対する機械学習の応用は、ハードウェアデバイスやセッション記録にまたがる変動のため、しばしば課題に直面している。
本研究では,これらの変動を緩和するために,時空間モンジュアライメント(STMA)を提案する。
我々はSTMAが、非常に異なる設定で取得したデータセット間で、顕著で一貫したパフォーマンス向上をもたらすことを示す。
論文 参考訳(メタデータ) (2024-07-19T13:33:38Z) - Convolutional Monge Mapping Normalization for learning on sleep data [63.22081662149488]
我々は、CMMN(Convolutional Monge Mapping Normalization)と呼ばれる新しい手法を提案する。
CMMNは、そのパワースペクトル密度(PSD)をトレーニングデータに基づいて推定されるワッサーシュタインバリセンタに適応させるために、信号をフィルタリングする。
睡眠脳波データに関する数値実験により、CMMNはニューラルネットワークアーキテクチャから独立して、顕著で一貫したパフォーマンス向上をもたらすことが示された。
論文 参考訳(メタデータ) (2023-05-30T08:24:01Z) - DDS2M: Self-Supervised Denoising Diffusion Spatio-Spectral Model for
Hyperspectral Image Restoration [103.79030498369319]
ハイパースペクトル画像復元のための自己教師付き拡散モデルを提案する。
textttDDS2Mは、既存の拡散法と比較して、より強力な一般化能力を持っている。
HSIのノイズ除去、ノイズ除去、様々なHSIの超解像実験は、既存のタスク固有状態よりもtextttDDS2Mの方が優れていることを示した。
論文 参考訳(メタデータ) (2023-03-12T14:57:04Z) - DS-MVSNet: Unsupervised Multi-view Stereo via Depth Synthesis [11.346448410152844]
本稿では,DS-MVSNetを提案する。DS-MVSNetは,ソース深度合成を備えたエンドツーエンドの教師なしMVS構造である。
確率体積の情報をマイニングするために、確率体積と深度仮説をソースビューにスプラッターすることで、ソース深度を創造的に合成する。
一方,ソース深度を利用して参照画像を描画し,奥行きの整合性損失と深さの滑らかさ損失を提案する。
論文 参考訳(メタデータ) (2022-08-13T15:25:51Z) - Calibrated Hyperspectral Image Reconstruction via Graph-based
Self-Tuning Network [40.71031760929464]
ハイパースペクトルイメージング(HSI)は、特に符号化スナップショット分光イメージング(CASSI)システムに基づく画像に対して、研究の注目を集めている。
既存の深いHSI再構成モデルは、CASSIの特定の光学ハードウェアマスクが与える2次元圧縮計測に基づいて元の信号を取得するために、ペアデータで訓練される。
このマスク固有のトレーニングスタイルは、ハードウェアの誤校正問題を引き起こし、異なるハードウェアとノイズの多い環境間で深いHSIモデルをデプロイする障壁を設定できる。
マスクの空間構造の変化に適応する不確実性を推論するグラフベース自己調整(GST)ネットワークを提案する。
論文 参考訳(メタデータ) (2021-12-31T09:39:13Z) - Statistical control for spatio-temporal MEG/EEG source imaging with
desparsified multi-task Lasso [102.84915019938413]
脳磁図(MEG)や脳電図(EEG)のような非侵襲的手法は、非侵襲的手法を約束する。
ソースローカライゼーション(ソースイメージング)の問題は、しかしながら、高次元の統計的推測問題を引き起こす。
この問題に対処するために,分離されたマルチタスクラッソ(ecd-MTLasso)のアンサンブルを提案する。
論文 参考訳(メタデータ) (2020-09-29T21:17:16Z) - Uncertain-DeepSSM: From Images to Probabilistic Shape Models [0.0]
DeepSSMは、非セグメント画像から直接統計的形状表現を抽出するエンドツーエンドのディープラーニングアプローチである。
DeepSSMは、視覚的に正確には仮定できないような、不確実な形状の推定を生成する。
本研究では,ネットワークを適応させて固有入力分散を予測することにより,データ依存型アレータティック不確実性の両方を定量化する統一モデルとして,Uncertain-DeepSSMを提案する。
論文 参考訳(メタデータ) (2020-07-13T17:18:21Z) - Learnable Bernoulli Dropout for Bayesian Deep Learning [53.79615543862426]
Learnable Bernoulli Dropout (LBD) は、他のモデルパラメータと共に最適化されたパラメータとしてドロップアウト率を考慮する新しいモデルに依存しないドロップアウトスキームである。
LBDは画像分類とセマンティックセグメンテーションにおける精度と不確実性の推定を改善する。
論文 参考訳(メタデータ) (2020-02-12T18:57:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。