論文の概要: SSL4SAR: Self-Supervised Learning for Glacier Calving Front Extraction from SAR Imagery
- arxiv url: http://arxiv.org/abs/2507.01747v1
- Date: Wed, 02 Jul 2025 14:24:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-03 14:23:00.286204
- Title: SSL4SAR: Self-Supervised Learning for Glacier Calving Front Extraction from SAR Imagery
- Title(参考訳): SSL4SAR: SAR画像からの氷河養生フロント抽出のための自己教師付き学習
- Authors: Nora Gourmelon, Marcel Dreier, Martin Mayr, Thorsten Seehaus, Dakota Pyles, Matthias Braun, Andreas Maier, Vincent Christlein,
- Abstract要約: 氷河は前例のないペースで氷塊を失い、正確な年間モニタリングの必要性が高まっている。
深層学習モデルでは、海氷や湖氷の氷河で季節的な氷の損失を追跡するために、氷の先端位置を抽出することができる。
本稿では,Swin Transformerエンコーダと残差畳み込みニューラルネットワーク(CNN)デコーダを組み合わせた新しいハイブリッドモデルアーキテクチャを提案する。
- 参考スコア(独自算出の注目度): 5.385992181979485
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Glaciers are losing ice mass at unprecedented rates, increasing the need for accurate, year-round monitoring to understand frontal ablation, particularly the factors driving the calving process. Deep learning models can extract calving front positions from Synthetic Aperture Radar imagery to track seasonal ice losses at the calving fronts of marine- and lake-terminating glaciers. The current state-of-the-art model relies on ImageNet-pretrained weights. However, they are suboptimal due to the domain shift between the natural images in ImageNet and the specialized characteristics of remote sensing imagery, in particular for Synthetic Aperture Radar imagery. To address this challenge, we propose two novel self-supervised multimodal pretraining techniques that leverage SSL4SAR, a new unlabeled dataset comprising 9,563 Sentinel-1 and 14 Sentinel-2 images of Arctic glaciers, with one optical image per glacier in the dataset. Additionally, we introduce a novel hybrid model architecture that combines a Swin Transformer encoder with a residual Convolutional Neural Network (CNN) decoder. When pretrained on SSL4SAR, this model achieves a mean distance error of 293 m on the "CAlving Fronts and where to Find thEm" (CaFFe) benchmark dataset, outperforming the prior best model by 67 m. Evaluating an ensemble of the proposed model on a multi-annotator study of the benchmark dataset reveals a mean distance error of 75 m, approaching the human performance of 38 m. This advancement enables precise monitoring of seasonal changes in glacier calving fronts.
- Abstract(参考訳): 氷河は前例のない速度で氷塊を失い、前頭骨のアブレーションを理解するための正確な年中モニタリングの必要性が増している。
深層学習モデルはシンセティック・アパーチャー・レーダーの画像から、海面や湖面の氷河のボーリングフロントにおける季節的な氷の損失を追跡することができる。
現在の最先端モデルは、ImageNetで予め制限された重みに依存している。
しかし、画像ネットの自然画像とリモートセンシング画像の特徴、特に合成開口レーダ画像とのドメインシフトにより、これらは準最適である。
この課題に対処するために,北極氷河の9,563Sentinel-1と14Sentinel-2の画像からなる新たなラベル付きデータセットであるSSL4SARを利用する,新たな2つの自己監督型マルチモーダル事前訓練手法を提案する。
さらに,Swin Transformerエンコーダと残差畳み込みニューラルネットワーク(CNN)デコーダを組み合わせた新しいハイブリッドモデルアーキテクチャを提案する。
SSL4SARで事前トレーニングされた場合、このモデルは"Calving Fronts and to Find thEm"(CaFFe)ベンチマークデータセットの平均距離誤差を293m達成し、以前の最高のモデルよりも67m向上した。
ベンチマークデータセットのマルチアノテータを用いて提案モデルのアンサンブルを評価すると,平均距離誤差が75mとなり,人体性能が38mに近づいた。
この進歩により、氷河の開削前線における季節変化の正確なモニタリングが可能になる。
関連論文リスト
- Comparison Study: Glacier Calving Front Delineation in Synthetic Aperture Radar Images With Deep Learning [11.298727820998566]
本研究は、共通の計算フロントベンチマークデータセット上でのディープラーニングシステムの初回比較を示す。
最高のDLモデルの出力は平均で221m、人間のアノテータの平均偏差は38mである。
この大きな違いは、現在のDLシステムは、まだ人間のパフォーマンスに合わないことを示し、氷河カルビングフロントの完全な自動監視を可能にするためには、さらなる研究が必要であることを示している。
論文 参考訳(メタデータ) (2025-01-09T14:43:36Z) - Improving Satellite Imagery Masking using Multi-task and Transfer Learning [13.987883100675438]
マスキングの速度/精度の異なるトレードオフを提供するモデル群を提示する。
従来の水画素識別法と比較して,F1スコアは9%向上した。
論文 参考訳(メタデータ) (2024-12-11T17:00:51Z) - LightAvatar: Efficient Head Avatar as Dynamic Neural Light Field [58.93692943064746]
ニューラル光場(NeLF)に基づく最初の頭部アバターモデルであるLightAvatarを紹介する。
LightAvatarは3DMMパラメータから画像をレンダリングし、メッシュやボリュームレンダリングを使わずに、単一のネットワークフォワードパスを介してカメラがポーズする。
論文 参考訳(メタデータ) (2024-09-26T17:00:02Z) - An Experimental Study on Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training [51.622652121580394]
Masked Image Modeling (MIM) Pre-training for Large-scale Vision Transformer (ViTs) は、学習した自己教師型ViT機能に加えて、下流での有望なパフォーマンスを実現する。
本稿では,テキストテキストレメリーで軽量なViTの微調整性能が,この事前学習パラダイムの恩恵を受けるかどうかを問う。
バニラ/階層設計(5.7M$/6.5M$)による純軽量ViTの蒸留による事前トレーニングは、ImageNet-1で79.4%$/78.9%の精度で達成できる。
論文 参考訳(メタデータ) (2024-04-18T14:14:44Z) - ScatterNeRF: Seeing Through Fog with Physically-Based Inverse Neural
Rendering [83.75284107397003]
本稿では,シーンをレンダリングし,霧のない背景を分解するニューラルネットワークレンダリング手法であるScatterNeRFを紹介する。
本研究では,散乱量とシーンオブジェクトの非絡み合い表現を提案し,物理に着想を得た損失を伴ってシーン再構成を学習する。
マルチビューIn-the-Wildデータをキャプチャして,大規模な霧室内でのキャプチャを制御し,本手法の有効性を検証した。
論文 参考訳(メタデータ) (2023-05-03T13:24:06Z) - AMD-HookNet for Glacier Front Segmentation [17.60067480799222]
氷河の開削前位置の変化に関する知識は 氷河の状態を評価する上で重要です
深層学習に基づく手法は、光学衛星画像やレーダー衛星画像から氷河の前部線を削る大きな可能性を示している。
本研究では,新しい氷河養生フロントセグメンテーションフレームワークであるAttention-Multi-hooking-Deep-supervision HookNetを提案する。
論文 参考訳(メタデータ) (2023-02-06T12:39:40Z) - Unsupervised Restoration of Weather-affected Images using Deep Gaussian
Process-based CycleGAN [92.15895515035795]
本稿では,CycleGANに基づくディープネットワークの監視手法について述べる。
我々は,より効果的なトレーニングにつながるCycleGANのトレーニングに新たな損失を導入し,高品質な再構築を実現した。
提案手法は, 脱落, 脱落, 脱落といった様々な修復作業に効果的に適用できることを実証する。
論文 参考訳(メタデータ) (2022-04-23T01:30:47Z) - Core Risk Minimization using Salient ImageNet [53.616101711801484]
私たちは、1000のImagenetクラスのコアとスプリアス機能をローカライズする100万人以上のソフトマスクを備えたSalient Imagenetデータセットを紹介します。
このデータセットを用いて、まず、いくつかのImagenet事前訓練されたモデル(総計42件)の素早い特徴に対する依存度を評価する。
次に、コアリスク最小化(CoRM)と呼ばれる新しい学習パラダイムを導入する。
論文 参考訳(メタデータ) (2022-03-28T01:53:34Z) - Bayesian U-Net for Segmenting Glaciers in SAR Imagery [7.960675807187592]
不確実性を計算し,新しい二段階プロセスとして不確実性最適化手法として用いることを提案する。
ネットワークへの不確実性マップの供給は95.24%のdice類似性をもたらす。
これは、最先端の決定論的U-Netベースの氷河セグメンテーションパイプラインと比較して、全体的なセグメンテーション性能の改善である。
論文 参考訳(メタデータ) (2021-01-08T23:17:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。