論文の概要: AMD-HookNet++: Evolution of AMD-HookNet with Hybrid CNN-Transformer Feature Enhancement for Glacier Calving Front Segmentation
- arxiv url: http://arxiv.org/abs/2512.14639v1
- Date: Tue, 16 Dec 2025 17:57:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-17 16:49:26.820958
- Title: AMD-HookNet++: Evolution of AMD-HookNet with Hybrid CNN-Transformer Feature Enhancement for Glacier Calving Front Segmentation
- Title(参考訳): AMD-HookNet++:AMD-HookNetの進化とCNN変換器のハイブリッド化
- Authors: Fei Wu, Marcel Dreier, Nora Gourmelon, Sebastian Wind, Jianlin Zhang, Thorsten Seehaus, Matthias Braun, Andreas Maier, Vincent Christlein,
- Abstract要約: AMD-HookNetは、氷河セグメンテーションのための純粋な2分岐畳み込みニューラルネットワーク(CNN)を導入した。
氷河セグメンテーションのための新しいハイブリッドCNN変換器機能拡張手法であるAMD-HookNet++を提案する。
AMD-HookNet++は, 競争力367mを維持しながら, 78.2のIoUと1,318mのHD95で, 新たな技術状態を設定する。
- 参考スコア(独自算出の注目度): 12.638003974433554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The dynamics of glaciers and ice shelf fronts significantly impact the mass balance of ice sheets and coastal sea levels. To effectively monitor glacier conditions, it is crucial to consistently estimate positional shifts of glacier calving fronts. AMD-HookNet firstly introduces a pure two-branch convolutional neural network (CNN) for glacier segmentation. Yet, the local nature and translational invariance of convolution operations, while beneficial for capturing low-level details, restricts the model ability to maintain long-range dependencies. In this study, we propose AMD-HookNet++, a novel advanced hybrid CNN-Transformer feature enhancement method for segmenting glaciers and delineating calving fronts in synthetic aperture radar images. Our hybrid structure consists of two branches: a Transformer-based context branch to capture long-range dependencies, which provides global contextual information in a larger view, and a CNN-based target branch to preserve local details. To strengthen the representation of the connected hybrid features, we devise an enhanced spatial-channel attention module to foster interactions between the hybrid CNN-Transformer branches through dynamically adjusting the token relationships from both spatial and channel perspectives. Additionally, we develop a pixel-to-pixel contrastive deep supervision to optimize our hybrid model by integrating pixelwise metric learning into glacier segmentation. Through extensive experiments and comprehensive quantitative and qualitative analyses on the challenging glacier segmentation benchmark dataset CaFFe, we show that AMD-HookNet++ sets a new state of the art with an IoU of 78.2 and a HD95 of 1,318 m, while maintaining a competitive MDE of 367 m. More importantly, our hybrid model produces smoother delineations of calving fronts, resolving the issue of jagged edges typically seen in pure Transformer-based approaches.
- Abstract(参考訳): 氷河フロントと氷棚フロントのダイナミクスは、氷床の質量収支と海岸海水準に大きな影響を及ぼす。
氷河条件を効果的に監視するためには,氷河養生前線の位置変化を常に推定することが重要である。
AMD-HookNetは、氷河セグメンテーションのための純粋な2分岐畳み込みニューラルネットワーク(CNN)を導入した。
しかし、畳み込み操作の局所的な性質と変換的不変性は、低レベルの詳細をキャプチャするのに有益であるが、モデルが長距離依存を維持する能力を制限する。
本研究では,AMD-HookNet++を提案する。AMD-HookNet++は,合成開口レーダ画像における氷河のセグメンテーションと石灰化フロントのデライン化のための,新しいハイブリッドCNN-Transformer機能拡張手法である。
我々のハイブリッド構造は2つのブランチから構成される:Transformerベースのコンテキストブランチは、より広いビューでグローバルなコンテキスト情報を提供する長距離依存関係をキャプチャし、CNNベースのターゲットブランチは局所的な詳細を保存する。
そこで我々は,CNN-Transformer 分岐間の相互作用を,空間的・チャネル的両面からトークン関係を動的に調整することにより促進する空間チャネルアテンションモジュールを考案した。
さらに,氷河セグメンテーションに画素単位のメートル法学習を組み込むことで,ハイブリッドモデルを最適化するための画素間コントラストの深い監視法を開発した。
AMD-HookNet++は、大規模な実験と、挑戦的な氷河セグメンテーションのベンチマークデータセットであるCaFFeの定量的および定性的な分析を通じて、競争力367mのMDEを維持しながら、78.2のIoUと1,318mのHD95で新しい最先端を設定できることを示した。
さらに重要なことは、我々のハイブリッドモデルは、純粋なTransformerベースのアプローチで一般的に見られるジャッジエッジの問題を解消し、よりスムーズな計算フロントの行列を生成することである。
関連論文リスト
- KAN-GCN: Combining Kolmogorov-Arnold Network with Graph Convolution Network for an Accurate Ice Sheet Emulator [1.433758865948252]
氷床モデルのための高速かつ正確なエミュレータであるkan-GCNを紹介する。
Kan-GCNは、グラフ畳み込みネットワーク(GCN)の前に、KAN(Kolmogorov-Arnold Network)を機能的キャリブレータとして配置する。
論文 参考訳(メタデータ) (2025-10-28T19:55:29Z) - SSL4SAR: Self-Supervised Learning for Glacier Calving Front Extraction from SAR Imagery [5.385992181979485]
氷河は前例のないペースで氷塊を失い、正確な年間モニタリングの必要性が高まっている。
深層学習モデルでは、海氷や湖氷の氷河で季節的な氷の損失を追跡するために、氷の先端位置を抽出することができる。
本稿では,Swin Transformerエンコーダと残差畳み込みニューラルネットワーク(CNN)デコーダを組み合わせた新しいハイブリッドモデルアーキテクチャを提案する。
論文 参考訳(メタデータ) (2025-07-02T14:24:23Z) - VRS-UIE: Value-Driven Reordering Scanning for Underwater Image Enhancement [104.78586859995333]
状態空間モデル(SSM)は、線形複雑性と大域的受容場のために、視覚タスクの有望なバックボーンとして登場した。
大型で均質だが無意味な海洋背景の優位性は、希少で価値ある標的の特徴表現応答を希薄にすることができる。
水中画像強調(UIE)のための新しい値駆動リダクションスキャンフレームワークを提案する。
本フレームワークは, 水バイアスを効果的に抑制し, 構造や色彩の忠実さを保ち, 優れた向上性能(WMambaを平均0.89dB超える)を実現する。
論文 参考訳(メタデータ) (2025-05-02T12:21:44Z) - STEAM: Squeeze and Transform Enhanced Attention Module [1.3370933421481221]
本稿では,マルチヘッドグラフ変換器の概念を利用して,チャネルと空間の注意の両方をモデル化するグラフベースの手法を提案する。
STEAMは標準のResNet-50モデルよりも2%精度が向上し、GFLOPはわずかに増加した。
STEAMは、GFLOPの3倍の削減を達成しつつ、リードモジュールECAとGCTの精度で性能を向上する。
論文 参考訳(メタデータ) (2024-12-12T07:38:10Z) - A Hybrid Transformer-Mamba Network for Single Image Deraining [70.64069487982916]
既存のデラリング変換器では、固定レンジウィンドウやチャネル次元に沿って自己アテンション機構を採用している。
本稿では,多分岐型トランスフォーマー・マンバネットワーク(Transformer-Mamba Network,TransMamba Network,Transformer-Mamba Network)を提案する。
論文 参考訳(メタデータ) (2024-08-31T10:03:19Z) - Hybrid Convolutional and Attention Network for Hyperspectral Image Denoising [54.110544509099526]
ハイパースペクトル画像(HSI)は、ハイパースペクトルデータの効果的な解析と解釈に重要である。
ハイブリット・コンボリューション・アテンション・ネットワーク(HCANet)を提案する。
主流HSIデータセットに対する実験結果は,提案したHCANetの合理性と有効性を示している。
論文 参考訳(メタデータ) (2024-03-15T07:18:43Z) - AMD-HookNet for Glacier Front Segmentation [17.60067480799222]
氷河の開削前位置の変化に関する知識は 氷河の状態を評価する上で重要です
深層学習に基づく手法は、光学衛星画像やレーダー衛星画像から氷河の前部線を削る大きな可能性を示している。
本研究では,新しい氷河養生フロントセグメンテーションフレームワークであるAttention-Multi-hooking-Deep-supervision HookNetを提案する。
論文 参考訳(メタデータ) (2023-02-06T12:39:40Z) - Adaptive Split-Fusion Transformer [90.04885335911729]
本稿では,適応重みによる畳み込みと注目の分岐を異なる方法で扱うための適応分割変換器(ASF-former)を提案する。
ImageNet-1Kのような標準ベンチマークの実験では、我々のASFフォーマーはCNN、トランスフォーマー、ハイブリッドパイロットを精度で上回っている。
論文 参考訳(メタデータ) (2022-04-26T10:00:28Z) - DepthFormer: Exploiting Long-Range Correlation and Local Information for
Accurate Monocular Depth Estimation [50.08080424613603]
高精度な単分子深度推定には長距離相関が不可欠である。
我々は,このグローバルコンテキストを効果的な注意機構でモデル化するためにTransformerを活用することを提案する。
提案したモデルであるDepthFormerは、最先端のモノクル深度推定手法をはるかに超えている。
論文 参考訳(メタデータ) (2022-03-27T05:03:56Z) - Bayesian U-Net for Segmenting Glaciers in SAR Imagery [7.960675807187592]
不確実性を計算し,新しい二段階プロセスとして不確実性最適化手法として用いることを提案する。
ネットワークへの不確実性マップの供給は95.24%のdice類似性をもたらす。
これは、最先端の決定論的U-Netベースの氷河セグメンテーションパイプラインと比較して、全体的なセグメンテーション性能の改善である。
論文 参考訳(メタデータ) (2021-01-08T23:17:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。