論文の概要: A Data-Centric Vision Transformer Baseline for SAR Sea Ice Classification
- arxiv url: http://arxiv.org/abs/2604.03094v1
- Date: Fri, 03 Apr 2026 15:18:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-06 17:20:24.50637
- Title: A Data-Centric Vision Transformer Baseline for SAR Sea Ice Classification
- Title(参考訳): SAR海氷分類のためのデータ中心視覚変換器ベースライン
- Authors: David Mike-Ewewie, Panhapiseth Lim, Priyanka Kumar,
- Abstract要約: AI4Arctic/ASIP Sea Ice データセット (v2) を用いており、これは専門的な氷図と一致する461Sentinel-1 のシーンを含んでいる。
クロスエントロピーと重み付きクロスエントロピーで訓練したViT-Baseモデルと、焦点損失で訓練したViT-Largeモデルとの比較を行った。
これらの結果から, 希少な氷の授業において, 重み付きクロスエントロピーよりも高精度リコールトレードオフが有効であることが示唆された。
- 参考スコア(独自算出の注目度): 2.4851820343103035
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Accurate and automated sea ice classification is important for climate monitoring and maritime safety in the Arctic. While Synthetic Aperture Radar (SAR) is the operational standard because of its all-weather capability, it remains challenging to distinguish morphologically similar ice classes under severe class imbalance. Rather than claiming a fully validated multimodal system, this paper establishes a trustworthy SAR only baseline that future fusion work can build upon. Using the AI4Arctic/ASIP Sea Ice Dataset (v2), which contains 461 Sentinel-1 scenes matched with expert ice charts, we combine full-resolution Sentinel-1 Extra Wide inputs, leakage-aware stratified patch splitting, SIGRID-3 stage-of-development labels, and training-set normalization to evaluate Vision Transformer baselines. We compare ViT-Base models trained with cross entropy and weighted cross-entropy against a ViT-Large model trained with focal loss. Among the tested configurations, ViT-Large with focal loss achieves 69.6% held-out accuracy, 68.8% weighted F1, and 83.9% precision on the minority Multi-Year Ice class. These results show that focal-loss training offers a more useful precision-recall trade-off than weighted cross-entropy for rare ice classes and establishes a cleaner baseline for future multimodal fusion with optical, thermal, or meteorological data.
- Abstract(参考訳): 海氷の正確な分類と自動分類は北極圏の気候モニタリングと海洋安全にとって重要である。
合成開口レーダ(SAR)はその全天候能力のため運用標準であるが、厳密なクラス不均衡の下で形態的に類似した氷のクラスを区別することは依然として困難である。
本論文は, 完全検証マルチモーダルシステムではなく, 今後の融合作業が構築可能な, 信頼性の高いSARのみのベースラインを確立する。
AI4Arctic/ASIP Sea Ice Dataset (v2)は461のSentinel-1シーンを専門家の氷図にマッチさせたもので、フルレゾリューションのSentinel-1エクストラワイドインプット、リーク対応の階層化パッチスプリッティング、SIGRID-3ステージ開発ラベル、トレーニングセット正規化を組み合わせ、Vision Transformerベースラインを評価する。
クロスエントロピーと重み付きクロスエントロピーで訓練したViT-Baseモデルと、焦点損失で訓練したViT-Largeモデルとの比較を行った。
試験された構成のうち、焦点損失のあるViT-Largeは69.6%の保持精度、68.8%の重み付きF1、83.9%の精度を達成している。
これらの結果から,光・熱・気象データを用いたマルチモーダル融合のためのクリーンなベースラインを確立した。
関連論文リスト
- Breaking the Statistical Similarity Trap in Extreme Convection Detection [0.0]
ディープラーニング気象モデルの現在の評価指標は、希少で高影響のイベントを欠いている間、ぼやけた予測に報いる。
DARTは、粗大な大気予測を高解像度の衛星温度場に変換するという課題に対処するフレームワークである。
DARTは、背景/極端分解、物理的にモチベーションを得たオーバーサンプリング、タスク固有の損失関数を備えたデュアルデコーダアーキテクチャを採用している。
論文 参考訳(メタデータ) (2025-09-11T07:10:45Z) - ReconMOST: Multi-Layer Sea Temperature Reconstruction with Observations-Guided Diffusion [48.540756751934836]
ReconMOSTは多層水温再構築のためのデータ駆動誘導拡散モデルフレームワークである。
提案手法はMLベースのSST再構成をグローバルな多層設定に拡張し,92.5%以上の欠落データを処理する。
論文 参考訳(メタデータ) (2025-06-12T06:27:22Z) - Pseudo-Label Guided Real-World Image De-weathering: A Learning Framework with Imperfect Supervision [57.5699142476311]
非理想的な監視を伴う実世界のイメージデウェザリングのための統一的なソリューションを提案する。
本手法は,不完全整合型非整合性データセットのトレーニングにおいて,大きな利点を示す。
論文 参考訳(メタデータ) (2025-04-14T07:24:03Z) - Efficient Self-Supervised Learning for Earth Observation via Dynamic Dataset Curation [67.23953699167274]
自己教師付き学習(SSL)により、地球観測のための視覚基盤モデルの開発が可能になった。
EOでは、この課題は衛星画像に共通する冗長性と重尾分布によって増幅される。
本稿では,データセットの多様性とバランスを最大化し,SSL事前トレーニングを改善するために設計された動的データセットプルーニング戦略を提案する。
論文 参考訳(メタデータ) (2025-04-09T15:13:26Z) - Assessing Foundation Models for Sea Ice Type Segmentation in Sentinel-1 SAR Imagery [2.255599116578844]
本研究では,Sentinel-1画像を用いた海氷型セグメンテーションの基礎モデル10点について検討した。
選択されたモデルの中で、Prithvi-600Mはベースラインモデルより優れており、CROMAはF1スコアで非常によく似たパフォーマンスを実現している。
論文 参考訳(メタデータ) (2025-03-28T15:21:08Z) - Comparison Study: Glacier Calving Front Delineation in Synthetic Aperture Radar Images With Deep Learning [11.298727820998566]
本研究は、共通の計算フロントベンチマークデータセット上でのディープラーニングシステムの初回比較を示す。
最高のDLモデルの出力は平均で221m、人間のアノテータの平均偏差は38mである。
この大きな違いは、現在のDLシステムは、まだ人間のパフォーマンスに合わないことを示し、氷河カルビングフロントの完全な自動監視を可能にするためには、さらなる研究が必要であることを示している。
論文 参考訳(メタデータ) (2025-01-09T14:43:36Z) - Partial Label Learning with Focal Loss for Sea Ice Classification Based on Ice Charts [2.0270474485799017]
本稿では,海氷分類を学習するための新しいGeoAI手法を提案する。
我々は、ポリゴンレベルのラベルを候補部分ラベルとして扱い、対応する氷濃度を各ラベルの信頼性スコアとして割り当て、焦点損失と統合して畳み込みニューラルネットワーク(CNN)を訓練する。
提案手法により,Sentinel-1双偏極SAR画像の海氷分類性能が向上し,分類精度が87%から92%に向上し,F-1スコアが90%から93%に向上した。
論文 参考訳(メタデータ) (2024-06-05T22:49:30Z) - An Experimental Study on Exploring Strong Lightweight Vision Transformers via Masked Image Modeling Pre-Training [51.622652121580394]
Masked Image Modeling (MIM) Pre-training for Large-scale Vision Transformer (ViTs) は、学習した自己教師型ViT機能に加えて、下流での有望なパフォーマンスを実現する。
本稿では,テキストテキストレメリーで軽量なViTの微調整性能が,この事前学習パラダイムの恩恵を受けるかどうかを問う。
バニラ/階層設計(5.7M$/6.5M$)による純軽量ViTの蒸留による事前トレーニングは、ImageNet-1で79.4%$/78.9%の精度で達成できる。
論文 参考訳(メタデータ) (2024-04-18T14:14:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。