論文の概要: SAM2-ELNet: Label Enhancement and Automatic Annotation for Remote Sensing Segmentation
- arxiv url: http://arxiv.org/abs/2503.12404v2
- Date: Sun, 21 Sep 2025 01:18:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-23 14:36:44.885004
- Title: SAM2-ELNet: Label Enhancement and Automatic Annotation for Remote Sensing Segmentation
- Title(参考訳): SAM2-ELNet:リモートセンシングセグメンテーションのためのラベル拡張と自動アノテーション
- Authors: Jianhao Yang, Wenshuo Yu, Yuanchao Lv, Jiance Sun, Bokang Sun, Mingyang Liu,
- Abstract要約: SAM2-ELNetと呼ばれる新しいラベル拡張および自動アノテーションフレームワークを導入する。
具体的には、予め訓練されたSAM2の凍結したHieraバックボーンをエンコーダとして使用し、アダプタとデコーダを微調整する。
本研究では,資源制限されたリモートセンシングタスクを対象とした一連の実験を設計し,その手法を2つのデータセット上で評価する。
- 参考スコア(独自算出の注目度): 2.5292915978887387
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing image segmentation is crucial for environmental monitoring, disaster assessment, and resource management, but its performance largely depends on the quality of the dataset. Although several high-quality datasets are broadly accessible, data scarcity remains for specialized tasks like marine oil spill segmentation. Such tasks still rely on manual annotation, which is both time-consuming and influenced by subjective human factors. The segment anything model 2 (SAM2) has strong potential as an automatic annotation framework but struggles to perform effectively on heterogeneous, low-contrast remote sensing imagery. To address these challenges, we introduce a novel label enhancement and automatic annotation framework, termed SAM2-ELNet (Enhancement and Labeling Network). Specifically, we employ the frozen Hiera backbone from the pretrained SAM2 as the encoder, while fine-tuning the adapter and decoder for different remote sensing tasks. In addition, the proposed framework includes a label quality evaluator for filtering, ensuring the reliability of the generated labels. We design a series of experiments targeting resource-limited remote sensing tasks and evaluate our method on two datasets: the Deep-SAR Oil Spill (SOS) dataset with Synthetic Aperture Radar (SAR) imagery, and the CHN6-CUG Road dataset with Very High Resolution (VHR) optical imagery. The proposed framework can enhance coarse annotations and generate reliable training data under resource-limited conditions. Fine-tuned on only 30% of the training data, it generates automatically labeled data. A model trained solely on these achieves slightly lower performance than using the full original annotations, while greatly reducing labeling costs and offering a practical solution for large-scale remote sensing interpretation.
- Abstract(参考訳): リモートセンシング画像セグメンテーションは環境モニタリング,災害評価,資源管理において重要であるが,その性能はデータセットの品質に大きく依存する。
いくつかの高品質なデータセットは広くアクセス可能であるが、海洋油流出セグメンテーションのような特別なタスクにはデータ不足が残る。
このようなタスクは依然として手動のアノテーションに依存しており、それは時間と主観的な人間の要因に影響を受けている。
セグメンテーションモデル2(SAM2)は、自動アノテーションフレームワークとして強力な可能性を持っているが、異種で低コントラストのリモートセンシング画像で効果的に機能することは困難である。
これらの課題に対処するために、SAM2-ELNet(Enhancement and Labeling Network)と呼ばれる新しいラベル拡張および自動アノテーションフレームワークを導入する。
具体的には、予め訓練されたSAM2の凍結したHieraバックボーンをエンコーダとして使用し、異なるリモートセンシングタスクに対してアダプタとデコーダを微調整する。
さらに、提案フレームワークは、ラベル品質評価器を含み、生成されたラベルの信頼性を保証する。
我々は、資源制限されたリモートセンシングタスクをターゲットにした一連の実験を設計し、SAR(Synthetic Aperture Radar)画像を用いたDeep-SAR Oil Spill(SOS)データセットと、超高分解能(VHR)光学画像を用いたCHN6-CUG Roadデータセットの2つのデータセット上で手法を評価する。
提案フレームワークは、粗いアノテーションを強化し、リソース制限条件下で信頼性の高いトレーニングデータを生成する。
トレーニングデータの30%だけを微調整し、自動的にラベル付きデータを生成する。
これらに基づいてトレーニングされたモデルは、完全なオリジナルのアノテーションを使用するよりも若干パフォーマンスが低く、ラベル付けコストを大幅に削減し、大規模なリモートセンシング解釈のための実用的なソリューションを提供する。
関連論文リスト
- TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - Task Specific Pretraining with Noisy Labels for Remote Sensing Image Segmentation [18.598405597933752]
自己監督(Self-supervision)は、人造地理空間アノテーションの正確な量を減らすためのリモートセンシングツールを提供する。
本研究では,モデル事前学習のためのノイズの多いセマンティックセグメンテーションマップを提案する。
2つのデータセットから,ノイズラベルを用いたタスク固有教師付き事前学習の有効性が示唆された。
論文 参考訳(メタデータ) (2024-02-25T18:01:42Z) - Debiased Learning for Remote Sensing Data [29.794246747637104]
本稿では,リモートセンシングデータに特化して,高度に効率的な半教師付きアプローチを提案する。
まず、このドメインに適した堅牢で弱い拡張を設計し、FixMatchフレームワークをリモートセンシングデータに適用する。
第2に,本モデルにより予測される実際のラベルと擬似ラベルの両方から得られる不均衡学習データのバイアスを除去し,効果的な半教師付き学習手法を開発する。
論文 参考訳(メタデータ) (2023-12-24T03:33:30Z) - Terrain-Informed Self-Supervised Learning: Enhancing Building Footprint Extraction from LiDAR Data with Limited Annotations [1.3243401820948064]
フットプリントマップの構築は、広範な後処理なしで正確なフットプリント抽出を約束する。
ディープラーニング手法は、一般化とラベルの効率の面で課題に直面している。
リモートセンシングに適した地形認識型自己教師型学習を提案する。
論文 参考訳(メタデータ) (2023-11-02T12:34:23Z) - Robust Feature Learning Against Noisy Labels [0.2082426271304908]
ミスラベルされたサンプルはモデルの一般化を著しく低下させることができる。
ノイズラベルによる監督の負の影響を最小限に抑えるために、プログレッシブな自己ブートストラッピングが導入される。
実験結果から,本手法は強騒音ラベル下でモデルロバスト性を効果的かつ効果的に向上できることが示唆された。
論文 参考訳(メタデータ) (2023-07-10T02:55:35Z) - Losses over Labels: Weakly Supervised Learning via Direct Loss
Construction [71.11337906077483]
プログラム可能な弱い監視は、機械学習のパラダイムとして成長している。
ラベルの中間ステップを経由することなく,直接損失を発生させるため,ラベルのロバスト・オーバー・ラベル(Losses over Labels, LoL)を提案する。
いくつかのベンチマークテキストおよび画像分類タスクにおいて、LoLは既存の弱い監督手法を改善していることを示す。
論文 参考訳(メタデータ) (2022-12-13T22:29:14Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Evaluating Self and Semi-Supervised Methods for Remote Sensing
Segmentation Tasks [4.7590051176368915]
我々は、下流タスク性能を改善するためにラベルのないデータを活用する、最近の自己および半教師付きML技術を評価する。
これらの手法は、ラベルなし画像へのアクセスが容易で、真理ラベルの取得が高価である場合が多いため、リモートセンシングタスクには特に有用である。
論文 参考訳(メタデータ) (2021-11-19T07:41:14Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。