論文の概要: SAM2-ELNet: Label Enhancement and Automatic Annotation for Remote Sensing Segmentation
- arxiv url: http://arxiv.org/abs/2503.12404v1
- Date: Sun, 16 Mar 2025 08:11:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 12:31:08.411843
- Title: SAM2-ELNet: Label Enhancement and Automatic Annotation for Remote Sensing Segmentation
- Title(参考訳): SAM2-ELNet:リモートセンシングセグメンテーションのためのラベル拡張と自動アノテーション
- Authors: Jianhao Yang, Wenshuo Yu, Yuanchao Lv, Jiance Sun, Bokang Sun, Mingyang Liu,
- Abstract要約: この研究は、ラベリングモジュールとエッジアテンション機構を組み込んだ、SAM2-ELNetと呼ばれるエッジ強化ラベリングネットワークを提案する。
本手法では,事前学習した大規模モデルセグメントのHieraバックボーンをエンコーダとして使用する。
その結果, ラベルの強化によりトレーニングしたモデルの性能が向上し, 最終損失が低くなり, 実際のデータ分布との密接な一致が示唆された。
- 参考スコア(独自算出の注目度): 1.7906674529114799
- License:
- Abstract: Remote sensing image segmentation is crucial for environmental monitoring, disaster assessment, and resource management, directly affecting the accuracy and efficiency of surface information extraction. The performance of existing supervised models in remote sensing image segmentation tasks highly depends on the quality of label data. However, current label data mainly relies on manual annotation, which comes with high time costs and is subject to subjective interference, resulting in distortion of label boundaries and often a loss of detail. To solve the above problems, our work proposes an Edge-enhanced Labeling Network, called SAM2-ELNet, which incorporates a labeling module and an edge attention mechanism. This model effectively addresses issues such as label detail loss, fragmentation, and inaccurate boundaries. Due to the scarcity of manually annotated remote sensing data, the feature extraction capabilities of traditional neural networks are limited. Our method uses the Hiera backbone of the pre-trained self-supervised large model segment anything model 2 (SAM2) as the encoder, achieves high-quality and efficient feature extraction even with small samples by fine-tuning on downstream tasks. This study compared the training effects of original and enhanced labels on the manually annotated Deep-SAR Oil Spill (SOS) dataset. Results showed that the model trained with enhanced labels performed better and had a lower final loss, indicating closer alignment with the real data distribution. Our work also explores the potential of extending the model into an efficient automatic annotation framework through generalization experiments, facilitating large-scale remote sensing image interpretation and intelligent recognition.
- Abstract(参考訳): リモートセンシング画像セグメンテーションは, 環境モニタリング, 災害評価, 資源管理において重要であり, 表面情報抽出の精度と効率に直接影響を与える。
リモートセンシング画像分割タスクにおける既存の教師付きモデルの性能はラベルデータの品質に大きく依存する。
しかし、現在のラベルデータは主に手動のアノテーションに依存しており、それは高い時間的コストを伴い、主観的な干渉を受けており、ラベルの境界が歪んでおり、しばしば詳細が失われる。
そこで本研究では,ラベルモジュールとエッジアテンション機構を備えたエッジ拡張ラベルネットワークSAM2-ELNetを提案する。
このモデルはラベルの詳細な損失、断片化、不正確な境界といった問題に効果的に対処する。
手動でアノテートしたリモートセンシングデータの不足のため、従来のニューラルネットワークの特徴抽出能力は限られている。
提案手法では,事前学習した大規模モデルセグメントモデル2 (SAM2) のヒエラバックボーンをエンコーダとして使用し,下流タスクの微調整による小さなサンプルであっても,高品質で効率的な特徴抽出を実現する。
本研究では,手動でアノテートしたDeep-SAR Oil Spill (SOS)データセットに対するオリジナルラベルと強化ラベルのトレーニング効果を比較した。
その結果, ラベルの強化によりトレーニングしたモデルの性能が向上し, 最終損失が低くなり, 実際のデータ分布との密接な一致が示唆された。
我々の研究は、大規模なリモートセンシング画像解釈とインテリジェントな認識を容易にし、一般化実験を通じて、モデルを効率的な自動アノテーションフレームワークに拡張する可能性についても検討している。
関連論文リスト
- TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - Task Specific Pretraining with Noisy Labels for Remote Sensing Image Segmentation [18.598405597933752]
自己監督(Self-supervision)は、人造地理空間アノテーションの正確な量を減らすためのリモートセンシングツールを提供する。
本研究では,モデル事前学習のためのノイズの多いセマンティックセグメンテーションマップを提案する。
2つのデータセットから,ノイズラベルを用いたタスク固有教師付き事前学習の有効性が示唆された。
論文 参考訳(メタデータ) (2024-02-25T18:01:42Z) - Debiased Learning for Remote Sensing Data [29.794246747637104]
本稿では,リモートセンシングデータに特化して,高度に効率的な半教師付きアプローチを提案する。
まず、このドメインに適した堅牢で弱い拡張を設計し、FixMatchフレームワークをリモートセンシングデータに適用する。
第2に,本モデルにより予測される実際のラベルと擬似ラベルの両方から得られる不均衡学習データのバイアスを除去し,効果的な半教師付き学習手法を開発する。
論文 参考訳(メタデータ) (2023-12-24T03:33:30Z) - Terrain-Informed Self-Supervised Learning: Enhancing Building Footprint Extraction from LiDAR Data with Limited Annotations [1.3243401820948064]
フットプリントマップの構築は、広範な後処理なしで正確なフットプリント抽出を約束する。
ディープラーニング手法は、一般化とラベルの効率の面で課題に直面している。
リモートセンシングに適した地形認識型自己教師型学習を提案する。
論文 参考訳(メタデータ) (2023-11-02T12:34:23Z) - Robust Feature Learning Against Noisy Labels [0.2082426271304908]
ミスラベルされたサンプルはモデルの一般化を著しく低下させることができる。
ノイズラベルによる監督の負の影響を最小限に抑えるために、プログレッシブな自己ブートストラッピングが導入される。
実験結果から,本手法は強騒音ラベル下でモデルロバスト性を効果的かつ効果的に向上できることが示唆された。
論文 参考訳(メタデータ) (2023-07-10T02:55:35Z) - Losses over Labels: Weakly Supervised Learning via Direct Loss
Construction [71.11337906077483]
プログラム可能な弱い監視は、機械学習のパラダイムとして成長している。
ラベルの中間ステップを経由することなく,直接損失を発生させるため,ラベルのロバスト・オーバー・ラベル(Losses over Labels, LoL)を提案する。
いくつかのベンチマークテキストおよび画像分類タスクにおいて、LoLは既存の弱い監督手法を改善していることを示す。
論文 参考訳(メタデータ) (2022-12-13T22:29:14Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - Evaluating Self and Semi-Supervised Methods for Remote Sensing
Segmentation Tasks [4.7590051176368915]
我々は、下流タスク性能を改善するためにラベルのないデータを活用する、最近の自己および半教師付きML技術を評価する。
これらの手法は、ラベルなし画像へのアクセスが容易で、真理ラベルの取得が高価である場合が多いため、リモートセンシングタスクには特に有用である。
論文 参考訳(メタデータ) (2021-11-19T07:41:14Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。