論文の概要: SAM2-ELNet: Label Enhancement and Automatic Annotation for Remote Sensing Segmentation
- arxiv url: http://arxiv.org/abs/2503.12404v1
- Date: Sun, 16 Mar 2025 08:11:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-18 14:56:57.895954
- Title: SAM2-ELNet: Label Enhancement and Automatic Annotation for Remote Sensing Segmentation
- Title(参考訳): SAM2-ELNet:リモートセンシングセグメンテーションのためのラベル拡張と自動アノテーション
- Authors: Jianhao Yang, Wenshuo Yu, Yuanchao Lv, Jiance Sun, Bokang Sun, Mingyang Liu,
- Abstract要約: この研究は、ラベリングモジュールとエッジアテンション機構を組み込んだ、SAM2-ELNetと呼ばれるエッジ強化ラベリングネットワークを提案する。
本手法では,事前学習した大規模モデルセグメントのHieraバックボーンをエンコーダとして使用する。
その結果, ラベルの強化によりトレーニングしたモデルの性能が向上し, 最終損失が低くなり, 実際のデータ分布との密接な一致が示唆された。
- 参考スコア(独自算出の注目度): 1.7906674529114799
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Remote sensing image segmentation is crucial for environmental monitoring, disaster assessment, and resource management, directly affecting the accuracy and efficiency of surface information extraction. The performance of existing supervised models in remote sensing image segmentation tasks highly depends on the quality of label data. However, current label data mainly relies on manual annotation, which comes with high time costs and is subject to subjective interference, resulting in distortion of label boundaries and often a loss of detail. To solve the above problems, our work proposes an Edge-enhanced Labeling Network, called SAM2-ELNet, which incorporates a labeling module and an edge attention mechanism. This model effectively addresses issues such as label detail loss, fragmentation, and inaccurate boundaries. Due to the scarcity of manually annotated remote sensing data, the feature extraction capabilities of traditional neural networks are limited. Our method uses the Hiera backbone of the pre-trained self-supervised large model segment anything model 2 (SAM2) as the encoder, achieves high-quality and efficient feature extraction even with small samples by fine-tuning on downstream tasks. This study compared the training effects of original and enhanced labels on the manually annotated Deep-SAR Oil Spill (SOS) dataset. Results showed that the model trained with enhanced labels performed better and had a lower final loss, indicating closer alignment with the real data distribution. Our work also explores the potential of extending the model into an efficient automatic annotation framework through generalization experiments, facilitating large-scale remote sensing image interpretation and intelligent recognition.
- Abstract(参考訳): リモートセンシング画像セグメンテーションは, 環境モニタリング, 災害評価, 資源管理において重要であり, 表面情報抽出の精度と効率に直接影響を与える。
リモートセンシング画像分割タスクにおける既存の教師付きモデルの性能はラベルデータの品質に大きく依存する。
しかし、現在のラベルデータは主に手動のアノテーションに依存しており、それは高い時間的コストを伴い、主観的な干渉を受けており、ラベルの境界が歪んでおり、しばしば詳細が失われる。
そこで本研究では,ラベルモジュールとエッジアテンション機構を備えたエッジ拡張ラベルネットワークSAM2-ELNetを提案する。
このモデルはラベルの詳細な損失、断片化、不正確な境界といった問題に効果的に対処する。
手動でアノテートしたリモートセンシングデータの不足のため、従来のニューラルネットワークの特徴抽出能力は限られている。
提案手法では,事前学習した大規模モデルセグメントモデル2 (SAM2) のヒエラバックボーンをエンコーダとして使用し,下流タスクの微調整による小さなサンプルであっても,高品質で効率的な特徴抽出を実現する。
本研究では,手動でアノテートしたDeep-SAR Oil Spill (SOS)データセットに対するオリジナルラベルと強化ラベルのトレーニング効果を比較した。
その結果, ラベルの強化によりトレーニングしたモデルの性能が向上し, 最終損失が低くなり, 実際のデータ分布との密接な一致が示唆された。
我々の研究は、大規模なリモートセンシング画像解釈とインテリジェントな認識を容易にし、一般化実験を通じて、モデルを効率的な自動アノテーションフレームワークに拡張する可能性についても検討している。
関連論文リスト
- SAM2Auto: Auto Annotation Using FLASH [13.638155035372835]
VLM(Vision-Language Models)は、注釈付きデータセットの不足により、大規模言語モデルに遅れている。
SAM2Autoは、人間の介入やデータセット固有のトレーニングを必要としないビデオデータセットのための、最初の完全に自動化されたアノテーションパイプラインである。
本システムでは, 検出誤差を最小限に抑えつつ, ビデオシーケンス全体にわたって一貫した物体追跡を確実にするため, 統計的手法を用いている。
論文 参考訳(メタデータ) (2025-06-09T15:15:15Z) - Concept-Aware LoRA for Domain-Aligned Segmentation Dataset Generation [66.66243874361103]
1) 生成されたサンプルを対象のドメインに整列させ、2) トレーニングデータ以外の情報的なサンプルを生成する。
本稿では,ドメインアライメントに必要な概念に関連する重みのみを選択的に識別・更新する,新しい微調整手法であるConcept-Aware LoRAを提案する。
都市・シーンのセグメンテーション, ベースライン, 最先端の手法をドメイン内設定で生成する上での有効性を実証する。
論文 参考訳(メタデータ) (2025-03-28T06:23:29Z) - ROS-SAM: High-Quality Interactive Segmentation for Remote Sensing Moving Object [14.931975623642169]
小さなオブジェクトサイズ、あいまいな特徴、限定的な一般化は、現在のメソッドがこの目標を達成するのを難しくする。
本稿では,多様なリモートセンシングデータにまたがる一般化を維持しつつ,高品質な対話的セグメンテーションを実現する手法であるROS-SAMを提案する。
ROS-SAM は,1) SAM の一般化能力を維持しながらドメイン適応の効率化を実現する LoRA-based fine-tuning,2) 抽出した特徴の識別性向上のためのディープネットワーク層の拡張,3) マスクデコーダの局所境界詳細とグローバルコンテキストの統合による高品質セグメンテーションマスクの生成という,3つの重要なイノベーションに基づいて構築されている。
論文 参考訳(メタデータ) (2025-03-15T06:10:09Z) - TrajSSL: Trajectory-Enhanced Semi-Supervised 3D Object Detection [59.498894868956306]
Pseudo-labeling approach to semi-supervised learning は教師-学生の枠組みを採用する。
我々は、事前学習した動き予測モデルを活用し、擬似ラベル付きデータに基づいて物体軌跡を生成する。
提案手法は2つの異なる方法で擬似ラベル品質を向上する。
論文 参考訳(メタデータ) (2024-09-17T05:35:00Z) - ALPS: An Auto-Labeling and Pre-training Scheme for Remote Sensing Segmentation With Segment Anything Model [32.91528641298171]
ALPS (Automatic Labeling for Pre-training in Pre-training in Remote Sensing) という,革新的な自動ラベリングフレームワークを導入する。
我々はSegment Anything Model(SAM)を利用して、事前のアノテーションや追加のプロンプトを必要とせずに、RS画像の正確な擬似ラベルを予測する。
提案手法は,iSAIDやISPRS Potsdamなど,様々なベンチマークにおけるダウンストリームタスクの性能を向上させる。
論文 参考訳(メタデータ) (2024-06-16T09:02:01Z) - Task Specific Pretraining with Noisy Labels for Remote Sensing Image Segmentation [18.598405597933752]
自己監督(Self-supervision)は、人造地理空間アノテーションの正確な量を減らすためのリモートセンシングツールを提供する。
本研究では,モデル事前学習のためのノイズの多いセマンティックセグメンテーションマップを提案する。
2つのデータセットから,ノイズラベルを用いたタスク固有教師付き事前学習の有効性が示唆された。
論文 参考訳(メタデータ) (2024-02-25T18:01:42Z) - Debiased Learning for Remote Sensing Data [29.794246747637104]
本稿では,リモートセンシングデータに特化して,高度に効率的な半教師付きアプローチを提案する。
まず、このドメインに適した堅牢で弱い拡張を設計し、FixMatchフレームワークをリモートセンシングデータに適用する。
第2に,本モデルにより予測される実際のラベルと擬似ラベルの両方から得られる不均衡学習データのバイアスを除去し,効果的な半教師付き学習手法を開発する。
論文 参考訳(メタデータ) (2023-12-24T03:33:30Z) - Terrain-Informed Self-Supervised Learning: Enhancing Building Footprint Extraction from LiDAR Data with Limited Annotations [1.3243401820948064]
フットプリントマップの構築は、広範な後処理なしで正確なフットプリント抽出を約束する。
ディープラーニング手法は、一般化とラベルの効率の面で課題に直面している。
リモートセンシングに適した地形認識型自己教師型学習を提案する。
論文 参考訳(メタデータ) (2023-11-02T12:34:23Z) - Robust Feature Learning Against Noisy Labels [0.2082426271304908]
ミスラベルされたサンプルはモデルの一般化を著しく低下させることができる。
ノイズラベルによる監督の負の影響を最小限に抑えるために、プログレッシブな自己ブートストラッピングが導入される。
実験結果から,本手法は強騒音ラベル下でモデルロバスト性を効果的かつ効果的に向上できることが示唆された。
論文 参考訳(メタデータ) (2023-07-10T02:55:35Z) - A generic self-supervised learning (SSL) framework for representation
learning from spectra-spatial feature of unlabeled remote sensing imagery [4.397725469518669]
自己教師付き学習(SSL)では、モデルが桁違いに遅延のないデータから表現を学習することができる。
この研究は、未ラベルデータのスペクトル空間情報の両方から表現を学習できる新しいSSLフレームワークを設計した。
論文 参考訳(メタデータ) (2023-06-27T23:50:43Z) - Losses over Labels: Weakly Supervised Learning via Direct Loss
Construction [71.11337906077483]
プログラム可能な弱い監視は、機械学習のパラダイムとして成長している。
ラベルの中間ステップを経由することなく,直接損失を発生させるため,ラベルのロバスト・オーバー・ラベル(Losses over Labels, LoL)を提案する。
いくつかのベンチマークテキストおよび画像分類タスクにおいて、LoLは既存の弱い監督手法を改善していることを示す。
論文 参考訳(メタデータ) (2022-12-13T22:29:14Z) - LESS: Label-Efficient Semantic Segmentation for LiDAR Point Clouds [62.49198183539889]
我々は,LiDAR点雲を用いた屋外シーンのためのラベル効率のよいセマンティックセマンティックセマンティクスパイプラインを提案する。
本手法は,半弱教師付き学習を用いて,効率的なラベリング手法を設計する。
提案手法は,100%ラベル付き完全教師付き手法と比較して,さらに競争力が高い。
論文 参考訳(メタデータ) (2022-10-14T19:13:36Z) - A Weakly Supervised Learning Framework for Salient Object Detection via
Hybrid Labels [96.56299163691979]
本稿では,ハイブリッドラベル下でのSODタスクに焦点をあてる。
このタスクにおけるラベルノイズと量不均衡の問題に対処するため、我々は3つの洗練されたトレーニング戦略を持つ新しいパイプラインフレームワークを設計する。
5つのSODベンチマーク実験により,本手法は弱教師付き/非教師付き手法と競合する性能を示した。
論文 参考訳(メタデータ) (2022-09-07T06:45:39Z) - Unsupervised Domain Adaptive Salient Object Detection Through
Uncertainty-Aware Pseudo-Label Learning [104.00026716576546]
そこで本研究では,手動のアノテーションを使わずに,自然に高いピクセルラベル品質を有する合成・クリーンなラベルから,サリエンスを学習することを提案する。
提案手法は,複数のベンチマークデータセット上で,既存の最先端の深層教師なしSOD法よりも優れていることを示す。
論文 参考訳(メタデータ) (2022-02-26T16:03:55Z) - PointMatch: A Consistency Training Framework for Weakly Supervised
Semantic Segmentation of 3D Point Clouds [117.77841399002666]
本稿では,データ自体から十分な情報を探索するために整合性正規化を適用することで,データとラベルの両面に立つ新しいフレームワークであるPointMatchを提案する。
提案したPointMatchは、ScanNet-v2データセットとS3DISデータセットの両方で、様々な弱い教師付きスキームの下で最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-02-22T07:26:31Z) - Evaluating Self and Semi-Supervised Methods for Remote Sensing
Segmentation Tasks [4.7590051176368915]
我々は、下流タスク性能を改善するためにラベルのないデータを活用する、最近の自己および半教師付きML技術を評価する。
これらの手法は、ラベルなし画像へのアクセスが容易で、真理ラベルの取得が高価である場合が多いため、リモートセンシングタスクには特に有用である。
論文 参考訳(メタデータ) (2021-11-19T07:41:14Z) - Active Learning for Improved Semi-Supervised Semantic Segmentation in
Satellite Images [1.0152838128195467]
半教師付きテクニックは、ラベル付きサンプルの小さなセットから擬似ラベルを生成する。
そこで我々は,ラベル付きトレーニングデータの集合を高度に代表的に選択するために,アクティブな学習に基づくサンプリング戦略を提案する。
我々はmIoUの27%の改善を報告し、2%のラベル付きデータをアクティブラーニングサンプリング戦略を用いて報告した。
論文 参考訳(メタデータ) (2021-10-15T00:29:31Z) - Weakly-Supervised Salient Object Detection via Scribble Annotations [54.40518383782725]
本稿では,スクリブルラベルからサリエンシを学習するための弱教師付きサリエント物体検出モデルを提案する。
そこで本研究では,予測されたサリエンシマップの構造アライメントを測定するために,新しい尺度であるサリエンシ構造尺度を提案する。
我々の手法は、既存の弱教師付き/非教師付き手法よりも優れているだけでなく、いくつかの完全教師付き最先端モデルと同等である。
論文 参考訳(メタデータ) (2020-03-17T12:59:50Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。