論文の概要: Diffusion-based Data Augmentation and Knowledge Distillation with Generated Soft Labels Solving Data Scarcity Problems of SAR Oil Spill Segmentation
- arxiv url: http://arxiv.org/abs/2412.08116v2
- Date: Tue, 18 Mar 2025 05:49:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-19 16:29:10.663894
- Title: Diffusion-based Data Augmentation and Knowledge Distillation with Generated Soft Labels Solving Data Scarcity Problems of SAR Oil Spill Segmentation
- Title(参考訳): SARオイルスパイルセグメンテーションのデータスカラシティ問題に対するソフトラベル生成による拡散型データ拡張と知識蒸留
- Authors: Jaeho Moon, Jeonghwan Yun, Jaehyun Kim, Jaehyup Lee, Munchurl Kim,
- Abstract要約: 石油流出セグメンテーションのための知識伝達(DAKTer)戦略を用いた拡散型データ拡張を提案する。
生成したSAR画像とソフトラベルを活用することで、学生セグメンテーションモデルは、同じタスクのために訓練された教師モデルなしで、堅牢な特徴表現を学習することができる。
我々の戦略は、他の生成的データ拡張手法と比較して、大きなマージンで優れた性能を達成するために、様々なセグメンテーションモデルを強化します。
- 参考スコア(独自算出の注目度): 23.48547745185572
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Oil spills pose severe environmental risks, making early detection crucial for effective response and mitigation. As Synthetic Aperture Radar (SAR) images operate under all-weather conditions, SAR-based oil spill segmentation enables fast and robust monitoring. However, when using deep learning models, SAR oil spill segmentation often struggles in training due to the scarcity of labeled data. To address this limitation, we propose a diffusion-based data augmentation with knowledge transfer (DAKTer) strategy. Our DAKTer strategy enables a diffusion model to generate SAR oil spill images along with soft label pairs, which offer richer class probability distributions than segmentation masks (i.e. hard labels). Also, for reliable joint generation of high-quality SAR images and well-aligned soft labels, we introduce an SNR-based balancing factor aligning the noise corruption process of both modalilties in diffusion models. By leveraging the generated SAR images and soft labels, a student segmentation model can learn robust feature representations without teacher models trained for the same task, improving its ability to segment oil spill regions. Extensive experiments demonstrate that our DAKTer strategy effectively transfers the knowledge of per-pixel class probabilities to the student segmentation model to distinguish the oil spill regions from other look-alike regions in the SAR images. Our DAKTer strategy boosts various segmentation models to achieve superior performance with large margins compared to other generative data augmentation methods.
- Abstract(参考訳): 原油流出は深刻な環境リスクをもたらし、早期発見は効果的な応答と緩和に不可欠である。
合成開口レーダ(SAR)画像は全天候下で動作するため、SARベースのオイル流出セグメンテーションは高速で堅牢な監視を可能にする。
しかし、ディープラーニングモデルを使用する場合、ラベル付きデータの不足のため、SARオイル流出セグメンテーションはトレーニングに苦慮することが多い。
この制限に対処するために,知識伝達(DAKTer)戦略を用いた拡散型データ拡張を提案する。
我々のDAKTer戦略は,拡散モデルにより,SARオイル流出画像とソフトラベルペアの生成を可能にし,セグメンテーションマスク(ハードラベル)よりもリッチなクラス確率分布を提供する。
また、高品質なSAR画像とソフトラベルの信頼性の高い共同生成のために、拡散モデルにおける両モードのノイズ劣化過程を整合させるSNRベースのバランス係数を導入する。
生成したSAR画像とソフトラベルを活用することで、生徒セグメンテーションモデルは、同じタスクのために訓練された教師モデルなしで、堅牢な特徴表現を学習し、オイル流出領域をセグメンテーションする能力を向上させることができる。
我々のDAKTer戦略は,学生セグメンテーションモデルに画素単位のクラス確率の知識を効果的に伝達し,SAR画像の他のルックライクな領域とオイル流出領域を区別することを示した。
我々のDAKTer戦略は、他の生成的データ拡張手法と比較して、大きなマージンで優れた性能を達成するために、様々なセグメンテーションモデルを強化します。
関連論文リスト
- PolSAM: Polarimetric Scattering Mechanism Informed Segment Anything Model [76.95536611263356]
PolSARデータは、そのリッチで複雑な特徴のために、ユニークな課題を提示する。
複素数値データ、偏光特性、振幅画像などの既存のデータ表現が広く使われている。
PolSARのほとんどの機能抽出ネットワークは小さく、機能を効果的にキャプチャする能力を制限している。
本稿では,ドメイン固有の散乱特性と新規なプロンプト生成戦略を統合したSegment Anything Model (SAM) であるPolarimetric Scattering Mechanism-Informed SAM (PolSAM)を提案する。
論文 参考訳(メタデータ) (2024-12-17T09:59:53Z) - C-DiffSET: Leveraging Latent Diffusion for SAR-to-EO Image Translation with Confidence-Guided Reliable Object Generation [23.63992950769041]
C-DiffSETは、訓練済みの遅延拡散モデル(LDM)を自然画像で広く訓練したフレームワークである。
顕著なことに、事前訓練されたVAEエンコーダは、SAR入力のノイズレベルが異なる場合でも、同じ潜時空間でSARとEOの画像を整列する。
論文 参考訳(メタデータ) (2024-11-16T12:28:40Z) - One Step Diffusion-based Super-Resolution with Time-Aware Distillation [60.262651082672235]
拡散に基づく画像超解像(SR)法は,低解像度画像から細部まで細部まで,高解像度画像の再構成に有望であることを示す。
近年,拡散型SRモデルの知識蒸留によるサンプリング効率の向上が試みられている。
我々は,効率的な画像超解像を実現するため,TAD-SRというタイムアウェア拡散蒸留法を提案する。
論文 参考訳(メタデータ) (2024-08-14T11:47:22Z) - SatSynth: Augmenting Image-Mask Pairs through Diffusion Models for Aerial Semantic Segmentation [69.42764583465508]
我々は,地球観測における注釈付きデータの不足に対処するために,生成的画像拡散の可能性を探る。
我々の知る限りでは、衛星セグメンテーションのための画像と対応するマスクの両方を最初に生成する。
論文 参考訳(メタデータ) (2024-03-25T10:30:22Z) - SAR Despeckling via Regional Denoising Diffusion Probabilistic Model [6.154796320245652]
生成モデルに基づく領域分割拡散確率モデル(R-DDPM)
本稿では, 生成モデルに基づく領域分割拡散確率モデル (R-DDPM) を提案する。
論文 参考訳(メタデータ) (2024-01-06T04:34:46Z) - DifAugGAN: A Practical Diffusion-style Data Augmentation for GAN-based
Single Image Super-resolution [88.13972071356422]
本稿では,DifAugGAN として知られる GAN ベースの画像超解像法(SR) のための拡散型データ拡張手法を提案する。
それは、訓練中の判別器の校正を改善するために、生成拡散モデルに拡散過程を適用することを含む。
我々のDifAugGANは、現在のGANベースのSISR手法のプラグ・アンド・プレイ戦略であり、判別器の校正を改善し、SR性能を向上させることができる。
論文 参考訳(メタデータ) (2023-11-30T12:37:53Z) - Predicting Gradient is Better: Exploring Self-Supervised Learning for SAR ATR with a Joint-Embedding Predictive Architecture [23.375515181854254]
SSL(Self-Supervised Learning)手法は,大規模未ラベルデータの事前学習を伴う様々なSAR自動ターゲット認識(ATR)タスクを実現する。
SSLはデータから直接監視信号を構築することを目的としている。
本研究では,SAR ATRの基盤モデル構築に有効なSSL方式について検討した。
論文 参考訳(メタデータ) (2023-11-26T01:05:55Z) - Self-Supervised Neuron Segmentation with Multi-Agent Reinforcement
Learning [53.00683059396803]
マスク画像モデル(MIM)は,マスク画像から元の情報を復元する簡便さと有効性から広く利用されている。
本稿では、強化学習(RL)を利用して最適な画像マスキング比とマスキング戦略を自動検索する決定に基づくMIMを提案する。
本手法は,ニューロン分節の課題において,代替自己監督法に対して有意な優位性を有する。
論文 参考訳(メタデータ) (2023-10-06T10:40:46Z) - RBSR: Efficient and Flexible Recurrent Network for Burst
Super-Resolution [57.98314517861539]
バースト超解像(BurstSR)は、高解像度(HR)画像を低解像度(LR)画像と雑音画像から再構成することを目的としている。
本稿では,効率よくフレキシブルなリカレントネットワークでフレーム単位のキューを融合させることを提案する。
論文 参考訳(メタデータ) (2023-06-30T12:14:13Z) - SRCNet: Seminal Representation Collaborative Network for Marine Oil
Spill Segmentation [18.96012241344086]
本研究では,SRCNet という油流出画像分割ネットワークを提案する。
SAR画像を記述するセミナル表現の協調により、ディープニューラルネットワークのペアで構築される。
提案するSRCNetは,効率的な石油流出セグメンテーションを経済的かつ効率的に運用する。
論文 参考訳(メタデータ) (2023-04-17T13:23:03Z) - DGNet: Distribution Guided Efficient Learning for Oil Spill Image
Segmentation [18.43215454505496]
SAR(Synthetic Aperture Radar)画像における油流出セグメンテーションの実施は,海洋環境保護に不可欠である。
我々は,SAR画像にバックスキャッタ値の内在分布を組み込むことで,石油流出セグメンテーションを行うDGNetという効果的なセグメンテーションフレームワークを開発した。
提案したDGNetのセグメンテーション性能を異なるメトリクスで評価し,その有効セグメンテーションを実験的に評価した。
論文 参考訳(メタデータ) (2022-12-19T18:23:50Z) - Deep learning based automatic detection of offshore oil slicks using SAR
data and contextual information [0.0]
本稿では,両種類のスリックを有する広範囲なデータベース上で,オフショアオイルスリックの自動化について述べる。
これは、Sentinel-1 SARデータ上の特殊な写真解釈器のスリックアノテーションを、世界中の3つの探査および監視エリアで4年間にわたって構築している。
本研究の主な成果は,深層学習によるスリック検出の有効性である。
論文 参考訳(メタデータ) (2022-04-13T13:30:16Z) - SAR-ShipNet: SAR-Ship Detection Neural Network via Bidirectional
Coordinate Attention and Multi-resolution Feature Fusion [7.323279438948967]
本稿では,ニューラルネットワークによる合成開口レーダ(SAR)画像から,事実上有意義な船舶検出問題について検討する。
本稿では,CentralNetに基づく双方向協調注意(BCA)とMRF(Multi- resolution Feature Fusion)を新たに開発したSAR-ShipNet(略してSAR-ShipNet)を提案する。
パブリックなSAR-Shipデータセットの実験結果から,SAR-ShipNetは速度と精度の両面で競争上の優位性を達成していることがわかった。
論文 参考訳(メタデータ) (2022-03-29T12:27:04Z) - Context-Preserving Instance-Level Augmentation and Deformable
Convolution Networks for SAR Ship Detection [50.53262868498824]
ランダムな方向と部分的な情報損失によるSAR画像のターゲット形状の変形は、SAR船の検出において必須の課題である。
ターゲット内の部分的な情報損失に頑健なディープネットワークをトレーニングするためのデータ拡張手法を提案する。
論文 参考訳(メタデータ) (2022-02-14T07:01:01Z) - Oil Spill SAR Image Segmentation via Probability Distribution Modelling [18.72207562693259]
本研究の目的は,SAR画像における海洋油流出の同定に有効なセグメンテーション手法を開発することである。
我々は,オイル流出SAR画像の確率分布表現を達成するために,SAR撮像機構を再検討する。
次に, 油流出特性を組み込んだセグメンテーションエネルギー関数を定式化するために, 分布表現を利用する。
論文 参考訳(メタデータ) (2021-12-17T17:22:29Z) - Dense Attention Fluid Network for Salient Object Detection in Optical
Remote Sensing Images [193.77450545067967]
光リモートセンシング画像(RSI)における有意物体検出のためのエンド・ツー・エンドDense Attention Fluid Network(DAFNet)を提案する。
GCA(Global Context-Aware Attention)モジュールは、長距離の意味的関係を適応的にキャプチャするために提案される。
我々は、2000枚の画像とピクセルワイドなサリエンシアノテーションを含むSODのための新しい、挑戦的な光学RSIデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-26T06:14:10Z) - Cross-Attention in Coupled Unmixing Nets for Unsupervised Hyperspectral
Super-Resolution [79.97180849505294]
本稿では,HSIの空間分解能を高めるために,CUCaNetというクロスアテンション機構を備えた新しい結合型アンミックスネットワークを提案する。
3つの広く使われているHS-MSデータセットに対して、最先端のHSI-SRモデルと比較実験を行った。
論文 参考訳(メタデータ) (2020-07-10T08:08:20Z) - Lightweight image super-resolution with enhanced CNN [82.36883027158308]
強い表現力を持つ深部畳み込みニューラルネットワーク(CNN)は、単一画像超解像(SISR)において印象的な性能を達成した
情報抽出・拡張ブロック(IEEB)、再構築ブロック(RB)、情報精製ブロック(IRB)の3つの連続したサブブロックを持つ軽量拡張SR CNN(LESRCNN)を提案する。
IEEBは階層的低分解能(LR)特徴を抽出し、SISRの深い層上の浅い層の記憶能力を高めるために、得られた特徴を段階的に集約する。
RBはグローバルに拡散することで低周波特徴を高周波特徴に変換する
論文 参考訳(メタデータ) (2020-07-08T18:03:40Z) - X-ModalNet: A Semi-Supervised Deep Cross-Modal Network for
Classification of Remote Sensing Data [69.37597254841052]
我々はX-ModalNetと呼ばれる新しいクロスモーダルディープラーニングフレームワークを提案する。
X-ModalNetは、ネットワークの上部にある高レベルな特徴によって構築されたアップダスタブルグラフ上にラベルを伝搬するため、うまく一般化する。
我々は2つのマルチモーダルリモートセンシングデータセット(HSI-MSIとHSI-SAR)上でX-ModalNetを評価し、いくつかの最先端手法と比較して大幅に改善した。
論文 参考訳(メタデータ) (2020-06-24T15:29:41Z) - Deep Adaptive Inference Networks for Single Image Super-Resolution [72.7304455761067]
シングルイメージ超解像(SISR)は、ディープ畳み込みニューラルネットワーク(CNN)の展開により、近年大きく進歩している。
本稿では,深部SISR(AdaDSR)の適応型推論ネットワークを活用することで,この問題に対処する。
我々のAdaDSRは、SISRモデルをバックボーンとし、画像の特徴とリソース制約を入力として取り、ローカルネットワーク深さのマップを予測する軽量アダプタモジュールを備える。
論文 参考訳(メタデータ) (2020-04-08T10:08:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。