論文の概要: Noise2Map: End-to-End Diffusion Model for Semantic Segmentation and Change Detection
- arxiv url: http://arxiv.org/abs/2604.27889v1
- Date: Thu, 30 Apr 2026 14:06:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.124353
- Title: Noise2Map: End-to-End Diffusion Model for Semantic Segmentation and Change Detection
- Title(参考訳): Noise2Map:セマンティックセグメンテーションと変化検出のためのエンドツーエンド拡散モデル
- Authors: Ali Shibli, Andrea Nascetti, Yifang Ban,
- Abstract要約: Noise2Mapは、差別学習のための統合拡散ベースのフレームワークである。
タスク固有のノイズスケジュールとタイムステップ条件を用いて、セマンティックマップや変更マップを予測する。
私たちのアーキテクチャは、共有バックボーンを通じて、タスク(SSとCD)の両方をサポートします。
- 参考スコア(独自算出の注目度): 0.9558392439655014
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Semantic segmentation and change detection are two fundamental challenges in remote sensing, requiring models to capture either spatial semantics or temporal differences from satellite imagery. Existing deep learning models often struggle with temporal inconsistencies or in capturing fine-grained spatial structures, require extensive pretraining, and offer limited interpretability - especially in real-world remote sensing scenarios. Recent advances in diffusion models show that Gaussian noise can be systematically leveraged to learn expressive data representations through denoising. Motivated by this, we investigate whether the noise process in diffusion models can be effectively utilized for discriminative tasks. We propose Noise2Map, a unified diffusion-based framework that repurposes the denoising process for fast, end-to-end discriminative learning. Unlike prior work that uses diffusion only for generation or feature extraction, Noise2Map directly predicts semantic or change maps using task-specific noise schedules and timestep conditioning, avoiding the costly sampling procedures of traditional diffusion models. The model is pretrained via self-supervised denoising and fine-tuned with supervision, enabling both interpretability and robustness. Our architecture supports both tasks (SS and CD) through a shared backbone and task-specific noise schedulers. Extensive evaluations on the SpaceNet7, WHU, and xView2 buildings damaged by wildfires datasets demonstrate that Noise2Map ranks on average 1st among seven models on semantic segmentation and 1st on change detection by a cross-dataset rank metric (average F1 primary, IoU tie-break). Ablation studies highlight the robustness of our model against different training noise schedulers and timestep control in the diffusion process, as well as the ability of the model to perform multi-task learning.
- Abstract(参考訳): セマンティックセグメンテーションと変化検出はリモートセンシングにおける2つの基本的な課題であり、衛星画像から空間的意味論または時間的差異を捉える必要がある。
既存のディープラーニングモデルは、時間的不整合やきめ細かい空間構造を捉え、広範囲の事前トレーニングを必要とし、特に現実世界のリモートセンシングシナリオにおいて、限定的な解釈性を提供する。
拡散モデルの最近の進歩は、ガウスノイズを体系的に利用して表現的データ表現を学ぶことができることを示している。
そこで本研究では,拡散モデルの雑音過程を識別的タスクに有効に活用できるかどうかを考察する。
本研究では,高速でエンドツーエンドな識別学習のためのデノナイジングプロセスを再利用した統合拡散ベースフレームワークであるNoss2Mapを提案する。
生成や特徴抽出にのみ拡散を利用する以前の作業とは異なり、Noss2Mapはタスク固有のノイズスケジュールとタイムステップ条件を使って、意味や変化マップを直接予測し、従来の拡散モデルの高価なサンプリング手順を避ける。
このモデルは、自己監督された装飾によって事前訓練され、監督によって微調整され、解釈可能性と堅牢性の両方を可能にする。
我々のアーキテクチャは、共有バックボーンとタスク固有のノイズスケジューラを通じて、タスク(SSとCD)の両方をサポートします。
SpaceNet7、WHU、xView2の建物が山火事のデータセットで損傷し、ノイズ2Mapはセマンティックセグメンテーションのモデル7つの中で平均1位、変更検出はクロスデータセットのランク(平均F1プライマリ、IoUタイブレーク)で1位となった。
アブレーション研究では、異なるトレーニングノイズスケジューラに対するモデルの堅牢性、拡散過程におけるタイムステップ制御、マルチタスク学習を行うモデルの能力を強調した。
関連論文リスト
- A Gift from the Integration of Discriminative and Diffusion-based Generative Learning: Boundary Refinement Remote Sensing Semantic Segmentation [8.690665954055476]
本稿では,IDGBRフレームワークにおける識別学習と生成学習の統合を提案する。
フレームワークはまず、識別バックボーンモデルを用いて粗いセグメンテーションマップを生成する。
この地図と原画像とを条件付きガイダンスネットワークに入力し、ガイダンス表現を共同で学習する。
論文 参考訳(メタデータ) (2025-07-02T10:47:59Z) - Frequency-Guided Diffusion Model with Perturbation Training for Skeleton-Based Video Anomaly Detection [43.49146665908238]
ビデオ異常検出(VAD)はコンピュータビジョンにおいて不可欠だが複雑なオープンセットタスクである。
摂動トレーニングを用いた新しい周波数誘導拡散モデルを提案する。
2次元離散コサイン変換(DCT)を用いて、高周波(局所)と低周波(球状)の運動成分を分離する。
論文 参考訳(メタデータ) (2024-12-04T05:43:53Z) - Impact of Noisy Supervision in Foundation Model Learning [91.56591923244943]
本論文は、事前学習データセットにおけるノイズの性質を包括的に理解し分析する最初の研究である。
雑音の悪影響を緩和し、一般化を改善するため、特徴空間に適応するチューニング法(NMTune)を提案する。
論文 参考訳(メタデータ) (2024-03-11T16:22:41Z) - DiffSED: Sound Event Detection with Denoising Diffusion [70.18051526555512]
生成学習の観点からSED問題を再構築する。
具体的には,騒音拡散過程において,雑音のある提案から音の時間境界を生成することを目的としている。
トレーニング中は,ノイズの多い遅延クエリを基本バージョンに変換することで,ノイズ発生過程の逆転を学習する。
論文 参考訳(メタデータ) (2023-08-14T17:29:41Z) - Adversarial Training of Denoising Diffusion Model Using Dual
Discriminators for High-Fidelity Multi-Speaker TTS [0.0]
拡散モデルは確率論的アプローチにより高品質なデータを生成することができる。
これは、多くの時間ステップを必要とするため、生成速度が遅くなるという欠点に悩まされる。
本稿では、逆過程の分布を学習する拡散判別器と、生成されたデータの分布を学習するスペクトログラム判別器の2つの識別器を用いた音声合成モデルを提案する。
論文 参考訳(メタデータ) (2023-08-03T07:22:04Z) - Denoising Diffusion Semantic Segmentation with Mask Prior Modeling [61.73352242029671]
本稿では,従来の識別的アプローチのセマンティックセグメンテーション品質を,デノナイズ拡散生成モデルでモデル化したマスクを用いて改善することを提案する。
市販セグメンタを用いた先行モデルの評価を行い,ADE20KとCityscapesの実験結果から,本手法が競争力のある定量的性能を実現することを示す。
論文 参考訳(メタデータ) (2023-06-02T17:47:01Z) - DDPM-CD: Denoising Diffusion Probabilistic Models as Feature Extractors
for Change Detection [31.125812018296127]
Deno Diffusion Probabilistic Model (DDPM) の事前学習による変化検出のための新しいアプローチを提案する。
DDPMは、訓練画像を徐々にマルコフ連鎖を用いてガウス分布に変換することにより、トレーニングデータ分布を学習する。
推論(サンプリング)中に、トレーニング分布に近い多様なサンプルセットを生成することができる。
LEVIR-CD, WHU-CD, DSIFN-CD, CDDデータセットを用いて行った実験により,提案手法は既存の変化検出法よりもF1スコアで大幅に優れており, I。
論文 参考訳(メタデータ) (2022-06-23T17:58:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。