論文の概要: Weakly Supervised Change Detection via Knowledge Distillation and
Multiscale Sigmoid Inference
- arxiv url: http://arxiv.org/abs/2403.05796v1
- Date: Sat, 9 Mar 2024 05:01:51 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 12:21:57.612962
- Title: Weakly Supervised Change Detection via Knowledge Distillation and
Multiscale Sigmoid Inference
- Title(参考訳): 知識蒸留とマルチスケールシグモイド推論による弱修正変化検出
- Authors: Binghao Lu, Caiwen Ding, Jinbo Bi, Dongjin Song
- Abstract要約: 我々は知識蒸留とマルチスケールシグモイド推論(KD-MSI)による弱教師付き変化検出技術を開発した。
提案手法は,その統合学習戦略により,最先端技術よりも優れていた。
- 参考スコア(独自算出の注目度): 26.095501974608908
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Change detection, which aims to detect spatial changes from a pair of
multi-temporal images due to natural or man-made causes, has been widely
applied in remote sensing, disaster management, urban management, etc. Most
existing change detection approaches, however, are fully supervised and require
labor-intensive pixel-level labels. To address this, we develop a novel weakly
supervised change detection technique via Knowledge Distillation and Multiscale
Sigmoid Inference (KD-MSI) that leverages image-level labels. In our approach,
the Class Activation Maps (CAM) are utilized not only to derive a change
probability map but also to serve as a foundation for the knowledge
distillation process. This is done through a joint training strategy of the
teacher and student networks, enabling the student network to highlight
potential change areas more accurately than teacher network based on
image-level labels. Moreover, we designed a Multiscale Sigmoid Inference (MSI)
module as a post processing step to further refine the change probability map
from the trained student network. Empirical results on three public datasets,
i.e., WHU-CD, DSIFN-CD, and LEVIR-CD, demonstrate that our proposed technique,
with its integrated training strategy, significantly outperforms the
state-of-the-art.
- Abstract(参考訳): 自然または人為的な原因による一対の多時期画像から空間変化を検出することを目的とした変化検出は,リモートセンシング,災害管理,都市管理などに広く適用されてきた。
しかし、既存のほとんどの変更検出アプローチは、完全に監視されており、労働集約的なピクセルレベルラベルを必要とする。
そこで我々は,画像レベルのラベルを利用した知識蒸留とマルチスケールシグモイド推論(KD-MSI)による,弱い教師付き変化検出手法を開発した。
本手法では, クラス活性化マップ(CAM)を用いて, 変化確率マップを導出するだけでなく, 知識蒸留プロセスの基盤としても機能する。
これは教師ネットワークと学生ネットワークの共同トレーニング戦略を通じて行われ、学生ネットワークはイメージレベルのラベルに基づいて教師ネットワークよりも、潜在的な変化領域を正確に強調することができる。
さらに,学習者ネットワークからの変更確率マップをさらに改良するため,マルチスケールシグモイド推論(MSI)モジュールをポスト処理ステップとして設計した。
WHU-CD, DSIFN-CD, LEVIR-CDの3つの公開データセットに対する実証的な結果から, 提案手法は, 総合的なトレーニング戦略により, 最先端の技術を著しく上回ることを示す。
関連論文リスト
- HANet: A Hierarchical Attention Network for Change Detection With Bitemporal Very-High-Resolution Remote Sensing Images [6.890268321645873]
本研究では,変化情報の追加を含まないことに基づく,段階的前景バランスサンプリング戦略を提案する。
この戦略は、初期のトレーニングプロセス中に変更したピクセルの特徴を正確に学習するのに役立つ。
また,階層型注意ネットワーク(HANet)を設計し,マルチスケール機能の統合と詳細機能の改良を図る。
論文 参考訳(メタデータ) (2024-04-14T08:01:27Z) - Direct Distillation between Different Domains [97.39470334253163]
異なるドメイン間の直接蒸留(4Ds)と呼ばれる新しいワンステージ手法を提案する。
まず、Fourier変換に基づいて学習可能なアダプタを設計し、ドメイン固有の知識からドメイン不変知識を分離する。
次に、価値あるドメイン不変知識を学生ネットワークに転送するための融合活性化機構を構築する。
論文 参考訳(メタデータ) (2024-01-12T02:48:51Z) - Affine-Consistent Transformer for Multi-Class Cell Nuclei Detection [76.11864242047074]
本稿では, 原子核位置を直接生成する新しいアフィン一貫性変換器 (AC-Former) を提案する。
本稿では,AAT (Adaptive Affine Transformer) モジュールを導入し,ローカルネットワークトレーニングのためのオリジナル画像をワープするための重要な空間変換を自動学習する。
実験結果から,提案手法は様々なベンチマークにおいて既存の最先端アルゴリズムを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2023-10-22T02:27:02Z) - Towards Hierarchical Regional Transformer-based Multiple Instance
Learning [2.16656895298847]
本稿では,従来の学習注意機構を,地域的な視覚変換装置にインスパイアされた自己認識機構に置き換える,トランスフォーマーに基づくマルチインスタンス学習手法を提案する。
本稿では,地域パッチ情報を融合してスライドレベルの予測を導出し,この地域アグリゲーションをどのように積み重ねて,異なる距離における特徴を階層的に処理するかを示す。
本手法は,2つの病理組織学的データセットのベースライン上での性能を著しく向上させることができ,今後の研究に向けての有望な方向に向かっている。
論文 参考訳(メタデータ) (2023-08-24T08:19:15Z) - Background-Mixed Augmentation for Weakly Supervised Change Detection [18.319961338185458]
変化検出(CD)とは、背景の変化(環境の変化など)からオブジェクトの変更(オブジェクトの欠落や出現)を分離することである。
近年の深層学習に基づく手法は,ペア学習を用いた新しいネットワークアーキテクチャや最適化戦略を開発している。
我々は,画像レベルのラベルのみを必要とする,弱教師付きトレーニングアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-11-21T14:12:53Z) - Impact of a DCT-driven Loss in Attention-based Knowledge-Distillation
for Scene Recognition [64.29650787243443]
本稿では, アクティベーションマップの2次元周波数変換を転送前に提案し, 解析する。
この戦略は、シーン認識などのタスクにおける知識伝達可能性を高める。
我々は、この論文で使われているトレーニングおよび評価フレームワークを、http://www.vpu.eps.uam.es/publications/DCTBasedKDForSceneRecognitionで公開しています。
論文 参考訳(メタデータ) (2022-05-04T11:05:18Z) - SATS: Self-Attention Transfer for Continual Semantic Segmentation [50.51525791240729]
連続的なセマンティックセグメンテーションは、連続的な分類学習と同じ破滅的な忘れの問題に悩まされる。
本研究では,各画像内の要素間の関係について,知識に関連する新しいタイプの情報伝達を提案する。
関係情報は、トランスフォーマースタイルのセグメンテーションモデルにおける自己アテンションマップから有効に得ることができる。
論文 参考訳(メタデータ) (2022-03-15T06:09:28Z) - Activation to Saliency: Forming High-Quality Labels for Unsupervised
Salient Object Detection [54.92703325989853]
本稿では,高品質なサリエンシキューを効果的に生成する2段階アクティベーション・ツー・サリエンシ(A2S)フレームワークを提案する。
トレーニングプロセス全体において、私たちのフレームワークにヒューマンアノテーションは関与していません。
本フレームワークは,既存のUSOD法と比較して高い性能を示した。
論文 参考訳(メタデータ) (2021-12-07T11:54:06Z) - Unsupervised Change Detection in Satellite Images with Generative
Adversarial Network [20.81970476609318]
本稿では,GAN(Generative Adversarial Network)を用いた新たな変更検出フレームワークを提案する。
最適化されたGANモデルは、変更を容易に発見できる良質なコアギスター画像を生成し、その後、比較戦略を通じて変更マップを提示する。
論文 参考訳(メタデータ) (2020-09-08T10:26:04Z) - Semantics-aware Adaptive Knowledge Distillation for Sensor-to-Vision
Action Recognition [131.6328804788164]
本稿では,視覚・センサ・モダリティ(動画)における行動認識を強化するためのフレームワーク,Semantics-Aware Adaptive Knowledge Distillation Networks (SAKDN)を提案する。
SAKDNは複数のウェアラブルセンサーを教師のモダリティとして使用し、RGB動画を学生のモダリティとして使用している。
論文 参考訳(メタデータ) (2020-09-01T03:38:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。