論文の概要: Dual-Stream Spectral Decoupling Distillation for Remote Sensing Object Detection
- arxiv url: http://arxiv.org/abs/2512.04413v1
- Date: Thu, 04 Dec 2025 03:18:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-05 21:11:45.968975
- Title: Dual-Stream Spectral Decoupling Distillation for Remote Sensing Object Detection
- Title(参考訳): リモートセンシング対象検出のためのデュアルストリームスペクトルデカップリング蒸留
- Authors: Xiangyi Gao, Danpei Zhao, Bo Yuan, Wentao Li,
- Abstract要約: 本稿では,Dual-Stream Spectral Decoupling Distillation (DS2D2) というアーキテクチャに依存しない蒸留法を提案する。
具体的には、DS2D2は、スペクトル分解に基礎を置く明示的および暗黙的な蒸留を統合する。
微妙な生徒・教師の特徴的相違に隠れた暗黙の知識が,検出頭部によって活性化される際の予測に大きく影響を及ぼすことを示した。
- 参考スコア(独自算出の注目度): 13.198666977664109
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Knowledge distillation is an effective and hardware-friendly method, which plays a key role in lightweighting remote sensing object detection. However, existing distillation methods often encounter the issue of mixed features in remote sensing images (RSIs), and neglect the discrepancies caused by subtle feature variations, leading to entangled knowledge confusion. To address these challenges, we propose an architecture-agnostic distillation method named Dual-Stream Spectral Decoupling Distillation (DS2D2) for universal remote sensing object detection tasks. Specifically, DS2D2 integrates explicit and implicit distillation grounded in spectral decomposition. Firstly, the first-order wavelet transform is applied for spectral decomposition to preserve the critical spatial characteristics of RSIs. Leveraging this spatial preservation, a Density-Independent Scale Weight (DISW) is designed to address the challenges of dense and small object detection common in RSIs. Secondly, we show implicit knowledge hidden in subtle student-teacher feature discrepancies, which significantly influence predictions when activated by detection heads. This implicit knowledge is extracted via full-frequency and high-frequency amplifiers, which map feature differences to prediction deviations. Extensive experiments on DIOR and DOTA datasets validate the effectiveness of the proposed method. Specifically, on DIOR dataset, DS2D2 achieves improvements of 4.2% in AP50 for RetinaNet and 3.8% in AP50 for Faster R-CNN, outperforming existing distillation approaches. The source code will be available at https://github.com/PolarAid/DS2D2.
- Abstract(参考訳): 知識蒸留は、リモートセンシングオブジェクト検出の軽量化において重要な役割を果たす、効果的でハードウェアフレンドリな方法である。
しかし, 従来の蒸留法では, リモートセンシング画像(RSI)の混合特性が問題視されることが多く, 微妙な特徴変化による相違が無視され, 知識の混乱が引き起こされる。
これらの課題に対処するために,Dual-Stream Spectral Decoupling Distillation (DS2D2) というアーキテクチャに依存しない蒸留手法を提案する。
具体的には、DS2D2は、スペクトル分解に基礎を置く明示的および暗黙的な蒸留を統合する。
まず、スペクトル分解に1次ウェーブレット変換を適用し、RSIの臨界空間特性を保存する。
この空間保存を活用して、密度独立スケールウェイト(DISW)は、RSIに共通する密度と小さな物体検出の課題に対処するように設計されている。
第二に,微妙な生徒・教師の特徴的相違に隠れた暗黙的な知識が,検出頭部によって活性化された際の予測に大きく影響を及ぼすことを示した。
この暗黙の知識はフル周波数増幅器と高周波増幅器を通して抽出され、特徴差を予測偏差にマップする。
DIORとDOTAデータセットの大規模な実験により,提案手法の有効性が検証された。
具体的には、DIORデータセット上では、DS2D2は、RetinaNetのAP50で4.2%、R-CNNのAP50で3.8%の改善を実現し、既存の蒸留手法よりも優れている。
ソースコードはhttps://github.com/PolarAid/DS2D2で入手できる。
関連論文リスト
- DenoDet V2: Phase-Amplitude Cross Denoising for SAR Object Detection [49.9059941674531]
本稿では,バンドワイド相互変調機構を用いて,振幅と位相情報の相補的性質を利用するDenoDet V2を提案する。
DenoDet V2は、DenoDet V1と比較してSARDet-100Kデータセットの大幅な0.8%改善を実現し、モデルの複雑さを半分に削減した。
論文 参考訳(メタデータ) (2025-08-12T23:24:20Z) - MutDet: Mutually Optimizing Pre-training for Remote Sensing Object Detection [36.478530086163744]
本研究では,MutDetと呼ばれるリモートセンシングオブジェクト検出のための,Mutally最適化事前学習フレームワークを提案する。
MutDetはオブジェクトの埋め込みを融合し、検出器は最後のエンコーダ層に双方向に機能し、情報インタラクションを強化する。
様々な環境での実験は、新しい最先端の転送性能を示している。
論文 参考訳(メタデータ) (2024-07-13T15:28:15Z) - Simplifying Two-Stage Detectors for On-Device Inference in Remote Sensing [0.7305342793164903]
本研究では,2段階物体検出器のモデル簡易化手法を提案する。
本手法は,DOTAv1.5データセットの2.1%以内の精度で計算コストを61.2%まで削減する。
論文 参考訳(メタデータ) (2024-04-11T00:45:10Z) - DMSSN: Distilled Mixed Spectral-Spatial Network for Hyperspectral Salient Object Detection [12.823338405434244]
HSOD(Hyperspectral Salient Object Detection)は,様々な用途において有望である。
特徴抽出過程における高スペクトル画像の特徴的特性(HSI)は,従来は不十分であった。
我々は、MSST(Distilled Spectral-Spatial Transformer)を含むDMSSN(Distilled Mixed Spectral-Spatial Network)を提案する。
この分野でのデータ不足の問題に対処するため、大規模なHSODデータセットHSOD-BITを作成しました。
論文 参考訳(メタデータ) (2024-03-31T14:04:57Z) - Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - Object-centric Cross-modal Feature Distillation for Event-based Object
Detection [87.50272918262361]
RGB検出器は、イベントデータのばらつきと視覚的詳細の欠如により、イベントベースの検出器よりも優れている。
これら2つのモード間の性能ギャップを縮めるための新しい知識蒸留手法を開発した。
対象中心蒸留により,イベントベースの学生物体検出装置の性能が大幅に向上することを示す。
論文 参考訳(メタデータ) (2023-11-09T16:33:08Z) - Efficient Object Detection in Optical Remote Sensing Imagery via
Attention-based Feature Distillation [29.821082433621868]
本研究では,物体検出のための注意型特徴蒸留(AFD)を提案する。
本稿では,背景要素と前景要素を効果的に区別するマルチインスタンスアテンション機構を提案する。
AFDは、他の最先端モデルの性能を効率よく達成する。
論文 参考訳(メタデータ) (2023-10-28T11:15:37Z) - Boosting 3D Object Detection by Simulating Multimodality on Point Clouds [51.87740119160152]
本稿では,LiDAR 画像検出器に追従する特徴や応答をシミュレートすることで,単一モダリティ (LiDAR) 3次元物体検出器を高速化する新しい手法を提案する。
このアプローチでは、単一モダリティ検出器をトレーニングする場合のみ、LiDARイメージデータを必要とし、十分にトレーニングされた場合には、推論時にのみLiDARデータが必要である。
nuScenesデータセットの実験結果から,本手法はSOTA LiDARのみの3D検出器よりも優れていることがわかった。
論文 参考訳(メタデータ) (2022-06-30T01:44:30Z) - The KFIoU Loss for Rotated Object Detection [115.334070064346]
本稿では,SkewIoU損失とトレンドレベルアライメントを両立できる近似的損失を考案する上で,有効な方法の1つとして論じる。
具体的には、対象をガウス分布としてモデル化し、SkewIoUのメカニズムを本質的に模倣するためにカルマンフィルタを採用する。
KFIoUと呼ばれる新たな損失は実装が容易で、正確なSkewIoUよりもうまく動作する。
論文 参考訳(メタデータ) (2022-01-29T10:54:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。