論文の概要: SDCoNet: Saliency-Driven Multi-Task Collaborative Network for Remote Sensing Object Detection
- arxiv url: http://arxiv.org/abs/2601.12507v1
- Date: Sun, 18 Jan 2026 17:36:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-21 22:47:22.657135
- Title: SDCoNet: Saliency-Driven Multi-Task Collaborative Network for Remote Sensing Object Detection
- Title(参考訳): SDCoNet:リモートセンシングオブジェクト検出のための空力駆動型マルチタスク協調ネットワーク
- Authors: Ruo Qi, Linhui Dai, Yusong Qin, Chaolei Yang, Yanshan Li,
- Abstract要約: リモートセンシング画像では、複雑な背景、弱い物体信号、小さな物体スケールが特に正確な検出を困難にしている。
一般的な戦略は、検出前に単一画像の超解像(SR)を統合することである。
SRと検出を暗黙的特徴共有によって結合するSDCoNet(Saliency-Driven Multi-task Collaborative Network)を提案する。
- 参考スコア(独自算出の注目度): 7.016133328153285
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In remote sensing images, complex backgrounds, weak object signals, and small object scales make accurate detection particularly challenging, especially under low-quality imaging conditions. A common strategy is to integrate single-image super-resolution (SR) before detection; however, such serial pipelines often suffer from misaligned optimization objectives, feature redundancy, and a lack of effective interaction between SR and detection. To address these issues, we propose a Saliency-Driven multi-task Collaborative Network (SDCoNet) that couples SR and detection through implicit feature sharing while preserving task specificity. SDCoNet employs the swin transformer-based shared encoder, where hierarchical window-shifted self-attention supports cross-task feature collaboration and adaptively balances the trade-off between texture refinement and semantic representation. In addition, a multi-scale saliency prediction module produces importance scores to select key tokens, enabling focused attention on weak object regions, suppression of background clutter, and suppression of adverse features introduced by multi-task coupling. Furthermore, a gradient routing strategy is introduced to mitigate optimization conflicts. It first stabilizes detection semantics and subsequently routes SR gradients along a detection-oriented direction, enabling the framework to guide the SR branch to generate high-frequency details that are explicitly beneficial for detection. Experiments on public datasets, including NWPU VHR-10-Split, DOTAv1.5-Split, and HRSSD-Split, demonstrate that the proposed method, while maintaining competitive computational efficiency, significantly outperforms existing mainstream algorithms in small object detection on low-quality remote sensing images. Our code is available at https://github.com/qiruo-ya/SDCoNet.
- Abstract(参考訳): リモートセンシング画像では、複雑な背景、弱い物体信号、そして小さな物体スケールが、特に低画質の撮像条件下では、特に正確な検出を困難にしている。
一般的な戦略は、検出前に単一画像の超解像(SR)を統合することであるが、そのようなシリアルパイプラインは、しばしば不整合最適化の目的、特徴の冗長性、SRと検出の間の効果的な相互作用の欠如に悩まされる。
これらの課題に対処するため,タスク特異性を保ちながら,SRと暗黙的特徴共有による検出を結合するSaliency-Driven Multi-task Collaborative Network (SDCoNet)を提案する。
SDCoNetは、スウィントランスフォーマーベースの共有エンコーダを採用し、階層的なウィンドウシフトによる自己アテンションは、クロスタスク機能コラボレーションをサポートし、テクスチャの洗練とセマンティック表現のトレードオフを適応的にバランスさせる。
さらに、マルチスケールサリエンシ予測モジュールは、キートークンの選択に重要なスコアを生成し、弱いオブジェクト領域への注目、バックグラウンドクラッタの抑制、マルチタスク結合による有害な特徴の抑制を可能にする。
さらに、最適化競合を軽減するために勾配ルーティング戦略を導入する。
まず、検出セマンティクスを安定させ、次に、検出指向の方向に沿ってSR勾配をルーティングし、フレームワークがSR分岐をガイドして、検出に有利な高周波の詳細を生成する。
NWPU VHR-10-Split、DOTAv1.5-Split、HRSSD-Splitなどの公開データセットの実験では、提案手法は競合計算効率を維持しながら、低品質のリモートセンシング画像において、既存の主流アルゴリズムよりも大幅に優れていることを示した。
私たちのコードはhttps://github.com/qiruo-ya/SDCoNet.comから入手可能です。
関連論文リスト
- LSFDNet: A Single-Stage Fusion and Detection Network for Ships Using SWIR and LWIR [16.16208006025223]
船舶検出には短波赤外(SWIR)と長波赤外(LWIR)が使用される。
LSFDNetと呼ばれる新しい単一ステージ画像融合検出アルゴリズムを提案する。
このアルゴリズムは画像融合とオブジェクト検出サブタスクネットワーク間の特徴的相互作用を利用する。
2つのデータセット上での単段核融合検出アルゴリズムの優位性を検証した。
論文 参考訳(メタデータ) (2025-07-28T07:13:55Z) - SDS-Net: Shallow-Deep Synergism-detection Network for infrared small target detection [0.18641315013048293]
現在のCNNに基づく赤外小目標検出法は,浅部特徴と深部特徴の均一性を見落としている。
依存関係の関係と融合機構は、マルチレベル機能の相補性を十分に活用できない。
本稿では,マルチレベル特徴表現を効率的にモデル化する浅層深度相乗効果検出ネットワーク(SDS-Net)を提案する。
論文 参考訳(メタデータ) (2025-06-06T12:44:41Z) - RRCANet: Recurrent Reusable-Convolution Attention Network for Infrared Small Target Detection [20.301470710894005]
赤外線小目標検出は、その特徴のために難しい課題である。
最近のCNNベースの手法は、重い特徴抽出と融合モジュールで有望な性能を実現している。
赤外線小ターゲット検出のための再帰的再帰的再畳み込みアテンションネットワーク(RRCA-Net)を提案する。
論文 参考訳(メタデータ) (2025-06-03T03:18:17Z) - Renormalized Connection for Scale-preferred Object Detection in Satellite Imagery [51.83786195178233]
我々は、効率的な特徴抽出の観点から再正規化群理論を実装するために、知識発見ネットワーク(KDN)を設計する。
KDN上の再正規化接続(RC)は、マルチスケール特徴の「相乗的焦点」を可能にする。
RCはFPNベースの検出器のマルチレベル特徴の分割・対数機構を幅広いスケールで予測されたタスクに拡張する。
論文 参考訳(メタデータ) (2024-09-09T13:56:22Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Learning Feature Matching via Matchable Keypoint-Assisted Graph Neural
Network [52.29330138835208]
画像のペア間の局所的な特徴の正確なマッチングは、コンピュータビジョンの課題である。
従来の研究では、注意に基づくグラフニューラルネットワーク(GNN)と、画像内のキーポイントに完全に接続されたグラフを使用するのが一般的だった。
本稿では,非繰り返しキーポイントをバイパスし,マッチング可能なキーポイントを利用してメッセージパッシングを誘導する,疎注意に基づくGNNアーキテクチャであるMaKeGNNを提案する。
論文 参考訳(メタデータ) (2023-07-04T02:50:44Z) - RRNet: Relational Reasoning Network with Parallel Multi-scale Attention
for Salient Object Detection in Optical Remote Sensing Images [82.1679766706423]
光リモートセンシング画像(RSI)のためのSODは、光学RSIから視覚的に特徴的な物体や領域を探索・抽出することを目的としている。
光学RSIにおけるSODに並列なマルチスケールアテンションを持つリレーショナル推論ネットワークを提案する。
提案するRRNetは,既存の最先端SODコンペティタよりも質的,定量的に優れている。
論文 参考訳(メタデータ) (2021-10-27T07:18:32Z) - Anchor-free Small-scale Multispectral Pedestrian Detection [88.7497134369344]
適応型単一段アンカーフリーベースアーキテクチャにおける2つのモードの効果的かつ効率的な多重スペクトル融合法を提案する。
我々は,直接的境界ボックス予測ではなく,対象の中心と規模に基づく歩行者表現の学習を目指す。
その結果,小型歩行者の検出における本手法の有効性が示唆された。
論文 参考訳(メタデータ) (2020-08-19T13:13:01Z) - Resolution Adaptive Networks for Efficient Inference [53.04907454606711]
本稿では,低分解能表現が「容易」な入力を分類するのに十分である,という直感に触発された新しいレゾリューション適応ネットワーク(RANet)を提案する。
RANetでは、入力画像はまず、低解像度表現を効率的に抽出する軽量サブネットワークにルーティングされる。
ネットワーク内の高解像度パスは、"ハード"サンプルを認識する能力を維持している。
論文 参考訳(メタデータ) (2020-03-16T16:54:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。