論文の概要: Learning Where to Focus: Density-Driven Guidance for Detecting Dense Tiny Objects
- arxiv url: http://arxiv.org/abs/2512.22949v1
- Date: Sun, 28 Dec 2025 14:27:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-30 22:37:30.294589
- Title: Learning Where to Focus: Density-Driven Guidance for Detecting Dense Tiny Objects
- Title(参考訳): 集中するべき場所を学習する: 細い物体を検知するための密度駆動誘導
- Authors: Zhicheng Zhao, Xuanang Fan, Lingma Sun, Chenglong Li, Jin Tang,
- Abstract要約: 高解像度のリモートセンシング画像は、ますます小さな物体の密集したクラスターを含んでいる。
DRMNetは、適応的な特徴学習を導くために、空間的事前条件として密度マップを使用する。
AI-TODデータセットとDTODデータセットの実験では、DRMNetが最先端のメソッドを上回ることが示されている。
- 参考スコア(独自算出の注目度): 17.95546795729106
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: High-resolution remote sensing imagery increasingly contains dense clusters of tiny objects, the detection of which is extremely challenging due to severe mutual occlusion and limited pixel footprints. Existing detection methods typically allocate computational resources uniformly, failing to adaptively focus on these density-concentrated regions, which hinders feature learning effectiveness. To address these limitations, we propose the Dense Region Mining Network (DRMNet), which leverages density maps as explicit spatial priors to guide adaptive feature learning. First, we design a Density Generation Branch (DGB) to model object distribution patterns, providing quantifiable priors that guide the network toward dense regions. Second, to address the computational bottleneck of global attention, our Dense Area Focusing Module (DAFM) uses these density maps to identify and focus on dense areas, enabling efficient local-global feature interaction. Finally, to mitigate feature degradation during hierarchical extraction, we introduce a Dual Filter Fusion Module (DFFM). It disentangles multi-scale features into high- and low-frequency components using a discrete cosine transform and then performs density-guided cross-attention to enhance complementarity while suppressing background interference. Extensive experiments on the AI-TOD and DTOD datasets demonstrate that DRMNet surpasses state-of-the-art methods, particularly in complex scenarios with high object density and severe occlusion.
- Abstract(参考訳): 高解像度のリモートセンシング画像は、小さな物体の密集した集合体をますます含んでいるが、その検出は、重度の相互閉塞と限られたピクセルフットプリントのため、非常に難しい。
既存の検出方法は一般に計算資源を均一に割り当てるが、これらの密度集中領域に適応的に焦点を合わせず、特徴学習の有効性を妨げている。
これらの制約に対処するため,適応的な特徴学習を導くために,密度マップを空間的事前条件として活用するDense Region Mining Network (DRMNet)を提案する。
まず、オブジェクトの分布パターンをモデル化するための密度生成ブランチ(DGB)を設計し、ネットワークを高密度領域へ導く定量的な事前情報を提供する。
第二に、世界的注目の計算的ボトルネックに対処するために、Dense Area Focusing Module (DAFM)は、これらの密度マップを使用して、密集領域を特定し、集中させ、効率的な局所的特徴相互作用を可能にする。
最後に,階層抽出時の特徴劣化を軽減するために,Dual Filter Fusion Module (DFFM)を導入する。
離散コサイン変換を用いてマルチスケール特徴を高周波・低周波成分に分解し, 背景干渉を抑えながら相補性を高めるために密度誘導クロスアテンションを行う。
AI-TODデータセットとDTODデータセットに関する大規模な実験は、DRMNetが最先端の手法を超越していることを示している。
関連論文リスト
- Graph-Based Uncertainty Modeling and Multimodal Fusion for Salient Object Detection [12.743278093269325]
動的不確実性伝播とマルチモーダル協調推論ネットワーク(DUP-MCRNet)を提案する。
DUGCは空間意味距離に基づいて構築されたスパースグラフを通じて層間の不確実性を伝播するように設計されている。
MCFは学習可能なモダリティゲーティングウェイトを使用して、RGB、深さ、エッジの特徴の注意マップを重み付けする。
論文 参考訳(メタデータ) (2025-08-28T04:31:48Z) - DenSe-AdViT: A novel Vision Transformer for Dense SAR Object Detection [6.132395411070981]
視覚変換器(ViT)は合成開口レーダ(SAR)画像の物体検出において顕著な結果を得た。
しかし、マルチスケールの局所的な特徴の抽出に苦慮し、小さなターゲットを検出する性能が制限された。
本稿では,高密度SARターゲット検出のための適応トークン(DenSe-AdViT)を用いた密度感性視覚変換器を提案する。
論文 参考訳(メタデータ) (2025-04-18T11:25:49Z) - Density-based Object Detection in Crowded Scenes [54.037103707572136]
密度誘導型アンカー(DGA)と密度誘導型NMS(DG-NMS)を提案する。
DGAは最適なアンカー割り当てとリウィーリング、および適応的なNMSを計算する。
Citypersonsデータセットを用いたCrowdHumanデータセットの挑戦実験により、提案した密度誘導検出器は、混雑に対して有効で堅牢であることが示された。
論文 参考訳(メタデータ) (2025-04-14T02:41:49Z) - High-Precision Dichotomous Image Segmentation via Depth Integrity-Prior and Fine-Grained Patch Strategy [23.431898388115044]
高精細度画像から細粒度オブジェクトを抽出する作業として,DIS(High-precision Dichotomous Image segmentation)がある。
既存の方法はジレンマに直面し、非拡散法は効率的に機能するが、弱い意味論による誤検出や誤検出に悩まされる。
単眼深度推定モデルから擬似深度情報を得ると,本質的な意味理解が得られる。
論文 参考訳(メタデータ) (2025-03-08T07:02:28Z) - Towards the Uncharted: Density-Descending Feature Perturbation for Semi-supervised Semantic Segmentation [51.66997548477913]
本稿では,DDFP(Dedentity-Descending Feature Perturbation)という特徴レベルの一貫性学習フレームワークを提案する。
半教師付き学習における低密度分離仮定にインスパイアされた私たちの重要な洞察は、特徴密度はセグメンテーション分類器が探索する最も有望な方向の光を放つことができるということである。
提案したDFFPは、機能レベルの摂動に関する他の設計よりも優れており、Pascal VOCとCityscapesのデータセット上でのアートパフォーマンスの状態を示している。
論文 参考訳(メタデータ) (2024-03-11T06:59:05Z) - Density-Based Clustering with Kernel Diffusion [59.4179549482505]
単位$d$次元ユークリッド球のインジケータ関数に対応するナイーブ密度は、密度に基づくクラスタリングアルゴリズムで一般的に使用される。
局所分布特性と滑らかさの異なるデータに適応する新しいカーネル拡散密度関数を提案する。
論文 参考訳(メタデータ) (2021-10-11T09:00:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。