論文の概要: Small Object Detection in Complex Backgrounds with Multi-Scale Attention and Global Relation Modeling
- arxiv url: http://arxiv.org/abs/2603.03788v1
- Date: Wed, 04 Mar 2026 06:57:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-05 21:29:15.211661
- Title: Small Object Detection in Complex Backgrounds with Multi-Scale Attention and Global Relation Modeling
- Title(参考訳): マルチスケールアテンションと大域的関係モデリングを用いた複雑な背景における小物体検出
- Authors: Wenguang Tao, Xiaotian Wang, Tian Yan, Yi Wang, Jie Yan,
- Abstract要約: 複雑な背景下での小さなオブジェクト検出は、深刻な特徴劣化、弱いセマンティック表現、不正確なローカライゼーションのために難しい課題である。
既存の検出フレームワークは主に汎用オブジェクト用に設計されている。
小型オブジェクト検出に適した多層機能拡張とグローバルリレーショナルモデリングフレームワークを提案する。
- 参考スコア(独自算出の注目度): 8.24377869183113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Small object detection under complex backgrounds remains a challenging task due to severe feature degradation, weak semantic representation, and inaccurate localization caused by downsampling operations and background interference. Existing detection frameworks are mainly designed for general objects and often fail to explicitly address the unique characteristics of small objects, such as limited structural cues and strong sensitivity to localization errors. In this paper, we propose a multi-level feature enhancement and global relation modeling framework tailored for small object detection. Specifically, a Residual Haar Wavelet Downsampling module is introduced to preserve fine-grained structural details by jointly exploiting spatial-domain convolutional features and frequency-domain representations. To enhance global semantic awareness and suppress background noise, a Global Relation Modeling module is employed to capture long-range dependencies at high-level feature stages. Furthermore, a Cross-Scale Hybrid Attention module is designed to establish sparse and aligned interactions across multi-scale features, enabling effective fusion of high-resolution details and high-level semantic information with reduced computational overhead. Finally, a Center-Assisted Loss is incorporated to stabilize training and improve localization accuracy for small objects. Extensive experiments conducted on the large-scale RGBT-Tiny benchmark demonstrate that the proposed method consistently outperforms existing state-of-the-art detectors under both IoU-based and scale-adaptive evaluation metrics. These results validate the effectiveness and robustness of the proposed framework for small object detection in complex environments.
- Abstract(参考訳): 複雑な背景下での小さなオブジェクト検出は、深刻な特徴劣化、弱いセマンティック表現、ダウンサンプリング操作とバックグラウンド干渉による不正確なローカライゼーションのために、依然として難しい課題である。
既存の検出フレームワークは主に汎用オブジェクト用に設計されており、構造的キューの制限や局所化エラーに対する強い感度など、小さなオブジェクトのユニークな特徴に明示的に対処することができないことが多い。
本稿では,小物体検出に適した多レベル特徴強調およびグローバル関係モデリングフレームワークを提案する。
具体的には、空間領域の畳み込み特徴と周波数領域の表現を併用することにより、微細な構造の詳細を保存するために、残留ハールウェーブレットダウンサンプリングモジュールを導入する。
グローバルな意味認識を高め、背景雑音を抑制するため、Global Relation Modelingモジュールは、高レベルの特徴段階における長距離依存関係をキャプチャするために使用される。
さらに、クロススケールハイブリッドアテンションモジュールは、マルチスケール機能間のスパースとアライメントの相互作用を確立し、計算オーバーヘッドを低減した高解像度の詳細と高レベルのセマンティック情報を効果的に融合させるように設計されている。
最後に、訓練を安定させ、小さな物体の局所化精度を向上させるために、Center-Assisted Lossが組み込まれている。
大規模RGBT-Tinyベンチマークで行った大規模な実験により、提案手法はIoUとスケール適応評価の両方で既存の最先端検出器を一貫して上回ることを示した。
これらの結果から,複雑な環境下での微小物体検出のためのフレームワークの有効性とロバスト性について検証した。
関連論文リスト
- IoUCert: Robustness Verification for Anchor-based Object Detectors [58.35703549470485]
アンカーベースオブジェクト検出のための新しい形式検証フレームワークである sc sf IoUCert を紹介する。
本手法は, SSD, YOLOv2, YOLOv3など, リアルなアンカーベースモデルの様々な入力摂動に対する検証を可能にする。
論文 参考訳(メタデータ) (2026-03-03T14:36:46Z) - Noise-Robust Tiny Object Localization with Flows [63.60972031108944]
フレキシブルなエラーモデリングと不確実性誘導最適化に正規化フローを活用するノイズローバストローカライゼーションフレームワークを提案する。
本手法は,フローベース誤差モデルを用いて,複雑な非ガウス予測分布を抽出し,ノイズの多い監視下で頑健な学習を可能にする。
不確実性を考慮した勾配変調機構は、トレーニングを安定化しながら過度な適合を緩和し、高不確実でノイズの強いサンプルからの学習をさらに抑制する。
論文 参考訳(メタデータ) (2026-01-02T09:16:55Z) - Source-Free Object Detection with Detection Transformer [59.33653163035064]
Source-Free Object Detection (SFOD) は、ソースデータにアクセスすることなく、ソースドメインから教師なしのターゲットドメインへの知識転送を可能にする。
ほとんどの既存のSFODアプローチは、より高速なR-CNNのような従来のオブジェクト検出(OD)モデルに限られるか、新しいODアーキテクチャ、特に検出変換器(DETR)に適合しない一般的なソリューションとして設計されている。
本稿では,DTRのクエリ中心の機能強化を特化して設計された新しいSFODフレームワークであるFeature Reweighting ANd Contrastive Learning NetworK(FRANCK)を紹介する。
論文 参考訳(メタデータ) (2025-10-13T07:35:04Z) - TinyDef-DETR: A Transformer-Based Framework for Defect Detection in Transmission Lines from UAV Imagery [12.48571944931548]
TinyDef-DETRは、UAVが取得した画像から伝送路欠陥の正確かつ効率的な検出を実現するためのフレームワークである。
このモデルは、4つの主要なコンポーネントを統合している: エッジ強化されたResNetバックボーンで境界に敏感な表現を強化する、ストライドフリーなスペース・トゥ・ディープス・モジュールで詳細保存可能なダウンサンプリングを可能にする、Focler-Wise-SIoUレグレッション・ロスにより、小さくて難しいオブジェクトのローカライゼーションが向上する。
論文 参考訳(メタデータ) (2025-09-07T12:36:33Z) - MGDFIS: Multi-scale Global-detail Feature Integration Strategy for Small Object Detection [12.838872442435527]
UAV画像の小さな物体検出は、探索・救助、交通監視、環境監視といった用途に不可欠である。
既存のマルチスケール融合法は、計算負荷を増し、詳細をぼかすのに役立つ。
本稿では,グローバルコンテキストと局所的な詳細を密結合して検出性能を向上させる統合融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-06-15T02:54:25Z) - Learning to Borrow Features for Improved Detection of Small Objects in Single-Shot Detectors [0.0]
そこで本研究では,クラス内のより大規模で意味的にリッチなインスタンスから,小さなオブジェクト表現を識別的特徴の「バラバラ化」を可能にする新しいフレームワークを提案する。
本手法は, 複雑な視覚環境下でのロバストな物体検出に有望な方向を提供するため, ベースライン法よりも小さな物体検出精度を著しく向上させる。
論文 参考訳(メタデータ) (2025-04-30T01:18:33Z) - DiffMOD: Progressive Diffusion Point Denoising for Moving Object Detection in Remote Sensing [40.607660968380394]
リモートセンシングにおける移動物体検出(MOD)は、低解像度、極めて小さなオブジェクトサイズ、複雑なノイズ干渉によって著しく困難である。
現在のディープラーニングに基づくMOD法は、オブジェクト間の柔軟な情報相互作用を制限する確率密度推定に依存している。
本稿では,移動物体中心をスパースノイズ点から反復的に回収する遠隔センシングのためのポイントベースMODを提案する。
論文 参考訳(メタデータ) (2025-04-14T14:44:52Z) - MSCA-Net:Multi-Scale Context Aggregation Network for Infrared Small Target Detection [0.1759252234439348]
本稿では,3つのキーコンポーネントを統合したMSCA-Netというネットワークアーキテクチャを提案する。
MSEDAは、異なるスケールにわたる情報を適応的に集約するために、マルチスケールのフュージョンアテンション機構を使用している。
PCBAMは相関行列に基づく戦略によりグローバル特徴と局所特徴の相関を捉える。
CABは、それらに重みを割り当て、低レベル情報と高レベル情報を統合することで、重要な特徴の表現を強化する。
論文 参考訳(メタデータ) (2025-03-21T14:42:31Z) - Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Progressive Self-Guided Loss for Salient Object Detection [102.35488902433896]
画像中の深層学習に基づくサラエント物体検出を容易にするプログレッシブ自己誘導損失関数を提案する。
我々のフレームワークは適応的に集約されたマルチスケール機能を利用して、健全な物体の探索と検出を効果的に行う。
論文 参考訳(メタデータ) (2021-01-07T07:33:38Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。