論文の概要: MAFE R-CNN: Selecting More Samples to Learn Category-aware Features for Small Object Detection
- arxiv url: http://arxiv.org/abs/2505.16442v1
- Date: Thu, 22 May 2025 09:30:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-23 17:12:48.190747
- Title: MAFE R-CNN: Selecting More Samples to Learn Category-aware Features for Small Object Detection
- Title(参考訳): MAFE R-CNN:小さなオブジェクト検出のためのカテゴリ認識機能を学ぶために、より多くのサンプルを選択する
- Authors: Yichen Li, Qiankun Liu, Zhenchao Jin, Jiuzhe Wei, Jing Nie, Ying Fu,
- Abstract要約: 複雑な環境での小さな物体検出は、オブジェクト検出の分野における大きな課題を一貫して表している。
本稿では,この難しさが,小型物体の識別特性を効果的に学習できないことに起因することを確かめる。
本稿では2つの重要なコンポーネントを統合したマルチキューアサインメントと特徴拡張R-CNNを提案する。
- 参考スコア(独自算出の注目度): 21.402560040693558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Small object detection in intricate environments has consistently represented a major challenge in the field of object detection. In this paper, we identify that this difficulty stems from the detectors' inability to effectively learn discriminative features for objects of small size, compounded by the complexity of selecting high-quality small object samples during training, which motivates the proposal of the Multi-Clue Assignment and Feature Enhancement R-CNN.Specifically, MAFE R-CNN integrates two pivotal components.The first is the Multi-Clue Sample Selection (MCSS) strategy, in which the Intersection over Union (IoU) distance, predicted category confidence, and ground truth region sizes are leveraged as informative clues in the sample selection process. This methodology facilitates the selection of diverse positive samples and ensures a balanced distribution of object sizes during training, thereby promoting effective model learning.The second is the Category-aware Feature Enhancement Mechanism (CFEM), where we propose a simple yet effective category-aware memory module to explore the relationships among object features. Subsequently, we enhance the object feature representation by facilitating the interaction between category-aware features and candidate box features.Comprehensive experiments conducted on the large-scale small object dataset SODA validate the effectiveness of the proposed method. The code will be made publicly available.
- Abstract(参考訳): 複雑な環境での小さな物体検出は、オブジェクト検出の分野における大きな課題を一貫して表している。
そこで本論文では,MAFE R-CNNが2つの重要な要素を統合し,その1つがMCSS(Multi-Clue Sample Selection)戦略であり,IoU(Intersection over Union)距離,予測圏信頼度,地中真理領域サイズを,サンプル選択過程における情報的手がかりとして活用する。
本手法は,多種多様な正のサンプルの選択を促進し,トレーニング中のオブジェクトサイズのバランスの取れた分布を保証し,効果的なモデル学習を促進する。
その後、カテゴリ認識特徴と候補ボックス特徴との相互作用を容易にし、オブジェクト特徴表現を強化し、大規模オブジェクトデータセットSODAによる総合実験により提案手法の有効性を検証した。
コードは公開されます。
関連論文リスト
- Efficient Feature Fusion for UAV Object Detection [9.632727117779178]
特に小さな物体は画像のごく一部を占めており、正確な検出を困難にしている。
既存のマルチスケール機能融合手法は、様々な解像度で機能を集約することでこれらの課題に対処する。
本稿では,UAVオブジェクト検出タスクに特化して設計された新しい機能融合フレームワークを提案する。
論文 参考訳(メタデータ) (2025-01-29T20:39:16Z) - Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - Multilateral Cascading Network for Semantic Segmentation of Large-Scale Outdoor Point Clouds [6.253217784798542]
Multilateral Cascading Network (MCNet)はこの課題に対処するために設計された。
MCNetは、Multilateral Cascading Attention Enhancement (MCAE)モジュールとPoint Cross Stage partial (P-CSP)モジュールの2つの主要なコンポーネントから構成されている。
その結果,mIoU全体では2.1%,小さめの対象カテゴリーでは平均15.9%の改善が得られた。
論文 参考訳(メタデータ) (2024-09-21T02:23:01Z) - Toward Multi-class Anomaly Detection: Exploring Class-aware Unified Model against Inter-class Interference [67.36605226797887]
統一型異常検出(MINT-AD)のためのマルチクラスインプリシトニューラル表現変換器を提案する。
マルチクラス分布を学習することにより、モデルが変換器デコーダのクラス対応クエリ埋め込みを生成する。
MINT-ADは、カテゴリと位置情報を特徴埋め込み空間に投影することができ、さらに分類と事前確率損失関数によって監督される。
論文 参考訳(メタデータ) (2024-03-21T08:08:31Z) - Active Learning for Object Detection with Non-Redundant Informative
Sampling [1.7602289331729377]
我々の戦略は、不確実性と多様性に基づく選択原則を共同選択目標に統合する。
提案したNORISアルゴリズムは,サンプルを用いたトレーニングが他の類似サンプルの情報伝達性に与える影響を定量的に評価する。
PASCAL-VOC と KITTI のランダム選択と比較して,ラベリングコストの 20% と 30% の削減を実現している。
論文 参考訳(メタデータ) (2023-07-17T11:55:20Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z) - A Unified Object Motion and Affinity Model for Online Multi-Object
Tracking [127.5229859255719]
オブジェクトの動きと親和性モデルを単一のネットワークに統一する新しいMOTフレームワークUMAを提案する。
UMAは、単一物体追跡とメートル法学習をマルチタスク学習により統合された三重項ネットワークに統合する。
我々は,タスク認識機能学習を促進するために,タスク固有のアテンションモジュールを装備する。
論文 参考訳(メタデータ) (2020-03-25T09:36:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。