論文の概要: Performance-guided Reinforced Active Learning for Object Detection
- arxiv url: http://arxiv.org/abs/2601.15688v1
- Date: Thu, 22 Jan 2026 06:17:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-23 21:37:20.514636
- Title: Performance-guided Reinforced Active Learning for Object Detection
- Title(参考訳): 物体検出のための性能誘導型強化能動学習
- Authors: Zhixuan Liang, Xingyu Zeng, Rui Zhao, Ping Luo,
- Abstract要約: オブジェクト検出のための性能誘導型(mAP誘導型)強化能動学習(MGRAL)を提案する。
MGRALは、期待されるモデル出力変化の概念を情報性として活用する新しいアプローチである。
我々は,PASCAL VOCおよびベンチマークを用いた検出タスクにおけるMGRALの能動的学習性能を評価した。
- 参考スコア(独自算出の注目度): 35.35622755139208
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Active learning (AL) strategies aim to train high-performance models with minimal labeling efforts, only selecting the most informative instances for annotation. Current approaches to evaluating data informativeness predominantly focus on the data's distribution or intrinsic information content and do not directly correlate with downstream task performance, such as mean average precision (mAP) in object detection. Thus, we propose Performance-guided (i.e. mAP-guided) Reinforced Active Learning for Object Detection (MGRAL), a novel approach that leverages the concept of expected model output changes as informativeness. To address the combinatorial explosion challenge of batch sample selection and the non-differentiable correlation between model performance and selected batches, MGRAL skillfully employs a reinforcement learning-based sampling agent that optimizes selection using policy gradient with mAP improvement as reward. Moreover, to reduce the computational overhead of mAP estimation with unlabeled samples, MGRAL utilizes an unsupervised way with fast look-up tables, ensuring feasible deployment. We evaluate MGRAL's active learning performance on detection tasks over PASCAL VOC and COCO benchmarks. Our approach demonstrates the highest AL curve with convincing visualizations, establishing a new paradigm in reinforcement learning-driven active object detection.
- Abstract(参考訳): アクティブラーニング(AL)戦略は、最小限のラベル付け作業で高性能モデルをトレーニングすることを目的としており、アノテーションの最も有益なインスタンスのみを選択する。
データ情報性を評価するための現在のアプローチは、主にデータの分布や本質的な情報内容に焦点を当てており、オブジェクト検出における平均平均精度(mAP)などの下流タスクのパフォーマンスと直接相関しない。
そこで本研究では,期待されるモデル出力変化の概念を情報として活用する新しい手法として,パフォーマンス誘導型(mAP誘導型)強化能動物体検出学習(MGRAL)を提案する。
バッチサンプル選択の組合せ的爆発問題とモデル性能と選択されたバッチとの非微分的相関に対処するため、MGRALは、mAP改善によるポリシー勾配を用いた選択を報酬として最適化する強化学習ベースのサンプリングエージェントを巧みに使用した。
さらに、ラベルなしサンプルによるmAP推定の計算オーバーヘッドを低減するため、MGRALは高速なルックアップテーブルで教師なしの方法を用いて、デプロイの実現を確実にする。
我々は,PASCAL VOCおよびCOCOベンチマークを用いて,検出タスクにおけるMGRALの能動的学習性能を評価する。
提案手法は,高次学習駆動能動物体検出における新たなパラダイムを確立し,可視化によるAL曲線の最高値を示す。
関連論文リスト
- Table Detection with Active Learning [1.9881456274482427]
アクティブラーニングは、最も有益なサンプルを選択することで、アノテーションコストを最小限に抑える、有望なソリューションである。
提案手法は,モデル一般化を改善する代表例の選択を保証する。
その結果,ALに基づくサンプル選択は,ランダムサンプリングよりも有意に優れていた。
論文 参考訳(メタデータ) (2025-09-24T11:22:30Z) - Group Relative Augmentation for Data Efficient Action Detection [11.169883977958454]
アクション検出にVLM(Big Video-Language Models)を適応させるには、いくつかの例が課題となっている。
パラメータ係数チューニング(LoRA)と新たな学習可能な内部特徴拡張を組み合わせた効率的な適応戦略を提案する。
複雑なマルチラベル・マルチパーソン動作検出データセットに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2025-07-28T21:46:05Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - Aligning Data Selection with Performance: Performance-driven Reinforcement Learning for Active Learning in Object Detection [31.304039641225504]
本稿では,オブジェクト検出のための平均APガイド型アクティブラーニングについて紹介する。
MGRALは、予測されたモデル出力変化の概念を深層検知ネットワークの情報性として活用する新しいアプローチである。
提案手法は,物体検出のための強化学習に基づく能動学習における新たなパラダイムを確立し,高い性能を示す。
論文 参考訳(メタデータ) (2023-10-12T14:59:22Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Discover, Explanation, Improvement: An Automatic Slice Detection
Framework for Natural Language Processing [72.14557106085284]
スライス検出モデル(SDM)は、データポイントの低パフォーマンスなグループを自動的に識別する。
本稿では,NLPタスクの分類のための "Discover, Explain, improve (DEIM)" というベンチマークを提案する。
評価の結果,Edisaは情報的セマンティックな特徴を持つ誤り発生データポイントを正確に選択できることがわかった。
論文 参考訳(メタデータ) (2022-11-08T19:00:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。