論文の概要: MeanAP-Guided Reinforced Active Learning for Object Detection
- arxiv url: http://arxiv.org/abs/2310.08387v1
- Date: Thu, 12 Oct 2023 14:59:22 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-14 09:16:56.844321
- Title: MeanAP-Guided Reinforced Active Learning for Object Detection
- Title(参考訳): meanap誘導型強化アクティブラーニングによる物体検出
- Authors: Zhixuan Liang, Xingyu Zeng, Rui Zhao, Ping Luo
- Abstract要約: 本稿では,オブジェクト検出のためのMeanAP誘導強化能動学習について紹介する。
LSTMアーキテクチャに基づいて構築されたエージェントは、その後のトレーニングインスタンスを効率的に探索し、選択する。
我々は、一般的なベンチマーク、PASCAL VOC、MS COCOにおけるMAGRALの有効性を評価した。
- 参考スコア(独自算出の注目度): 34.19741444116433
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Active learning presents a promising avenue for training high-performance
models with minimal labeled data, achieved by judiciously selecting the most
informative instances to label and incorporating them into the task learner.
Despite notable advancements in active learning for image recognition, metrics
devised or learned to gauge the information gain of data, crucial for query
strategy design, do not consistently align with task model performance metrics,
such as Mean Average Precision (MeanAP) in object detection tasks. This paper
introduces MeanAP-Guided Reinforced Active Learning for Object Detection
(MAGRAL), a novel approach that directly utilizes the MeanAP metric of the task
model to devise a sampling strategy employing a reinforcement learning-based
sampling agent. Built upon LSTM architecture, the agent efficiently explores
and selects subsequent training instances, and optimizes the process through
policy gradient with MeanAP serving as reward. Recognizing the time-intensive
nature of MeanAP computation at each step, we propose fast look-up tables to
expedite agent training. We assess MAGRAL's efficacy across popular benchmarks,
PASCAL VOC and MS COCO, utilizing different backbone architectures. Empirical
findings substantiate MAGRAL's superiority over recent state-of-the-art
methods, showcasing substantial performance gains. MAGRAL establishes a robust
baseline for reinforced active object detection, signifying its potential in
advancing the field.
- Abstract(参考訳): アクティブラーニングは、最小限のラベル付きデータで高性能モデルをトレーニングするための有望な道を示し、ラベル付けする最も情報性の高いインスタンスを司法的に選択し、それらをタスクラーナに組み込むことによって達成される。
画像認識のためのアクティブラーニングの顕著な進歩にもかかわらず、クエリ戦略設計に不可欠なデータの情報ゲインを計測するために考案または学習されたメトリクスは、オブジェクト検出タスクにおける平均精度(meanap)のようなタスクモデルのパフォーマンスメトリクスと一貫して一致しません。
本稿では,タスクモデルの MeanAP メトリックを直接利用して,強化学習に基づくサンプリングエージェントを用いたサンプリング戦略を考案する手法である MeanAP-Guided Reinforceed Active Learning for Object Detection (MAGRAL) を提案する。
LSTMアーキテクチャをベースに構築されたエージェントは、その後のトレーニングインスタンスを効率的に探索し、選択し、MeanAPが報酬となるポリシ勾配を通じてプロセスを最適化する。
各ステップで平均値計算の時間集約性を認識し,エージェントトレーニングを迅速化する高速ルックアップテーブルを提案する。
一般的なベンチマークであるPASCAL VOCとMS COCOで異なるバックボーンアーキテクチャを用いてMAGRALの有効性を評価する。
経験的発見は、最近の最先端手法よりもMAGRALの方が優れており、かなりの性能向上を示している。
magralは強化アクティブオブジェクト検出のための堅牢なベースラインを確立し、フィールドを前進させる可能性を示している。
関連論文リスト
- Parameter-Efficient Active Learning for Foundational models [7.799711162530711]
基礎的な視覚変換器モデルは、多くの視覚タスクにおいて、驚くほどのショットパフォーマンスを示している。
本研究は,アクティブラーニング(AL)フレームワークにおけるパラメータ効率の良い微調整手法の適用に関する新たな研究である。
論文 参考訳(メタデータ) (2024-06-13T16:30:32Z) - Monte Carlo Tree Search Boosts Reasoning via Iterative Preference Learning [55.96599486604344]
本稿では,Large Language Models (LLMs) の推論能力向上を目的とした,反復的な選好学習プロセスによるアプローチを提案する。
我々は、MCTS(Monte Carlo Tree Search)を用いて好みデータを反復的に収集し、そのルックアヘッド機能を利用して、インスタンスレベルの報酬をよりきめ細かいステップレベルの信号に分解する。
提案アルゴリズムはDPO(Direct Preference Optimization)を用いて,新たに生成されたステップレベルの優先度データを用いてLCMポリシーを更新する。
論文 参考訳(メタデータ) (2024-05-01T11:10:24Z) - Querying Easily Flip-flopped Samples for Deep Active Learning [63.62397322172216]
アクティブラーニング(英: Active Learning)は、ラベルのないデータを戦略的に選択してクエリすることで、モデルの性能を向上させることを目的とした機械学習パラダイムである。
効果的な選択戦略の1つはモデルの予測の不確実性に基づくもので、サンプルがどの程度情報的であるかの尺度として解釈できる。
本稿では,予測されたラベルの不一致の最小確率として,最小不一致距離(LDM)を提案する。
論文 参考訳(メタデータ) (2024-01-18T08:12:23Z) - Learning to Rank for Active Learning via Multi-Task Bilevel Optimization [29.207101107965563]
データ取得のための学習代理モデルを用いて、ラベルのないインスタンスのバッチを選択することを目的とした、アクティブな学習のための新しいアプローチを提案する。
このアプローチにおける重要な課題は、ユーティリティ関数の入力の一部を構成するデータの歴史が時間とともに増大するにつれて、よく一般化する取得関数を開発することである。
論文 参考訳(メタデータ) (2023-10-25T22:50:09Z) - ALP: Action-Aware Embodied Learning for Perception [60.64801970249279]
認知のための行動認識型身体学習(ALP)について紹介する。
ALPは、強化学習ポリシーと逆ダイナミクス予測目標を最適化することにより、行動情報を表現学習に組み込む。
ALPは、複数の下流認識タスクにおいて、既存のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-06-16T21:51:04Z) - Temporal Output Discrepancy for Loss Estimation-based Active Learning [65.93767110342502]
ラベルのないサンプルが高損失を伴っていると信じられている場合に,データアノテーションのオラクルに問い合わせる,新しいディープラーニングアプローチを提案する。
本手法は,画像分類やセマンティックセグメンテーションタスクにおける最先端の能動学習手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2022-12-20T19:29:37Z) - Active Learning with Effective Scoring Functions for Semi-Supervised
Temporal Action Localization [15.031156121516211]
本稿では,半教師型talという,滅多に研究されていない実践的な課題に焦点を当てる。
本稿では,AL-STALという効果的な能動学習手法を提案する。
実験の結果,AL-STALは既存の競争相手よりも優れ,完全教師付き学習と比較して満足度が高いことがわかった。
論文 参考訳(メタデータ) (2022-08-31T13:39:38Z) - Consistency-based Active Learning for Object Detection [10.794744492493262]
アクティブラーニングは、限られた予算で最も情報に富んだサンプルを選択することで、タスクモデルの性能を向上させることを目的としている。
本研究では,オリジナルデータと拡張データとの一貫性を十分に探究する,オブジェクト検出のための効果的な一貫性に基づくアクティブラーニング手法を提案する。
論文 参考訳(メタデータ) (2021-03-18T17:00:34Z) - DAGA: Data Augmentation with a Generation Approach for Low-resource
Tagging Tasks [88.62288327934499]
線形化ラベル付き文に基づいて訓練された言語モデルを用いた新しい拡張手法を提案する。
本手法は, 教師付き設定と半教師付き設定の両方に適用可能である。
論文 参考訳(メタデータ) (2020-11-03T07:49:15Z) - Meta-Reinforcement Learning Robust to Distributional Shift via Model
Identification and Experience Relabeling [126.69933134648541]
本稿では,テスト時にアウト・オブ・ディストリビューション・タスクに直面した場合に,効率よく外挿できるメタ強化学習アルゴリズムを提案する。
我々の手法は単純な洞察に基づいており、動的モデルが非政治データに効率的かつ一貫して適応可能であることを認識している。
論文 参考訳(メタデータ) (2020-06-12T13:34:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。