論文の概要: Semantic Curiosity for Active Visual Learning
- arxiv url: http://arxiv.org/abs/2006.09367v1
- Date: Tue, 16 Jun 2020 17:59:24 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 18:41:56.142501
- Title: Semantic Curiosity for Active Visual Learning
- Title(参考訳): アクティブビジュアル学習のための意味的好奇心
- Authors: Devendra Singh Chaplot, Helen Jiang, Saurabh Gupta, Abhinav Gupta
- Abstract要約: 物体検出のための対話型学習を具体化する課題について検討する。
私たちのゴールは、エージェントがラベルを取得するデータを選択することで、オブジェクト検出器を学習することです。
- 参考スコア(独自算出の注目度): 45.75355448193764
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study the task of embodied interactive learning for object
detection. Given a set of environments (and some labeling budget), our goal is
to learn an object detector by having an agent select what data to obtain
labels for. How should an exploration policy decide which trajectory should be
labeled? One possibility is to use a trained object detector's failure cases as
an external reward. However, this will require labeling millions of frames
required for training RL policies, which is infeasible. Instead, we explore a
self-supervised approach for training our exploration policy by introducing a
notion of semantic curiosity. Our semantic curiosity policy is based on a
simple observation -- the detection outputs should be consistent. Therefore,
our semantic curiosity rewards trajectories with inconsistent labeling behavior
and encourages the exploration policy to explore such areas. The exploration
policy trained via semantic curiosity generalizes to novel scenes and helps
train an object detector that outperforms baselines trained with other possible
alternatives such as random exploration, prediction-error curiosity, and
coverage-maximizing exploration.
- Abstract(参考訳): 本稿では,物体検出のための具体化対話型学習の課題について検討する。
環境(およびラベルの予算)が与えられた場合、エージェントがラベルを取得するデータを選択することで、オブジェクト検出器を学習することが目的です。
調査政策はどの軌道にラベルを付けるべきか決めるべきか?
1つの可能性として、トレーニング対象検出器の障害ケースを外部報酬として使用する。
しかし、これはRLポリシーのトレーニングに必要な数百万のフレームをラベル付けする必要がある。
代わりに、意味的好奇心の概念を導入することによって、探索政策を訓練するための自己指導的なアプローチを探求する。
私たちのセマンティック好奇心ポリシーは、単純な観察に基づいています -- 検出出力は一貫性があるべきです。
したがって,我々の意味的好奇心は,無矛盾なラベル付け行動を伴う軌道に報いるとともに,探索政策を奨励する。
セマンティクス・キュリオシティによって訓練された探索ポリシーは、新しいシーンに一般化し、ランダムな探索、予測エラー・キュリオシティ、カバレッジを最大化する探索といった他の選択肢で訓練されたベースラインを上回るオブジェクト検出器の訓練を支援する。
関連論文リスト
- Learning to Explore Informative Trajectories and Samples for Embodied
Perception [24.006056116516618]
未知の実施課題に対する知覚モデルの一般化は不十分である。
探索政策を自己管理する3次元意味分布マップを構築した。
そこで本研究では, 意味的分布の不確実性に基づいて, トラジェクトリのハードサンプルを選択することを提案する。
実験により,本手法で微調整した知覚モデルは,他の探索政策で訓練したベースラインよりも優れていた。
論文 参考訳(メタデータ) (2023-03-20T08:20:04Z) - Look Around and Learn: Self-Training Object Detection by Exploration [23.620820805804616]
エージェントは、事前訓練されたオフザシェルフ検出器を使用して環境を探索し、オブジェクトを検出し、擬似ラベルを関連付ける。
同じオブジェクトの擬似ラベルが、異なる視点で一貫性を持っていなければならないと仮定することで、ハードサンプルをマイニングするためにLook Aroundという探索ポリシーを学びます。
我々は現在の最先端の統一されたベンチマークを実装し、既存の探索政策や知覚メカニズムと比較する。
論文 参考訳(メタデータ) (2023-02-07T16:26:45Z) - Semantic Novelty Detection via Relational Reasoning [17.660958043781154]
本稿では,関係推論に基づく表現学習パラダイムを提案する。
実験の結果,この知識は様々なシナリオに直接伝達可能であることがわかった。
クローズドセット認識モデルを信頼できるオープンセットに変換するプラグイン・アンド・プレイモジュールとして利用することができる。
論文 参考訳(メタデータ) (2022-07-18T15:49:27Z) - SEAL: Self-supervised Embodied Active Learning using Exploration and 3D
Consistency [122.18108118190334]
本稿では,SEAL(Self-Embodied Embodied Active Learning)というフレームワークを提案する。
インターネットイメージ上で訓練された知覚モデルを使用して、積極的な探索ポリシーを学ぶ。
我々は3Dセマンティックマップを用いて、行動と知覚の両方を、完全に自己管理された方法で学習する。
論文 参考訳(メタデータ) (2021-12-02T06:26:38Z) - Interesting Object, Curious Agent: Learning Task-Agnostic Exploration [44.18450799034677]
本稿では,タスク非依存探索の定式化と評価におけるパラダイム変化を提案する。
我々の定式化は効果的であることを示し、複数のトレーニングテスト環境ペアをまたいだ最も一貫した探索を提供する。
論文 参考訳(メタデータ) (2021-11-25T15:17:32Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - MURAL: Meta-Learning Uncertainty-Aware Rewards for Outcome-Driven
Reinforcement Learning [65.52675802289775]
本研究では,不確かさを意識した分類器が,強化学習の難しさを解消できることを示す。
正規化最大度(NML)分布の計算法を提案する。
得られたアルゴリズムは、カウントベースの探索法と、報酬関数を学習するための先行アルゴリズムの両方に多くの興味深い関係を持つことを示す。
論文 参考訳(メタデータ) (2021-07-15T08:19:57Z) - Towards Open World Object Detection [68.79678648726416]
ORE: Open World Object Detectorは、対照的なクラスタリングとエネルギーベースの未知の識別に基づいている。
未知のインスタンスの識別と特徴付けは、インクリメンタルなオブジェクト検出設定における混乱を減らすのに役立ちます。
論文 参考訳(メタデータ) (2021-03-03T18:58:18Z) - Reannealing of Decaying Exploration Based On Heuristic Measure in Deep
Q-Network [82.20059754270302]
本稿では,再熱処理の概念に基づくアルゴリズムを提案し,必要なときにのみ探索を促進することを目的とする。
我々は、訓練を加速し、より良い政策を得る可能性を示す実証的なケーススタディを実施している。
論文 参考訳(メタデータ) (2020-09-29T20:40:00Z) - Co-training for On-board Deep Object Detection [0.0]
人間のラベル付きバウンディングボックスを頼りにすることにより、最高のディープビジョンベースのオブジェクト検出器を教師付きで訓練する。
共同学習は、未ラベル画像における自己ラベルオブジェクトの半教師付き学習手法である。
我々は、協調学習がオブジェクトのラベル付けを緩和し、タスクに依存しないドメイン適応と単独で作業するためのパラダイムであることを示す。
論文 参考訳(メタデータ) (2020-08-12T19:08:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。