論文の概要: Object-Category Aware Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2210.07802v1
- Date: Thu, 13 Oct 2022 11:31:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-17 15:33:09.203973
- Title: Object-Category Aware Reinforcement Learning
- Title(参考訳): オブジェクトカテゴリ認識強化学習
- Authors: Qi Yi, Rui Zhang, Shaohui Peng, Jiaming Guo, Xing Hu, Zidong Du,
Xishan Zhang, Qi Guo, and Yunji Chen
- Abstract要約: 我々は,OCARL(Object-Category Aware Reinforcement Learning)という新しいフレームワークを提案する。
OCARLは、知覚と推論の両方を容易にするためにオブジェクトのカテゴリ情報を使用する。
実験の結果,OCARLはOORL領域におけるサンプル効率と一般化の両方を改善することができることがわかった。
- 参考スコア(独自算出の注目度): 18.106722478831113
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object-oriented reinforcement learning (OORL) is a promising way to improve
the sample efficiency and generalization ability over standard RL. Recent works
that try to solve OORL tasks without additional feature engineering mainly
focus on learning the object representations and then solving tasks via
reasoning based on these object representations. However, none of these works
tries to explicitly model the inherent similarity between different object
instances of the same category. Objects of the same category should share
similar functionalities; therefore, the category is the most critical property
of an object. Following this insight, we propose a novel framework named
Object-Category Aware Reinforcement Learning (OCARL), which utilizes the
category information of objects to facilitate both perception and reasoning.
OCARL consists of three parts: (1) Category-Aware Unsupervised Object Discovery
(UOD), which discovers the objects as well as their corresponding categories;
(2) Object-Category Aware Perception, which encodes the category information
and is also robust to the incompleteness of (1) at the same time; (3)
Object-Centric Modular Reasoning, which adopts multiple independent and
object-category-specific networks when reasoning based on objects. Our
experiments show that OCARL can improve both the sample efficiency and
generalization in the OORL domain.
- Abstract(参考訳): オブジェクト指向強化学習(OORL)は、標準RLよりもサンプル効率と一般化能力を向上させるための有望な方法である。
OORLタスクを追加の機能エンジニアリングなしで解決しようとする最近の研究は、主にオブジェクト表現の学習と、これらのオブジェクト表現に基づいた推論によるタスクの解決に焦点を当てている。
しかし、これらの作品はいずれも同じカテゴリの異なるオブジェクトインスタンス間の固有の類似性を明示的にモデル化しようとはしない。
同じ圏のオブジェクトは同様の機能を共有する必要があるので、その圏は対象の最も重要な性質である。
そこで本研究では,物体のカテゴリ情報を利用して知覚と推論の両方を容易にする,オブジェクト指向認識強化学習(OCARL)という新しいフレームワークを提案する。
ocarlは、3つの部分から構成されている: 1) 対象と対応するカテゴリを発見できるカテゴリ認識未監視物体発見(uod) (2) カテゴリ情報をエンコードし、同時に(1)の不完全性にも頑健なオブジェクト認識認識(object-category aware perception) (3) オブジェクトに基づく推論時に複数の独立およびオブジェクトカテゴリー特定ネットワークを採用するオブジェクト中心モジュラー推論(object-centric modular reasoning)。
実験の結果,ocarlはoorlドメインのサンプル効率と一般化の両方を改善することができた。
関連論文リスト
- Learning Dynamic Attribute-factored World Models for Efficient
Multi-object Reinforcement Learning [6.447052211404121]
多くの強化学習タスクでは、エージェントは異なるタイプの多くのオブジェクトと対話し、目に見えない組み合わせやオブジェクト数に一般化する必要がある。
最近の研究は、サンプル効率を改善するために、オブジェクト指向表現と階層的抽象化の利点を示している。
本稿では、動的属性FacTored RL(DAFT-RL)フレームワークを導入し、オブジェクト属性の係数化の利点を利用する。
論文 参考訳(メタデータ) (2023-07-18T12:41:28Z) - Cycle Consistency Driven Object Discovery [75.60399804639403]
本研究では,シーンの各オブジェクトが異なるスロットに関連付けられなければならない制約を明示的に最適化する手法を提案する。
これらの一貫性目標を既存のスロットベースのオブジェクト中心手法に統合することにより、オブジェクト発見性能を大幅に改善することを示す。
提案手法は,オブジェクト発見を改善するだけでなく,下流タスクのよりリッチな機能も提供することを示唆している。
論文 参考訳(メタデータ) (2023-06-03T21:49:06Z) - Universal Instance Perception as Object Discovery and Retrieval [90.96031157557806]
UNIは多様なインスタンス認識タスクを統一されたオブジェクト発見・検索パラダイムに再構成する。
入力プロンプトを変更するだけで、さまざまな種類のオブジェクトを柔軟に知覚することができる。
UNIは10のインスタンスレベルのタスクから20の挑戦的なベンチマークで優れたパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-03-12T14:28:24Z) - Category-Aware Transformer Network for Better Human-Object Interaction
Detection [20.857034771924997]
カテゴリ認識型セマンティック情報を用いてObject Queryを初期化することにより,トランスフォーマーベースのHOI検出器の高速化の課題について検討する。
具体的には、Object Queryは、外部オブジェクト検出モデルで表されるカテゴリ先行によって表現され、パフォーマンスが向上する。
我々のアイデアを取り入れたHOI検出モデルは、新しい最先端結果を得るために、ベースラインを大きなマージンで上回ります。
論文 参考訳(メタデータ) (2022-04-11T07:21:24Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - Disentangling What and Where for 3D Object-Centric Representations
Through Active Inference [4.088019409160893]
本稿では、時間とともに新しいオブジェクトカテゴリを学習できるアクティブ推論エージェントを提案する。
我々のエージェントは、教師なしの方法で、多くのオブジェクトカテゴリの表現を学習できることを示す。
我々は,エージェントが画素ベースのレンダリングから与えられたポーズでオブジェクトを検索できるエンドツーエンドでシステムを検証する。
論文 参考訳(メタデータ) (2021-08-26T12:49:07Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Closing the Generalization Gap in One-Shot Object Detection [92.82028853413516]
強力な数ショット検出モデルの鍵は、高度なメトリック学習アプローチではなく、カテゴリの数をスケールすることにある。
将来的なデータアノテーションの取り組みは、より広範なデータセットに集中し、より多くのカテゴリにアノテートする必要がある。
論文 参考訳(メタデータ) (2020-11-09T09:31:17Z) - Look-into-Object: Self-supervised Structure Modeling for Object
Recognition [71.68524003173219]
我々は,自己スーパービジョンを取り入れた「対象」(具体的かつ内在的に対象構造をモデル化する)を提案する。
認識バックボーンは、より堅牢な表現学習のために大幅に拡張可能であることを示す。
提案手法は汎用オブジェクト認識(ImageNet)や細粒度オブジェクト認識タスク(CUB, Cars, Aircraft)など,多数のベンチマークにおいて大きなパフォーマンス向上を実現している。
論文 参考訳(メタデータ) (2020-03-31T12:22:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。