論文の概要: Neural Constraint Satisfaction: Hierarchical Abstraction for
Combinatorial Generalization in Object Rearrangement
- arxiv url: http://arxiv.org/abs/2303.11373v1
- Date: Mon, 20 Mar 2023 18:19:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-22 17:43:34.586428
- Title: Neural Constraint Satisfaction: Hierarchical Abstraction for
Combinatorial Generalization in Object Rearrangement
- Title(参考訳): ニューラル制約満足度:物体再構成における組合せ一般化のための階層的抽象化
- Authors: Michael Chang and Alyssa L. Dayan and Franziska Meier and Thomas L.
Griffiths and Sergey Levine and Amy Zhang
- Abstract要約: 基礎となるエンティティを明らかにするための階層的抽象化手法を提案する。
本研究では,エージェントのモデルにおける実体の状態の介入と,環境中の物体に作用する状態の対応関係を学習する方法を示す。
この対応を利用して、オブジェクトの異なる数や構成に一般化する制御法を開発する。
- 参考スコア(独自算出の注目度): 75.9289887536165
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Object rearrangement is a challenge for embodied agents because solving these
tasks requires generalizing across a combinatorially large set of
configurations of entities and their locations. Worse, the representations of
these entities are unknown and must be inferred from sensory percepts. We
present a hierarchical abstraction approach to uncover these underlying
entities and achieve combinatorial generalization from unstructured visual
inputs. By constructing a factorized transition graph over clusters of entity
representations inferred from pixels, we show how to learn a correspondence
between intervening on states of entities in the agent's model and acting on
objects in the environment. We use this correspondence to develop a method for
control that generalizes to different numbers and configurations of objects,
which outperforms current offline deep RL methods when evaluated on simulated
rearrangement tasks.
- Abstract(参考訳): オブジェクトの再配置は、これらのタスクを解決するには、エンティティとその位置の組合せ的に大きな構成セットをまたいで一般化する必要があるため、実施エージェントにとって課題である。
さらに悪いことに、これらの実体の表現は未知であり、知覚知覚から推測されなければならない。
我々は,これらの実体を解明し,非構造化視覚入力からの組合せ一般化を実現するための階層的抽象的アプローチを提案する。
画素から推定されるエンティティ表現のクラスタ上に因子化された遷移グラフを構築することにより、エージェントのモデルにおけるエンティティの状態と、環境内のオブジェクトに作用する状態との対応を学習する方法を示す。
この対応を用いて,オブジェクトの異なる数と構成に一般化した制御手法を開発し,シミュレーションによる再配置タスクで評価した場合,現在のオフラインのdeep rl法よりも優れる。
関連論文リスト
- Composable Part-Based Manipulation [61.48634521323737]
本稿では,ロボット操作スキルの学習と一般化を改善するために,構成可能な部品ベース操作(CPM)を提案する。
CPMは構成可能な拡散モデルの集合で構成され、各モデルは異なるオブジェクト間の対応をキャプチャする。
シミュレーションおよび実世界のシナリオにおいて、我々のアプローチを検証し、ロバストかつ一般化された操作能力を達成する上での有効性を実証する。
論文 参考訳(メタデータ) (2024-05-09T16:04:14Z) - Complex-Valued Autoencoders for Object Discovery [62.26260974933819]
本稿では,オブジェクト中心表現に対する分散アプローチとして,複合オートエンコーダを提案する。
このシンプルで効率的なアプローチは、単純なマルチオブジェクトデータセット上の等価な実数値オートエンコーダよりも、より良い再構成性能を実現することを示す。
また、2つのデータセット上のSlotAttentionモデルと競合しないオブジェクト発見性能を実現し、SlotAttentionが失敗する第3のデータセットでオブジェクトをアンタングルする。
論文 参考訳(メタデータ) (2022-04-05T09:25:28Z) - Structure-Regularized Attention for Deformable Object Representation [17.120035855774344]
文脈依存のキャプチャは、ディープニューラルネットワークの表現力を改善するのに有用であることが証明されている。
自己注意や非局所操作といったグローバルコンテキストのモデリングに焦点をあてた近年のアプローチは、要素間の制約のないペアワイズ相互作用を可能にすることで、この目標を達成する。
本稿では,データに固有の構造的依存関係をモデル化することにより,コンテキスト利用の恩恵を受けることができる変形可能なオブジェクトの学習表現について考察する。
論文 参考訳(メタデータ) (2021-06-12T03:10:17Z) - End-to-End Hierarchical Relation Extraction for Generic Form
Understanding [0.6299766708197884]
本稿では,エンティティ検出とリンク予測を併用する新しいディープニューラルネットワークを提案する。
本モデルでは,複数段階の意図的U-Netアーキテクチャを拡張し,リンク予測のための部分強度場と部分連想場を拡張した。
本稿では,ノイズの多い文書データセットの形式理解におけるモデルの有効性を示す。
論文 参考訳(メタデータ) (2021-06-02T06:51:35Z) - Hierarchical Pyramid Representations for Semantic Segmentation [0.0]
コンテキストはこれらの固有の特性に基づいているため、オブジェクトの構造とオブジェクト間の階層構造を学ぶ。
本研究では,新しい階層的,文脈的,マルチスケールのピラミッド表現を設計し,入力画像から特徴を捉える。
提案手法はPASCALコンテキストにおける最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2021-04-05T06:39:12Z) - Visual Concept Reasoning Networks [93.99840807973546]
分割変換マージ戦略は、視覚認識タスクのための畳み込みニューラルネットワークのアーキテクチャ制約として広く使用されている。
我々は、この戦略を利用して、高レベルの視覚概念間の推論を可能にするために、Visual Concept Reasoning Networks (VCRNet) と組み合わせることを提案する。
提案するモデルであるVCRNetは、パラメータ数を1%以下にすることで、一貫して性能を向上する。
論文 参考訳(メタデータ) (2020-08-26T20:02:40Z) - Efficient State Abstraction using Object-centered Predicates for
Manipulation Planning [86.24148040040885]
本稿では,より広い構成空間の変化を特徴付けるオブジェクト中心表現を提案する。
この表現に基づいて、幾何学的および力的整合性を持つ計画の生成を可能にする行動の選択と配置のための普遍的な計画演算子を定義する。
論文 参考訳(メタデータ) (2020-07-16T10:52:53Z) - Disassembling Object Representations without Labels [75.2215716328001]
本研究では,オブジェクト表現を分解する新しい表現学習タスクについて検討する。
分解は、学習した表現におけるカテゴリ固有のモジュラリティを可能にする。
我々は、非教師なし分解オブジェクト表現(UDOR)という、非教師なしの非教師なしアプローチを提案する。
論文 参考訳(メタデータ) (2020-04-03T08:23:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。