論文の概要: Problem Space Transformations for Generalisation in Behavioural Cloning
- arxiv url: http://arxiv.org/abs/2411.04056v1
- Date: Wed, 06 Nov 2024 17:05:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-07 19:22:18.121221
- Title: Problem Space Transformations for Generalisation in Behavioural Cloning
- Title(参考訳): 行動クローンにおける一般化のための問題空間変換
- Authors: Kiran Doshi, Marco Bagatella, Stelian Coros,
- Abstract要約: この研究はロボット操作の幅広い特性を特徴づけている。
これらの特性から生じる変換によって、行動的クローニングによって訓練された神経ポリシーが、アウト・オブ・ディストリビューション問題インスタンスによりよい一般化を可能にすることを実証的に実証した。
- 参考スコア(独自算出の注目度): 17.91476826271504
- License:
- Abstract: The combination of behavioural cloning and neural networks has driven significant progress in robotic manipulation. As these algorithms may require a large number of demonstrations for each task of interest, they remain fundamentally inefficient in complex scenarios. This issue is aggravated when the system is treated as a black-box, ignoring its physical properties. This work characterises widespread properties of robotic manipulation, such as pose equivariance and locality. We empirically demonstrate that transformations arising from each of these properties allow neural policies trained with behavioural cloning to better generalise to out-of-distribution problem instances.
- Abstract(参考訳): 行動クローニングとニューラルネットワークの組み合わせは、ロボット操作に大きな進歩をもたらした。
これらのアルゴリズムは興味のあるタスクごとに多数のデモを必要とするため、複雑なシナリオでは基本的に非効率である。
この問題は、システムがブラックボックスとして扱われるときに増加し、物理的性質を無視している。
この研究は、相同性や局所性など、ロボット操作の幅広い特性を特徴づける。
これらの特性から生じる変換によって、行動的クローニングによって訓練された神経ポリシーが、アウト・オブ・ディストリビューション問題インスタンスによりよい一般化を可能にすることを実証的に実証した。
関連論文リスト
- Deep multitask neural networks for solving some stochastic optimal
control problems [0.0]
本稿では,最適制御問題のクラスについて考察し,ニューラルネットワークを用いた効果的な解法を提案する。
マルチタスクニューラルネットワークをトレーニングするために,タスク間の学習を動的にバランスさせる新しいスキームを導入する。
実世界のデリバティブ価格問題に関する数値実験を通じて,本手法が最先端の手法より優れていることを示す。
論文 参考訳(メタデータ) (2024-01-23T17:20:48Z) - D2NO: Efficient Handling of Heterogeneous Input Function Spaces with
Distributed Deep Neural Operators [7.119066725173193]
異種性を示す入力関数を扱うための新しい分散手法を提案する。
中央ニューラルネットワークは、すべての出力関数間で共有情報を処理するために使用される。
ニューラルネットワークが連続非線形作用素の普遍近似であることを示す。
論文 参考訳(メタデータ) (2023-10-29T03:29:59Z) - Heterogenous Memory Augmented Neural Networks [84.29338268789684]
ニューラルネットワークのための新しいヘテロジニアスメモリ拡張手法を提案する。
学習可能なメモリトークンをアテンション機構付きで導入することにより、膨大な計算オーバーヘッドを伴わずに性能を効果的に向上させることができる。
In-distriion (ID) と Out-of-distriion (OOD) の両方の条件下での様々な画像およびグラフベースのタスクに対するアプローチを示す。
論文 参考訳(メタデータ) (2023-10-17T01:05:28Z) - Decomposing the Generalization Gap in Imitation Learning for Visual
Robotic Manipulation [60.00649221656642]
シミュレーションにおける模倣学習ポリシーと実際のロボット言語による操作課題について検討する。
我々は、より制御された一般化評価を容易にするために、変化の11因子を持つ19のタスクのシミュレーションベンチマークを設計する。
論文 参考訳(メタデータ) (2023-07-07T15:26:03Z) - RObotic MAnipulation Network (ROMAN) $\unicode{x2013}$ Hybrid
Hierarchical Learning for Solving Complex Sequential Tasks [70.69063219750952]
ロボットマニピュレーションネットワーク(ROMAN)のハイブリッド階層型学習フレームワークを提案する。
ROMANは、行動クローニング、模倣学習、強化学習を統合することで、タスクの汎用性と堅牢な障害回復を実現する。
実験結果から,これらの専門的な操作専門家の組織化と活性化により,ROMANは高度な操作タスクの長いシーケンスを達成するための適切なシーケンシャルなアクティベーションを生成することがわかった。
論文 参考訳(メタデータ) (2023-06-30T20:35:22Z) - Permutation Equivariant Neural Functionals [92.0667671999604]
この研究は、他のニューラルネットワークの重みや勾配を処理できるニューラルネットワークの設計を研究する。
隠れた層状ニューロンには固有の順序がないため, 深いフィードフォワードネットワークの重みに生じる置換対称性に着目する。
実験の結果, 置換同変ニューラル関数は多種多様なタスクに対して有効であることがわかった。
論文 参考訳(メタデータ) (2023-02-27T18:52:38Z) - Invariant Causal Mechanisms through Distribution Matching [86.07327840293894]
本研究では、因果的視点と不変表現を学習するための新しいアルゴリズムを提供する。
実験により,このアルゴリズムは様々なタスク群でうまく動作し,特にドメインの一般化における最先端のパフォーマンスを観察する。
論文 参考訳(メタデータ) (2022-06-23T12:06:54Z) - Automatic Generation of Individual Fuzzy Cognitive Maps from
Longitudinal Data [0.0]
ファジィ認知マップ(英: Fuzzy Cognitive Maps、FCM)は、個々の相互作用に対して、因子(ノード)がどのように変化するかを表す計算モデルである。
本稿では、遺伝的アルゴリズムを用いて各エージェントに1つのFCMを作成することにより、不均一な振る舞いを持つ仮想集団を自動生成する手段を提供する。
論文 参考訳(メタデータ) (2022-02-14T22:11:58Z) - The Sensory Neuron as a Transformer: Permutation-Invariant Neural
Networks for Reinforcement Learning [11.247894240593691]
私たちは、各感覚入力を環境から異なるが同一のニューラルネットワークに供給するシステムを構築します。
これらのセンサネットワークは、ローカルに受信した情報を統合するための訓練が可能であり、アテンションメカニズムによるコミュニケーションにより、グローバルな一貫性を持つポリシーをまとめて作成できることが示される。
論文 参考訳(メタデータ) (2021-09-07T05:12:50Z) - Unsupervised Behaviour Discovery with Quality-Diversity Optimisation [1.0152838128195467]
品質多様性アルゴリズム(Quality-Diversity algorithm)は、与えられた問題に対する多様な高性能なソリューションの集合を見つけるために設計された進化的アルゴリズムのクラスを指す。
ロボット工学において、そのようなアルゴリズムはロボットの動作のほとんどをカバーするコントローラーの集合を生成するのに使用できる。
本稿では,自律型ロボットの能力を実現するアルゴリズムについて紹介する。
論文 参考訳(メタデータ) (2021-06-10T10:40:18Z) - Multi-task Supervised Learning via Cross-learning [102.64082402388192]
我々は,様々なタスクを解くことを目的とした回帰関数の集合を適合させることで,マルチタスク学習と呼ばれる問題を考える。
我々の新しい定式化では、これらの関数のパラメータを2つに分けて、互いに近づきながらタスク固有のドメインで学習する。
これにより、異なるドメインにまたがって収集されたデータが、互いのタスクにおける学習パフォーマンスを改善するのに役立つ、クロス・ファーティライズが促進される。
論文 参考訳(メタデータ) (2020-10-24T21:35:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。