論文の概要: Co-Imitation: Learning Design and Behaviour by Imitation
- arxiv url: http://arxiv.org/abs/2209.01207v1
- Date: Fri, 2 Sep 2022 17:57:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-05 12:14:55.365887
- Title: Co-Imitation: Learning Design and Behaviour by Imitation
- Title(参考訳): Co-Imitation: 模倣によるデザインと行動の学習
- Authors: Chang Rajani, Karol Arndt, David Blanco-Mulero, Kevin Sebastian Luck,
Ville Kyrki
- Abstract要約: ロボットの協調適応は、与えられたタスクに対してシステムの身体と行動の両方を適応させることを目的としている。
本稿では,コ・イミテーション(co-imitation)と呼ばれるコ・アダプテーション問題に対する新たな視点を紹介する。
本稿では,実証者の状態分布を一致させることにより,行動と形態を適応させるコミュニテーション手法を提案する。
- 参考スコア(独自算出の注目度): 10.40773958250192
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The co-adaptation of robots has been a long-standing research endeavour with
the goal of adapting both body and behaviour of a system for a given task,
inspired by the natural evolution of animals. Co-adaptation has the potential
to eliminate costly manual hardware engineering as well as improve the
performance of systems. The standard approach to co-adaptation is to use a
reward function for optimizing behaviour and morphology. However, defining and
constructing such reward functions is notoriously difficult and often a
significant engineering effort. This paper introduces a new viewpoint on the
co-adaptation problem, which we call co-imitation: finding a morphology and a
policy that allow an imitator to closely match the behaviour of a demonstrator.
To this end we propose a co-imitation methodology for adapting behaviour and
morphology by matching state distributions of the demonstrator. Specifically,
we focus on the challenging scenario with mismatched state- and action-spaces
between both agents. We find that co-imitation increases behaviour similarity
across a variety of tasks and settings, and demonstrate co-imitation by
transferring human walking, jogging and kicking skills onto a simulated
humanoid.
- Abstract(参考訳): ロボットの共同適応は、動物の自然進化にインスパイアされた、特定のタスクのためにシステムの身体と行動の両方を適応させることを目標とする長年の研究努力であった。
協調適応は、コストのかかる手作業によるハードウェアエンジニアリングを排除し、システムの性能を向上させる可能性がある。
共適応の標準的なアプローチは、行動と形態を最適化するために報酬関数を使用することである。
しかし、そのような報酬関数の定義と構築は困難であり、しばしば重要なエンジニアリングの努力である。
本稿では,共適応問題に対する新たな視点について紹介する。コ・イミテーション(co-imitation)とは,模擬者が実証者の行動に密接に適合する形態や方針を見つけることである。
そこで本研究では,実証者の状態分布を一致させることにより,行動と形態を適応させるコミュニテーション手法を提案する。
具体的には、両方のエージェント間の状態空間とアクション空間のミスマッチによる、困難なシナリオに注目します。
その結果,コイミテーションは様々なタスクや設定において行動類似性を高め,人間の歩行,ジョギング,蹴りのスキルをシミュレートしたヒューマノイドに移動させることでコイミテーションを示す。
関連論文リスト
- Life, uh, Finds a Way: Systematic Neural Search [2.163881720692685]
エージェントの動作に迅速に適応して、設定における継続的な問題を解決するという課題に取り組みます。
深層強化学習に焦点をあてる代わりに,探索手順の物理的表現としての視聴行動を提案する。
本稿では,行動実行とグラフの突然変異の間の厳密なフィードバックループを調節することにより,行動の暗黙的な列挙を行うアルゴリズムについて述べる。
論文 参考訳(メタデータ) (2024-10-02T09:06:54Z) - Cognitive Evolutionary Learning to Select Feature Interactions for Recommender Systems [59.117526206317116]
Cellはさまざまなタスクやデータに対して,さまざまなモデルに適応的に進化可能であることを示す。
4つの実世界のデータセットの実験では、細胞は最先端のベースラインを大幅に上回っている。
論文 参考訳(メタデータ) (2024-05-29T02:35:23Z) - Adapt On-the-Go: Behavior Modulation for Single-Life Robot Deployment [92.48012013825988]
展開中のシナリオにオンザフライで適応する問題について検討する。
ROAM(RObust Autonomous Modulation)は,事前学習した行動の知覚値に基づくメカニズムを提案する。
ROAMによりロボットはシミュレーションと実Go1の四足歩行の両方の動的変化に迅速に適応できることを示す。
論文 参考訳(メタデータ) (2023-11-02T08:22:28Z) - Leveraging Human Feedback to Evolve and Discover Novel Emergent
Behaviors in Robot Swarms [14.404339094377319]
我々は、人間の入力を活用して、特定のマルチエージェントシステムから現れる可能性のある集団行動の分類を自動で発見することを目指している。
提案手法は,Swarm集団行動に対する類似性空間を学習することにより,ユーザの嗜好に適応する。
我々は,2つのロボット能力モデルを用いたシミュレーションにおいて,本手法が従来よりも豊かな創発的行動の集合を常に発見できることを検証した。
論文 参考訳(メタデータ) (2023-04-25T15:18:06Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Modelling Behaviour Change using Cognitive Agent Simulations [0.0]
本稿では, シミュレーションエージェントに選択された行動変化理論を適用するために, プログレッシブ・イン・プログレッシブ・リサーチを提案する。
この研究は、不適切な状況下での自己決定的目標達成に必要な複雑なエージェントアーキテクチャに焦点を当てている。
論文 参考訳(メタデータ) (2021-10-16T19:19:08Z) - Task-Agnostic Morphology Evolution [94.97384298872286]
モルフォロジーと振る舞いを共同適用する現在のアプローチでは、特定のタスクの報酬をモルフォロジー最適化のシグナルとして使用します。
これはしばしば高価なポリシー最適化を必要とし、一般化するために構築されていないタスクに依存した形態をもたらす。
我々は,これらの問題を緩和するための新しいアプローチであるタスク非依存形態進化(tame)を提案する。
論文 参考訳(メタデータ) (2021-02-25T18:59:21Z) - Emergent Hand Morphology and Control from Optimizing Robust Grasps of
Diverse Objects [63.89096733478149]
多様な物体をつかむために、効果的なハンドデザインが自然に現れるデータ駆動型アプローチを紹介します。
形態と把持スキルを共同で効率的に設計するベイズ最適化アルゴリズムを開発した。
我々は,新しい物体をつかむための堅牢で費用効率のよい手形態を発見するためのアプローチの有効性を実証する。
論文 参考訳(メタデータ) (2020-12-22T17:52:29Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z) - Environmental Adaptation of Robot Morphology and Control through
Real-world Evolution [5.08706161686979]
機械的に自己再構成された四足歩行ロボットに形態学と制御の組み合わせを得るために進化探索を適用した。
2つの異なる物理曲面上の解を進化させ、制御と形態の両方の観点から結果を解析する。
論文 参考訳(メタデータ) (2020-03-30T07:57:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。