論文の概要: Towards Multi-Morphology Controllers with Diversity and Knowledge Distillation
- arxiv url: http://arxiv.org/abs/2404.14625v1
- Date: Mon, 22 Apr 2024 23:40:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-24 15:50:59.358895
- Title: Towards Multi-Morphology Controllers with Diversity and Knowledge Distillation
- Title(参考訳): 多様性と知識蒸留を考慮したマルチモルフォロジー制御系の実現に向けて
- Authors: Alican Mertan, Nick Cheney,
- Abstract要約: 本稿では, シングルタスク/シングルモーフィオロジーの教師コントローラを1つのマルチモーフィオロジーのコントローラに蒸留するパイプラインを提案する。
蒸留された制御装置は、教師/形態学の数とうまくスケールし、創発的な特性を示す。
ゼロショットで見えなくなる形態を一般化し、形態的摂動に対する頑健さと即時損傷回復を提供する。
- 参考スコア(独自算出の注目度): 0.24554686192257422
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Finding controllers that perform well across multiple morphologies is an important milestone for large-scale robotics, in line with recent advances via foundation models in other areas of machine learning. However, the challenges of learning a single controller to control multiple morphologies make the `one robot one task' paradigm dominant in the field. To alleviate these challenges, we present a pipeline that: (1) leverages Quality Diversity algorithms like MAP-Elites to create a dataset of many single-task/single-morphology teacher controllers, then (2) distills those diverse controllers into a single multi-morphology controller that performs well across many different body plans by mimicking the sensory-action patterns of the teacher controllers via supervised learning. The distilled controller scales well with the number of teachers/morphologies and shows emergent properties. It generalizes to unseen morphologies in a zero-shot manner, providing robustness to morphological perturbations and instant damage recovery. Lastly, the distilled controller is also independent of the teacher controllers -- we can distill the teacher's knowledge into any controller model, making our approach synergistic with architectural improvements and existing training algorithms for teacher controllers.
- Abstract(参考訳): 複数の形態でうまく機能するコントローラを見つけることは、大規模ロボット工学にとって重要なマイルストーンであり、機械学習の他の分野の基礎モデルによる最近の進歩と一致している。
しかし、複数の形態を制御できる単一コントローラを学習する上での課題は、現場において「1つのロボット1タスク」というパラダイムを優位に立たせている。
これらの課題を軽減するために,(1)MAP-Elitesのような品質多様性アルゴリズムを活用して,多数の単一タスク/単一形態学の教師コントローラのデータセットを作成し,(2)教師コントローラの感覚行動パターンを教師学習を通じて模倣することにより,多様なコントローラを単一の多形態学コントローラに蒸留する。
蒸留された制御装置は、教師/形態学の数とうまくスケールし、創発的な特性を示す。
ゼロショットで見えなくなる形態を一般化し、形態的摂動に対する頑健さと即時損傷回復を提供する。
最後に、蒸留されたコントローラは、教師のコントローラとは独立している -- 教師の知識をあらゆるコントローラモデルに抽出することができ、我々のアプローチはアーキテクチャの改善と相乗的になり、教師のコントローラのための既存のトレーニングアルゴリズムがもたらされる。
関連論文リスト
- A comparison of controller architectures and learning mechanisms for
arbitrary robot morphologies [2.884244918665901]
学習ロボットの形態が事前に分かっていない場合、ロボットコントローラと学習方法の組み合わせはどのように使うべきか。
我々は3つのコントローラとラーナーの組み合わせを実験的に比較した。
有効性、効率、堅牢性を比較します。
論文 参考訳(メタデータ) (2023-09-25T07:11:43Z) - Evolving generalist controllers to handle a wide range of morphological variations [1.4425878137951238]
人工ニューラルネットワーク(ANN)の堅牢性と一般化性の研究は、いまだに限られている。
予期せぬ形態変化や環境変化は、ANNコントローラがこれらの変化を処理できなければ失敗する可能性がある。
本稿では,制御器の堅牢性と一般化性を高めることを目的としたアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-18T23:06:19Z) - Universal Morphology Control via Contextual Modulation [52.742056836818136]
異なるロボット形態をまたいだ普遍的なポリシーの学習は、継続的な制御における学習効率と一般化を著しく向上させることができる。
既存の手法では、グラフニューラルネットワークやトランスフォーマーを使用して、異種状態と異なる形態のアクション空間を処理する。
本稿では,この依存関係を文脈変調によりモデル化する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:04:12Z) - Is Disentanglement enough? On Latent Representations for Controllable
Music Generation [78.8942067357231]
強い生成デコーダが存在しない場合、アンタングル化は必ずしも制御性を意味するものではない。
VAEデコーダに対する潜伏空間の構造は、異なる属性を操作するための生成モデルの能力を高める上で重要な役割を果たす。
論文 参考訳(メタデータ) (2021-08-01T18:37:43Z) - Versatile modular neural locomotion control with fast learning [6.85316573653194]
脚のついたロボットは、高度に非構造的な環境で動作する大きな可能性を秘めている。
現在、コントローラは、特定のロボットのために手動で設計するか、機械学習メソッドで自動的に設計されなければならない。
高速な学習が可能な,単純かつ多目的なモジュール型ニューラルコントロール構造を提案する。
論文 参考訳(メタデータ) (2021-07-16T12:12:28Z) - Morpho-evolution with learning using a controller archive as an
inheritance mechanism [4.364091192392204]
本稿では,ボディープランを生成する進化的アルゴリズムと,ニューラルコントローラのパラメータを最適化する学習アルゴリズムを組み合わせたフレームワークを提案する。
ランダムに初期化したものから学習するのではなく,アーカイブから適切なコントローラを継承することにより,学習の速度と規模が時間とともに大きくなることを示す。
このフレームワークはまた、進化と学習の複雑な相互作用と、ロボット設計における形態的知性の役割に関する新しい洞察を提供する。
論文 参考訳(メタデータ) (2021-04-09T09:32:36Z) - A Meta-Reinforcement Learning Approach to Process Control [3.9146761527401424]
メタラーニングは、ニューラルネットワークなどのモデルを迅速に適応させ、新しいタスクを実行することを目的としています。
制御器を構築し,別の埋め込みニューラルネットワークを用いて潜在コンテキスト変数を用いて制御器をメタトレーニングする。
どちらの場合も、メタラーニングアルゴリズムは新しいタスクに非常に迅速に適応し、ゼロから訓練された通常のDRLコントローラよりも優れています。
論文 参考訳(メタデータ) (2021-03-25T18:20:56Z) - Machine Learning for Mechanical Ventilation Control [52.65490904484772]
圧制御換気における侵襲的機械式換気装置の制御の問題点を考察する。
PIDコントローラは、臨床医が指定する気道圧の軌跡に従って、鎮静患者の肺の空気を入出させる必要があります。
制御器は、PID制御器よりも目標圧力波形をかなりよく追跡できることを示す。
論文 参考訳(メタデータ) (2021-02-12T21:23:33Z) - Learning a Contact-Adaptive Controller for Robust, Efficient Legged
Locomotion [95.1825179206694]
四足歩行ロボットのためのロバストコントローラを合成するフレームワークを提案する。
高レベルコントローラは、環境の変化に応じてプリミティブのセットを選択することを学習する。
確立された制御方法を使用してプリミティブを堅牢に実行する低レベルコントローラ。
論文 参考訳(メタデータ) (2020-09-21T16:49:26Z) - Data-driven Koopman Operators for Model-based Shared Control of
Human-Machine Systems [66.65503164312705]
本稿では,データ駆動型共有制御アルゴリズムを提案する。
ユーザのインタラクションに関するダイナミクスと情報は、Koopman演算子を使用して観察から学習される。
モデルに基づく共有制御は、自然な学習やユーザのみの制御パラダイムと比較して、タスクとコントロールのメトリクスを著しく改善する。
論文 参考訳(メタデータ) (2020-06-12T14:14:07Z) - Improving Input-Output Linearizing Controllers for Bipedal Robots via
Reinforcement Learning [85.13138591433635]
入力出力線形化コントローラの主な欠点は、正確な力学モデルが必要であり、入力制約を考慮できないことである。
本稿では,強化学習技術を用いた二足歩行ロボット制御の具体例について,両課題に対処する。
論文 参考訳(メタデータ) (2020-04-15T18:15:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。