論文の概要: DMAP: a Distributed Morphological Attention Policy for Learning to
Locomote with a Changing Body
- arxiv url: http://arxiv.org/abs/2209.14218v1
- Date: Wed, 28 Sep 2022 16:45:35 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 18:16:56.831792
- Title: DMAP: a Distributed Morphological Attention Policy for Learning to
Locomote with a Changing Body
- Title(参考訳): DMAP: 身体を変えることを学ぶための分散型形態的注意ポリシー
- Authors: Alberto Silvio Chiappa and Alessandro Marin Vargas and Alexander
Mathis
- Abstract要約: 本稿では,生物学的に着想を得たポリシーネットワークアーキテクチャであるDMAPを紹介する。
主観的状態に基づく制御ポリシは,高度に可変な身体構成では不十分であることを示す。
DMAPは、すべての考慮された環境において、全体的な一致またはオラクルエージェントのパフォーマンスを超越して、エンドツーエンドで訓練することができる。
- 参考スコア(独自算出の注目度): 126.52031472297413
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Biological and artificial agents need to deal with constant changes in the
real world. We study this problem in four classical continuous control
environments, augmented with morphological perturbations. Learning to locomote
when the length and the thickness of different body parts vary is challenging,
as the control policy is required to adapt to the morphology to successfully
balance and advance the agent. We show that a control policy based on the
proprioceptive state performs poorly with highly variable body configurations,
while an (oracle) agent with access to a learned encoding of the perturbation
performs significantly better. We introduce DMAP, a biologically-inspired,
attention-based policy network architecture. DMAP combines independent
proprioceptive processing, a distributed policy with individual controllers for
each joint, and an attention mechanism, to dynamically gate sensory information
from different body parts to different controllers. Despite not having access
to the (hidden) morphology information, DMAP can be trained end-to-end in all
the considered environments, overall matching or surpassing the performance of
an oracle agent. Thus DMAP, implementing principles from biological motor
control, provides a strong inductive bias for learning challenging sensorimotor
tasks. Overall, our work corroborates the power of these principles in
challenging locomotion tasks.
- Abstract(参考訳): 生物学的および人工的なエージェントは、現実世界の絶え間ない変化に対処する必要がある。
形態的摂動を付加した4つの古典的連続制御環境においてこの問題を研究する。
異なる身体部位の長さと厚さが変化した場合にロコモトを学ぶことは困難であり、その制御方針は、エージェントのバランスと前進を成功させるために形態に適応する必要がある。
固有受容状態に基づく制御ポリシーは、非常に可変なボディ構成ではうまく動作しないが、摂動の学習されたエンコーディングにアクセスする(oracle)エージェントは、かなりよく機能することを示す。
我々は,生物学的にインスパイアされた,注意に基づくポリシネットワークアーキテクチャであるdmapを紹介する。
DMAPは、独立した受容処理、各関節の個々のコントローラとの分散ポリシ、および注意機構を組み合わせて、異なる身体部分から異なるコントローラーへの感覚情報を動的にゲートする。
隠れた)形態情報にアクセスできないにもかかわらず、DMAPはすべての考慮された環境において、全体的な一致またはオラクルエージェントのパフォーマンスを上回る訓練をすることができる。
したがって、生物学的運動制御の原理を実装したDMAPは、困難な感覚運動のタスクを学習するために強い誘導バイアスを与える。
全体として、私たちの仕事は、ロコモーションタスクに挑戦する上で、これらの原則の力を裏付けています。
関連論文リスト
- Evolving generalist controllers to handle a wide range of morphological variations [1.4425878137951238]
人工ニューラルネットワーク(ANN)の堅牢性と一般化性の研究は、いまだに限られている。
予期せぬ形態変化や環境変化は、ANNコントローラがこれらの変化を処理できなければ失敗する可能性がある。
本稿では,制御器の堅牢性と一般化性を高めることを目的としたアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-09-18T23:06:19Z) - Incorporating Neuro-Inspired Adaptability for Continual Learning in
Artificial Intelligence [59.11038175596807]
継続的な学習は、現実世界に強い適応性を持つ人工知能を強化することを目的としている。
既存の進歩は主に、破滅的な忘れを克服するために記憶安定性を維持することに焦点を当てている。
本稿では,学習の可塑性を改善するため,パラメータ分布の古い記憶を適切に減衰させる汎用的手法を提案する。
論文 参考訳(メタデータ) (2023-08-29T02:43:58Z) - SAR: Generalization of Physiological Agility and Dexterity via
Synergistic Action Representation [10.349135207285464]
筋シナジーによるモジュラー制御は、生物がシンプルで一般化可能な行動空間で筋肉制御を学習することを可能にすることを示す。
より単純なタスクから獲得したSAR(Synergistic Action Representation)が、より複雑なタスクを学習するのに役立つ範囲を決定するためのテストベッドとして、生理学的に正確な人手と足のモデルを用いている。
いずれの場合も,SAR公開政策がエンドツーエンドの強化学習を著しく上回っていることが判明した。
論文 参考訳(メタデータ) (2023-07-07T17:07:41Z) - Latent Exploration for Reinforcement Learning [87.42776741119653]
強化学習では、エージェントは環境を探索し、相互作用することでポリシーを学ぶ。
LATent TIme-Correlated Exploration (Lattice)を提案する。
論文 参考訳(メタデータ) (2023-05-31T17:40:43Z) - Universal Morphology Control via Contextual Modulation [52.742056836818136]
異なるロボット形態をまたいだ普遍的なポリシーの学習は、継続的な制御における学習効率と一般化を著しく向上させることができる。
既存の手法では、グラフニューラルネットワークやトランスフォーマーを使用して、異種状態と異なる形態のアクション空間を処理する。
本稿では,この依存関係を文脈変調によりモデル化する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:04:12Z) - MyoSuite -- A contact-rich simulation suite for musculoskeletal motor
control [7.856809409051587]
myoSuiteは、生理学的に正確な肘、手首、手首の生体力学的モデルで、物理的な接触機能を備えている。
簡単な姿勢制御から熟練した手-物体間相互作用まで、さまざまな運動制御課題を提供する。
論文 参考訳(メタデータ) (2022-05-26T20:11:23Z) - Collective control of modular soft robots via embodied Spiking Neural
Cellular Automata [1.0323063834827415]
ボクセルベースソフトロボット(Voxel-based Soft Robots、VSR)は、いくつかの変形可能な立方体、すなわちボクセルからなるモジュラーソフトロボットの一種である。
本稿では,神経セルオートマタ(NCA)の影響を受け,生体内スパイクニューラルネットワークであるスパイキングNCAをベースとした,新しい形態の集団制御を提案する。
論文 参考訳(メタデータ) (2022-04-05T10:42:57Z) - Learning Reactive and Predictive Differentiable Controllers for
Switching Linear Dynamical Models [7.653542219337937]
専門家による実証から複合ダイナミクス行動を学習するためのフレームワークを提示する。
システムダイナミクスの近接近似としてスイッチング条件にエンコードされた接点を持つスイッチング線形ダイナミクスモデルを学ぶ。
次に、データ効率のよい制御学習のための微分可能なポリシークラスとして離散時間LQRを使用し、制御戦略を開発する。
論文 参考訳(メタデータ) (2021-03-26T04:40:24Z) - One Policy to Control Them All: Shared Modular Policies for
Agent-Agnostic Control [47.78262874364569]
我々は,多種多様なエージェント形態制御を一般化できる単一のグローバルポリシーが存在するかどうかを考察する。
我々は,このグローバルポリシを,同種のモジュール型ニューラルネットワークの集合として表現することを提案する。
複数の平面エージェントに対して,単一のモジュラポリシでロコモーション動作を生成可能であることを示す。
論文 参考訳(メタデータ) (2020-07-09T17:59:35Z) - Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。
このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文 参考訳(メタデータ) (2020-05-01T05:23:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。