論文の概要: Task-Agnostic Morphology Evolution
- arxiv url: http://arxiv.org/abs/2102.13100v1
- Date: Thu, 25 Feb 2021 18:59:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-02-26 13:55:55.998843
- Title: Task-Agnostic Morphology Evolution
- Title(参考訳): タスク・アグノスティック・モルフォロジーの進化
- Authors: Donald J. Hejna III, Pieter Abbeel, Lerrel Pinto
- Abstract要約: モルフォロジーと振る舞いを共同適用する現在のアプローチでは、特定のタスクの報酬をモルフォロジー最適化のシグナルとして使用します。
これはしばしば高価なポリシー最適化を必要とし、一般化するために構築されていないタスクに依存した形態をもたらす。
我々は,これらの問題を緩和するための新しいアプローチであるタスク非依存形態進化(tame)を提案する。
- 参考スコア(独自算出の注目度): 94.97384298872286
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep reinforcement learning primarily focuses on learning behavior, usually
overlooking the fact that an agent's function is largely determined by form.
So, how should one go about finding a morphology fit for solving tasks in a
given environment? Current approaches that co-adapt morphology and behavior use
a specific task's reward as a signal for morphology optimization. However, this
often requires expensive policy optimization and results in task-dependent
morphologies that are not built to generalize. In this work, we propose a new
approach, Task-Agnostic Morphology Evolution (TAME), to alleviate both of these
issues. Without any task or reward specification, TAME evolves morphologies by
only applying randomly sampled action primitives on a population of agents.
This is accomplished using an information-theoretic objective that efficiently
ranks agents by their ability to reach diverse states in the environment and
the causality of their actions. Finally, we empirically demonstrate that across
2D, 3D, and manipulation environments TAME can evolve morphologies that match
the multi-task performance of those learned with task supervised algorithms.
Our code and videos can be found at
https://sites.google.com/view/task-agnostic-evolution.
- Abstract(参考訳): 深い強化学習は主に学習行動に焦点を当て、通常、エージェントの機能が主に形態によって決定されるという事実を見渡す。
では、ある環境でタスクを解決するのに適した形態を見つけるには、どうすればよいでしょうか?
モルフォロジーと振る舞いを共同適用する現在のアプローチでは、特定のタスクの報酬をモルフォロジー最適化のシグナルとして使用します。
しかし、これはしばしば高価なポリシー最適化を必要とし、一般化するために構築されていないタスクに依存した形態をもたらす。
そこで本研究では,これらの問題を緩和するための新しい手法であるタスク非依存形態進化(tame)を提案する。
タスクや報酬の仕様がなければ、TAMEはエージェントの集団にランダムにサンプル化されたアクションプリミティブのみを適用することで形態学を進化させる。
これは、環境の多様な状態に到達する能力と行動の原因によってエージェントを効率的にランク付けする情報理論の目標を使用して達成されます。
最後に,2次元,3次元,操作環境において,タスク教師付きアルゴリズムで学習したタスクのマルチタスク性能に適合する形態素を進化させることができることを実証的に示す。
コードとビデオは https://sites.google.com/view/task-agnostic-evolution.com をご覧ください。
関連論文リスト
- Gradient-based inference of abstract task representations for generalization in neural networks [5.794537047184604]
ニューラルネットワークを介してタスク表現層に逆伝播する勾配は、現在のタスク要求を推測する効率的な方法であることを示す。
勾配に基づく推論は、学習効率の向上と、新しいタスクや制限への一般化をもたらすことを実証する。
論文 参考訳(メタデータ) (2024-07-24T15:28:08Z) - Task2Morph: Differentiable Task-inspired Framework for Contact-Aware Robot Design [5.4795537587182475]
本稿では,タスク2Morphと呼ばれる接触認識型ロボット設計のための,新しい識別可能なタスクインスパイアされたフレームワークを提案する。
そこでは,マッピング学習と全最適化の両方に勾配情報を活用した,微分可能なロボット設計プロセスにマッピングを組み込む。
実験は3つのシナリオで実施され,Task2MorphがDiffHandより優れていることが確認された。
論文 参考訳(メタデータ) (2024-03-28T02:02:00Z) - DARLEI: Deep Accelerated Reinforcement Learning with Evolutionary
Intelligence [77.78795329701367]
本稿では,進化アルゴリズムと並列化強化学習を組み合わせたフレームワークであるDARLEIを提案する。
我々はDARLEIの性能を様々な条件で特徴付け、進化形態の多様性に影響を与える要因を明らかにした。
今後DARLEIを拡張して、よりリッチな環境における多様な形態素間の相互作用を取り入れていきたいと考えています。
論文 参考訳(メタデータ) (2023-12-08T16:51:10Z) - Dynamic-Resolution Model Learning for Object Pile Manipulation [33.05246884209322]
本研究では,様々な抽象レベルで動的かつ適応的な表現を学習し,効率と効率の最適なトレードオフを実現する方法について検討する。
具体的には、環境の動的分解能粒子表現を構築し、グラフニューラルネットワーク(GNN)を用いた統一力学モデルを学ぶ。
本手法は, 粒状オブジェクトの収集, ソート, 再分配において, 最先端の固定解像度ベースラインよりも優れた性能が得られることを示す。
論文 参考訳(メタデータ) (2023-06-29T05:51:44Z) - Neural Routing in Meta Learning [9.070747377130472]
入力タスクに条件付けされたモデルの部分のみを選択的に使用することにより,現在のメタ学習アルゴリズムのモデル性能を向上させることを目指している。
本稿では、バッチ正規化層におけるスケーリング係数を活用することにより、深層畳み込みニューラルネットワーク(CNN)におけるタスク依存の動的ニューロン選択を研究するアプローチについて述べる。
提案手法であるニューラルルーティング・イン・メタラーニング(NRML)は,数ショットの分類タスクにおいて,既知のメタラーニングベースラインの1つである。
論文 参考訳(メタデータ) (2022-10-14T16:31:24Z) - Set-based Meta-Interpolation for Few-Task Meta-Learning [79.4236527774689]
そこで本研究では,メタトレーニングタスクの分散化を目的とした,ドメインに依存しないタスク拡張手法Meta-Interpolationを提案する。
様々な領域にまたがる8つのデータセットに対してメタ補間の有効性を実証的に検証した。
論文 参考訳(メタデータ) (2022-05-20T06:53:03Z) - Explaining the Effectiveness of Multi-Task Learning for Efficient
Knowledge Extraction from Spine MRI Reports [2.5953185061765884]
一つのマルチタスクモデルがタスク固有のモデルの性能にマッチすることを示す。
内科医による頚椎, 腰椎への注視所見について検討した。
論文 参考訳(メタデータ) (2022-05-06T01:51:19Z) - Learning to Shift Attention for Motion Generation [55.61994201686024]
ロボット学習を用いた動作生成の課題の1つは、人間のデモが1つのタスククエリに対して複数のモードを持つ分布に従うことである。
以前のアプローチでは、すべてのモードをキャプチャできなかったり、デモの平均モードを取得できないため、無効なトラジェクトリを生成する傾向があった。
この問題を克服する外挿能力を有するモーション生成モデルを提案する。
論文 参考訳(メタデータ) (2021-02-24T09:07:52Z) - Adaptive Task Sampling for Meta-Learning [79.61146834134459]
数ショットの分類のためのメタラーニングの鍵となるアイデアは、テスト時に直面した数ショットの状況を模倣することである。
一般化性能を向上させるための適応型タスクサンプリング手法を提案する。
論文 参考訳(メタデータ) (2020-07-17T03:15:53Z) - Hierarchical Reinforcement Learning as a Model of Human Task
Interleaving [60.95424607008241]
我々は、強化学習によって駆動される監督制御の階層モデルを開発する。
このモデルは、タスクインターリービングの既知の経験的効果を再現する。
その結果、階層的RLがタスクインターリービングのもっともらしいモデルとして支持された。
論文 参考訳(メタデータ) (2020-01-04T17:53:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。