論文の概要: QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds
- arxiv url: http://arxiv.org/abs/2406.16578v2
- Date: Tue, 03 Dec 2024 03:49:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:38:41.506472
- Title: QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds
- Title(参考訳): 四重化GPT:オープンエンド世界における四重化エージェントを目指して
- Authors: Yuting Mei, Ye Wang, Sipeng Zheng, Qin Jin,
- Abstract要約: ペットに匹敵するアジリティで多様なコマンドに従うように設計されたQuadrupedGPTを紹介します。
エージェントは多種多様なタスクを処理し,複雑な指示を行う能力を示し,多種多様四重化エージェントの開発に向けた重要な一歩である。
- 参考スコア(独自算出の注目度): 51.05639500325598
- License:
- Abstract: As robotic agents increasingly assist humans in reality, quadruped robots offer unique opportunities for interaction in complex scenarios due to their agile movement. However, building agents that can autonomously navigate, adapt, and respond to versatile goals remains a significant challenge. In this work, we introduce QuadrupedGPT designed to follow diverse commands with agility comparable to that of a pet. The primary challenges addressed include: i) effectively utilizing multimodal observations for informed decision-making; ii) achieving agile control by integrating locomotion and navigation; iii) developing advanced cognition to execute long-term objectives. Our QuadrupedGPT interprets human commands and environmental contexts using a large multimodal model. Leveraging its extensive knowledge base, the agent autonomously assigns parameters for adaptive locomotion policies and devises safe yet efficient paths toward its goals. Additionally, it employs high-level reasoning to decompose long-term goals into a sequence of executable subgoals. Through comprehensive experiments, our agent shows proficiency in handling diverse tasks and intricate instructions, representing a significant step toward the development of versatile quadruped agents for open-ended environments.
- Abstract(参考訳): ロボットエージェントが現実の人間を助けるようになるにつれ、四足ロボットはアジャイルの動きによって複雑なシナリオで対話するユニークな機会を提供する。
しかし、自律的にナビゲートし、適応し、多目的な目標に反応できるエージェントを構築することは、依然として重要な課題である。
本研究では,ペットに匹敵する俊敏性を備えた多種多様なコマンドに従うように設計されたQuadrupedGPTを紹介する。
主な課題は以下のとおりである。
一 情報的意思決定にマルチモーダルな観察を効果的に活用すること。
二 移動と航法を統合することにより、アジャイル制御を達成すること。
三 長期的な目的を遂行するための先進的な認知の発達
我々のQuadrupedGPTは、大規模なマルチモーダルモデルを用いて、人間の命令と環境コンテキストを解釈する。
エージェントは、その広範な知識ベースを活用して、適応的な移動ポリシーのパラメータを自律的に割り当て、安全で効率的な経路を目標に向けて考案する。
さらに、長期目標を実行可能なサブゴールの列に分解するために、高レベルの推論を用いる。
総合的な実験を通して,多種多様なタスクの処理能力と複雑な指示能力を示し,オープンエンド環境のための多目的四重化エージェントの開発に向けた重要なステップを示す。
関連論文リスト
- Grounding Language Models in Autonomous Loco-manipulation Tasks [3.8363685417355557]
異なるシナリオにおけるタスクに基づいて行動を学び、選択し、計画する新しいフレームワークを提案する。
我々は,大規模言語モデル(LLM)の計画と推論機能を活用し,階層的なタスクグラフを構築する。
CENTAUROロボットを用いたシミュレーションおよび実世界の実験により、言語モデルに基づくプランナーが、新しいロコ操作タスクに効率的に適応できることが示されている。
論文 参考訳(メタデータ) (2024-09-02T15:27:48Z) - Reinforcement Learning for Versatile, Dynamic, and Robust Bipedal Locomotion Control [106.32794844077534]
本稿では,二足歩行ロボットのための動的移動制御系を構築するために,深層強化学習を用いた研究について述べる。
本研究では、周期歩行やランニングから周期ジャンプや立位に至るまで、様々な動的二足歩行技術に使用できる汎用的な制御ソリューションを開発する。
この研究は、二足歩行ロボットの俊敏性の限界を、現実世界での広範な実験を通じて押し上げる。
論文 参考訳(メタデータ) (2024-01-30T10:48:43Z) - Learning Diverse Skills for Local Navigation under Multi-constraint
Optimality [27.310655303502305]
本研究では,品質と多様性のトレードオフについて,制約付き最適化の観点から考察する。
我々は、異なる報酬によって定義される値関数に制約を課しながら、多様なポリシーを得ることができることを示す。
訓練されたポリシーは、本物の12-DoFの四足歩行ロボットSolo12によく伝達される。
論文 参考訳(メタデータ) (2023-10-03T21:21:21Z) - RoboAgent: Generalization and Efficiency in Robot Manipulation via
Semantic Augmentations and Action Chunking [54.776890150458385]
マルチタスク操作能力を持つユニバーサルエージェントを訓練するための効率的なシステムを開発した。
私たちは、12のスキルを持つ1つのエージェントを訓練することができ、38のタスクでその一般化を実証することができます。
平均すると、RoboAgentは目に見えない状況において、従来の方法よりも40%以上性能が高い。
論文 参考訳(メタデータ) (2023-09-05T03:14:39Z) - AlphaBlock: Embodied Finetuning for Vision-Language Reasoning in Robot
Manipulation [50.737355245505334]
本稿では,ロボット操作タスクにおける高レベル認知能力を学習するための新しいフレームワークを提案する。
得られたデータセットAlphaBlockは、多段階のテキストプランとペア観測による35の包括的なハイレベルタスクで構成されている。
論文 参考訳(メタデータ) (2023-05-30T09:54:20Z) - Robust and Versatile Bipedal Jumping Control through Reinforcement
Learning [141.56016556936865]
この研究は、トルク制御された二足歩行ロボットが実世界で頑丈で多目的なダイナミックジャンプを行えるようにすることで、二足歩行ロボットの機敏さの限界を推し進めることを目的としている。
本稿では,ロボットが様々な場所や方向へジャンプするなど,さまざまなジャンプタスクを達成するための強化学習フレームワークを提案する。
我々は,ロボットの長期入出力(I/O)履歴を符号化し,短期I/O履歴への直接アクセスを可能にする新しいポリシー構造を開発する。
論文 参考訳(メタデータ) (2023-02-19T01:06:09Z) - Planning Immediate Landmarks of Targets for Model-Free Skill Transfer
across Agents [34.56191646231944]
我々はPILoT、即時ターゲットのランドマーク計画を提案する。
PILoTはゴール条件のステートプランナーを学習し、ゴールプランナーを蒸留してモデルなしのスタイルで即時ランドマークを計画する。
PILoTは,アクション空間やダイナミックスを横断する数発のショット転送など,様々なトランスファーの課題に対して有効であることを示す。
論文 参考訳(メタデータ) (2022-12-18T08:03:21Z) - Evolving Hierarchical Memory-Prediction Machines in Multi-Task
Reinforcement Learning [4.030910640265943]
行動エージェントは、時間とともに様々な環境や目的にまたがって一般化されなければならない。
遺伝的プログラミングを用いて、制御文献から6つのユニークな環境で動作可能な、高度に一般化されたエージェントを進化させる。
進化するプログラムにおける創発的階層構造は、時間分解とメモリ上の問題環境の符号化を成功させるマルチタスクエージェントをもたらすことを示す。
論文 参考訳(メタデータ) (2021-06-23T21:34:32Z) - Guided Navigation from Multiple Viewpoints using Qualitative Spatial
Reasoning [0.0]
本研究の目的は、感覚障害者ロボットを目標地点に誘導するアルゴリズムを開発することである。
この研究で考慮される主な課題は、自律的なエージェントのグループを考えると、一連のハイレベルなコマンドを生成できるアルゴリズムの開発と評価である。
論文 参考訳(メタデータ) (2020-11-03T00:34:26Z) - Automatic Curriculum Learning through Value Disagreement [95.19299356298876]
新しい未解決タスクを継続的に解決することが、多様な行動を学ぶための鍵です。
エージェントが複数の目標を達成する必要があるマルチタスク領域では、トレーニング目標の選択はサンプル効率に大きな影響を与える可能性がある。
そこで我々は,エージェントが解決すべき目標のための自動カリキュラムを作成することを提案する。
提案手法は,13のマルチゴールロボットタスクと5つのナビゲーションタスクにまたがって評価し,現在の最先端手法よりも高い性能を示す。
論文 参考訳(メタデータ) (2020-06-17T03:58:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。