Fugu-MT 論文翻訳(概要): Rapid Motor Adaptation for Robotic Manipulator Arms

論文の概要: Rapid Motor Adaptation for Robotic Manipulator Arms

arxiv url: http://arxiv.org/abs/2312.04670v2
Date: Fri, 29 Mar 2024 16:39:28 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-01 20:07:17.682053
Title: Rapid Motor Adaptation for Robotic Manipulator Arms
Title（参考訳）: ロボットマニピュレータアームの高速モータ適応
Authors: Yichao Liang, Kevin Ellis, João Henriques,
Abstract要約: 汎用的な操作スキルの開発は、AIの具体化における中核的な課題である。 Rapid Motor Adaptation (RMA)はこの課題に対して有望な解決策を提供する。我々は、様々な操作タスクにおいて、迅速な運動適応に適したエージェントを開発する。
参考スコア（独自算出の注目度）: 7.592744797132762
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Developing generalizable manipulation skills is a core challenge in embodied AI. This includes generalization across diverse task configurations, encompassing variations in object shape, density, friction coefficient, and external disturbances such as forces applied to the robot. Rapid Motor Adaptation (RMA) offers a promising solution to this challenge. It posits that essential hidden variables influencing an agent's task performance, such as object mass and shape, can be effectively inferred from the agent's action and proprioceptive history. Drawing inspiration from RMA in locomotion and in-hand rotation, we use depth perception to develop agents tailored for rapid motor adaptation in a variety of manipulation tasks. We evaluated our agents on four challenging tasks from the Maniskill2 benchmark, namely pick-and-place operations with hundreds of objects from the YCB and EGAD datasets, peg insertion with precise position and orientation, and operating a variety of faucets and handles, with customized environment variations. Empirical results demonstrate that our agents surpass state-of-the-art methods like automatic domain randomization and vision-based policies, obtaining better generalization performance and sample efficiency.
Abstract（参考訳）: 汎用的な操作スキルの開発は、AIの具体化における中核的な課題である。これには様々なタスク構成の一般化が含まれており、対象形状、密度、摩擦係数、ロボットに適用される力などの外乱のバリエーションを含んでいる。 Rapid Motor Adaptation (RMA)はこの課題に対して有望な解決策を提供する。物体の質量や形状など、エージェントのタスクパフォーマンスに影響を与える必須の隠れ変数は、エージェントの作用や受容史から効果的に推測できると仮定する。ローコモーションや手動回転におけるRMAからのインスピレーションを得て,様々な操作タスクにおいて,迅速な運動適応に適したエージェントを開発する。 Maniskill2ベンチマークから,YCBおよびEGADデータセットから数百のオブジェクトをピックアップ・アンド・プレース操作,正確な位置と向きのペグ挿入,さまざまなファセットとハンドルの操作,環境のカスタマイズなど,4つの課題に対してエージェントを評価した。実験により,我々のエージェントは,ドメインの自動ランダム化やビジョンベースのポリシといった最先端の手法を超越し,より優れた一般化性能とサンプル効率が得られることを示した。

関連論文リスト

ToolSelf: Unifying Task Execution and Self-Reconfiguration via Tool-Driven Intrinsic Adaptation [60.25542764389203]
LLM(Large Language Models)を利用したエージェントシステムは、複雑で長期のタスクに対処する上で、顕著な可能性を示している。既存のアプローチでは、手動のオーケストレーションやランタイムベースのパッチを頼りにしており、一般化の貧弱さと最適化の断片化に悩まされることが多い。ツール駆動の自己修正を可能にする新しいパラダイムであるToolSelfを提案する。
論文参考訳（メタデータ） (2026-02-08T09:27:18Z)
Automatic Cognitive Task Generation for In-Situ Evaluation of Embodied Agents [43.01384379901339]
本研究では,人間の認知に触発された未確認環境に対する動的タスク生成手法を提案する。インタラクションの段階では、エージェントは環境と積極的に対話し、タスクの実行と生成の間のループを作成する。 10シーンにわたる実験では、TAAは2サイクルで87,876のタスクを自動生成している。
論文参考訳（メタデータ） (2026-02-05T03:07:00Z)
RDAR: Reward-Driven Agent Relevance Estimation for Autonomous Driving [8.567707029486469]
本稿では,事前学習された行動モデルへの入力からどのエージェントを除外できるかを特定することによって,エージェントごとの妥当性を学習する戦略を提案する。我々はRDARを大規模運転データセット上で評価し、その妥当性の正確な数値的尺度を学習する能力を示す。
論文参考訳（メタデータ） (2025-09-24T06:19:31Z)
Dita: Scaling Diffusion Transformer for Generalist Vision-Language-Action Policy [56.424032454461695]
本稿では,Transformerアーキテクチャを活用した拡張性のあるフレームワークであるDitaについて紹介する。 Ditaはコンテキスト内コンディショニング(context conditioning)を採用しており、歴史的観察から生の視覚トークンと識別されたアクションをきめ細やかなアライメントを可能にする。 Ditaは、さまざまなカメラパースペクティブ、観察シーン、タスク、アクションスペースの横断的なデータセットを効果的に統合する。
論文参考訳（メタデータ） (2025-03-25T15:19:56Z)
CAIMAN: Causal Action Influence Detection for Sample-efficient Loco-manipulation [17.94272840532448]
我々は,ロボットが環境内の他のエンティティを制御できるようにする強化学習フレームワークであるCAIMANを提案する。シミュレーションにおけるCAIMANの優れたサンプル効率と多様なシナリオへの適応性を実証的に実証した。
論文参考訳（メタデータ） (2025-02-02T16:16:53Z)
The Art of Imitation: Learning Long-Horizon Manipulation Tasks from Few Demonstrations [13.747258771184372]
TP-GMMの適用にはいくつかのオープンな課題がある。我々はロボットのエンドエフェクター速度を方向と大きさに分解する。次に、複雑な実証軌道からセグメントとシーケンスのスキルを抽出する。私たちのアプローチでは,5つのデモから複雑な操作タスクを学習することが可能です。
論文参考訳（メタデータ） (2024-07-18T12:01:09Z)
External Model Motivated Agents: Reinforcement Learning for Enhanced Environment Sampling [3.536024441537599]
強化学習(RL)エージェントとは異なり、人間は環境の変化において有能なマルチタスクのままである。環境変化における外部モデルの適応効率を向上させるために,RLエージェントのエージェント影響フレームワークを提案する。提案手法は,効率と性能の両面を測る指標に対する外部モデル適応の観点から,ベースラインよりも優れていることを示す。
論文参考訳（メタデータ） (2024-06-28T23:31:22Z)
QuadrupedGPT: Towards a Versatile Quadruped Agent in Open-ended Worlds [51.05639500325598]
ペットに匹敵するアジリティで多様なコマンドに従うように設計されたQuadrupedGPTを紹介します。エージェントは多種多様なタスクを処理し,複雑な指示を行う能力を示し,多種多様四重化エージェントの開発に向けた重要な一歩である。
論文参考訳（メタデータ） (2024-06-24T12:14:24Z)
Adaptive Manipulation using Behavior Trees [12.061325774210392]
本稿では,タスク実行中の視覚的・非視覚的観察にロボットが迅速に適応できる適応行動木を提案する。産業環境でよく見られる多くのタスクに対して、我々のアプローチを検証します。
論文参考訳（メタデータ） (2024-06-20T18:01:36Z)
HAZARD Challenge: Embodied Decision Making in Dynamically Changing Environments [93.94020724735199]
HAZARDは、火災、洪水、風などの3つの予期せぬ災害シナリオで構成されている。このベンチマークにより、さまざまなパイプラインで自律エージェントの意思決定能力を評価することができる。
論文参考訳（メタデータ） (2024-01-23T18:59:43Z)
RoboAgent: Generalization and Efficiency in Robot Manipulation via Semantic Augmentations and Action Chunking [54.776890150458385]
マルチタスク操作能力を持つユニバーサルエージェントを訓練するための効率的なシステムを開発した。私たちは、12のスキルを持つ1つのエージェントを訓練することができ、38のタスクでその一般化を実証することができます。平均すると、RoboAgentは目に見えない状況において、従来の方法よりも40%以上性能が高い。
論文参考訳（メタデータ） (2023-09-05T03:14:39Z)
Instruction-driven history-aware policies for robotic manipulations [82.25511767738224]
複数の入力を考慮に入れた統一型トランスフォーマー方式を提案する。特に,我々のトランスフォーマーアーキテクチャは,(i)自然言語命令と(ii)多視点シーン観測を統合している。 RLBenchベンチマークと実世界のロボットを用いて,本手法の評価を行った。
論文参考訳（メタデータ） (2022-09-11T16:28:25Z)
Generalizing Decision Making for Automated Driving with an Invariant Environment Representation using Deep Reinforcement Learning [55.41644538483948]
現在のアプローチは、トレーニングデータを超えてよく一般化されないか、または可変数のトラフィック参加者を考慮することができない。本研究では,エゴ車の観点から不変環境表現を提案する。この抽象化により,エージェントが未確認シナリオに対してうまく一般化できることが示される。
論文参考訳（メタデータ） (2021-02-12T20:37:29Z)
ReLMoGen: Leveraging Motion Generation in Reinforcement Learning for Mobile Manipulation [99.2543521972137]
ReLMoGenは、サブゴールを予測するための学習されたポリシーと、これらのサブゴールに到達するために必要な動作を計画し実行するためのモーションジェネレータを組み合わせたフレームワークである。本手法は,フォトリアリスティック・シミュレーション環境における7つのロボットタスクの多種多様なセットをベンチマークする。 ReLMoGenは、テスト時に異なるモーションジェネレータ間で顕著な転送可能性を示し、実際のロボットに転送する大きな可能性を示している。
論文参考訳（メタデータ） (2020-08-18T08:05:15Z)
Learning Compliance Adaptation in Contact-Rich Manipulation [81.40695846555955]
本稿では,コンタクトリッチタスクに必要な力プロファイルの予測モデルを学習するための新しいアプローチを提案する。このアプローチは、双方向Gated Recurrent Units (Bi-GRU) に基づく異常検出と適応力/インピーダンス制御を組み合わせたものである。
論文参考訳（メタデータ） (2020-05-01T05:23:34Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。