論文の概要: AnyBody: A Benchmark Suite for Cross-Embodiment Manipulation
- arxiv url: http://arxiv.org/abs/2505.14986v1
- Date: Wed, 21 May 2025 00:21:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:58.798424
- Title: AnyBody: A Benchmark Suite for Cross-Embodiment Manipulation
- Title(参考訳): AnyBody: クロス・エボディメント・マニピュレーションのためのベンチマーク・スイート
- Authors: Meenal Parakh, Alexandre Kirchmeyer, Beining Han, Jia Deng,
- Abstract要約: ロボット工学におけるスケーラブルで伝達可能な学習を実現する上で、新しい実施形態に対する制御ポリシーの一般化は、依然として根本的な課題である。
本稿では,多種多様な形態素を横断する2つの基礎的タスクリーチとプッシュアラウンドに着目し,クロスボデーメント操作の学習のためのベンチマークを紹介する。
異なるRLポリシーが複数の形態から学習し、新しい政策に一般化する能力を評価する。
- 参考スコア(独自算出の注目度): 59.671764778486995
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalizing control policies to novel embodiments remains a fundamental challenge in enabling scalable and transferable learning in robotics. While prior works have explored this in locomotion, a systematic study in the context of manipulation tasks remains limited, partly due to the lack of standardized benchmarks. In this paper, we introduce a benchmark for learning cross-embodiment manipulation, focusing on two foundational tasks-reach and push-across a diverse range of morphologies. The benchmark is designed to test generalization along three axes: interpolation (testing performance within a robot category that shares the same link structure), extrapolation (testing on a robot with a different link structure), and composition (testing on combinations of link structures). On the benchmark, we evaluate the ability of different RL policies to learn from multiple morphologies and to generalize to novel ones. Our study aims to answer whether morphology-aware training can outperform single-embodiment baselines, whether zero-shot generalization to unseen morphologies is feasible, and how consistently these patterns hold across different generalization regimes. The results highlight the current limitations of multi-embodiment learning and provide insights into how architectural and training design choices influence policy generalization.
- Abstract(参考訳): ロボット工学におけるスケーラブルで伝達可能な学習を実現する上で、新しい実施形態に対する制御ポリシーの一般化は、依然として根本的な課題である。
以前の研究ではこれをローコモーションで検討していたが、標準化されたベンチマークが欠如していることもあって、操作タスクの文脈における体系的な研究は限定的のままである。
本稿では,多種多様な形態にまたがる2つの基本課題に焦点をあて,クロスボデーメント操作を学習するためのベンチマークを提案する。
このベンチマークは、補間(同一リンク構造を共有するロボットカテゴリ内での性能をテストする)、外挿(異なるリンク構造を持つロボットをテストする)、合成(リンク構造の組み合わせをテストする)の3つの軸に沿った一般化をテストするように設計されている。
ベンチマークでは、異なるRLポリシーが複数の形態から学習し、新しいものへ一般化する能力を評価する。
本研究の目的は,形態学を意識したトレーニングが単一身体のベースラインを上回り,ゼロショットの一般化と見えない形態への一般化が実現可能か,これらのパターンが多種多様な一般化体制でいかに一貫して保持されるか,といった問題に対処することである。
この結果は,多身体学習の現在の限界を強調し,建築設計と訓練設計の選択が政策の一般化にどのように影響するかについての洞察を提供する。
関連論文リスト
- Model Evolution Framework with Genetic Algorithm for Multi-Task Reinforcement Learning [85.91908329457081]
マルチタスク強化学習は、様々なシナリオにまたがって一般化可能なエージェントを開発することを目的として、様々なタスクを完遂するために単一のポリシーを採用する。
既存のアプローチでは、ルーティングネットワークを使用して各タスクの特定のルートを生成し、モジュールのセットをさまざまなモデルに再構築し、複数のタスクを同時に完了させるのが一般的である。
本稿では,遺伝的アルゴリズム(MEGA)を用いたモデル進化フレームワークを提案する。
論文 参考訳(メタデータ) (2025-02-19T09:22:34Z) - Dynamic Post-Hoc Neural Ensemblers [55.15643209328513]
本研究では,ニューラルネットワークをアンサンブル手法として活用することを検討する。
低多様性のアンサンブルを学習するリスクを動機として,ベースモデル予測をランダムにドロップすることでモデルの正規化を提案する。
このアプローチはアンサンブル内の多様性を低くし、オーバーフィッティングを減らし、一般化能力を向上させる。
論文 参考訳(メタデータ) (2024-10-06T15:25:39Z) - Exploring the Learning Capabilities of Language Models using LEVERWORLDS [23.40759867281453]
設定のモデルを学ぶには、一般的な構造ルールとインスタンスの特定の特性の両方を学ぶ必要がある。
本稿では,様々な学習方法における一般学習と特定学習の相互作用について,サンプル効率に着目して検討する。
論文 参考訳(メタデータ) (2024-10-01T09:02:13Z) - Universal Morphology Control via Contextual Modulation [52.742056836818136]
異なるロボット形態をまたいだ普遍的なポリシーの学習は、継続的な制御における学習効率と一般化を著しく向上させることができる。
既存の手法では、グラフニューラルネットワークやトランスフォーマーを使用して、異種状態と異なる形態のアクション空間を処理する。
本稿では,この依存関係を文脈変調によりモデル化する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:04:12Z) - Inferring Versatile Behavior from Demonstrations by Matching Geometric
Descriptors [72.62423312645953]
人間は直感的にタスクを多目的に解決し、軌道に基づく計画や個々のステップの行動を変化させる。
現在のImitation Learningアルゴリズムは、通常、単調な専門家によるデモンストレーションのみを考慮し、状態アクションベースの設定で行動する。
代わりに、移動プリミティブの混合と分布マッチングの目的を組み合わせることで、専門家の行動と汎用性にマッチする多目的行動を学ぶ。
論文 参考訳(メタデータ) (2022-10-17T16:42:59Z) - Dual Path Structural Contrastive Embeddings for Learning Novel Objects [6.979491536753043]
近年の研究では、優れた特徴空間の情報を取得することが、少数のタスクにおいて良好なパフォーマンスを達成するための効果的な解決法であることが示されている。
特徴表現と分類器を学習するタスクを分離する,単純だが効果的なパラダイムを提案する。
提案手法は, インダクティブ推論とトランスダクティブ推論のいずれにおいても, 標準および一般化された少数ショット問題に対して有望な結果が得られる。
論文 参考訳(メタデータ) (2021-12-23T04:43:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。