論文の概要: Active Embodiment Identification with Reinforcement Learning for Legged Robots
- arxiv url: http://arxiv.org/abs/2605.08020v1
- Date: Fri, 08 May 2026 17:07:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-11 19:43:39.229115
- Title: Active Embodiment Identification with Reinforcement Learning for Legged Robots
- Title(参考訳): 足ロボットの強化学習による能動的身体識別
- Authors: Nico Bohlinger, Jan Peters,
- Abstract要約: 本稿では,情報探索行動と明示的具体化予測を共同で学習する脚付きロボットの能動的具体化識別手法を提案する。
歴史的に拡張されたURMAアーキテクチャを用いて、異なる形態のシミュレーションにおいて環境との相互作用を通じて、共同レベルおよびグローバルなエンボディメントパラメータを推定する。
- 参考スコア(独自算出の注目度): 16.640420524594443
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present an active embodiment identification method for legged robots that jointly learns information-seeking behavior and explicit embodiment prediction. Using a history-augmented URMA architecture, the method infers joint-level and global embodiment parameters through interaction with the environment in simulation across different morphologies.
- Abstract(参考訳): 本稿では,情報探索行動と明示的具体化予測を共同で学習する脚付きロボットの能動的具体化識別手法を提案する。
歴史的に拡張されたURMAアーキテクチャを用いて、異なる形態のシミュレーションにおいて環境との相互作用を通じて、共同レベルおよびグローバルなエンボディメントパラメータを推定する。
関連論文リスト
- AdaMorph: Unified Motion Retargeting via Embodiment-Aware Adaptive Transformers [49.796014934503184]
本研究では、単一モデルで多様なロボット形態に人間の動きを適応させることができる統一型ニューラルネットワークフレームワークを提案する。
12個の異なるヒューマノイドロボットの実験結果から、AdaMorphが異種トポロジにわたって効果的に制御できることが示されている。
論文 参考訳(メタデータ) (2026-01-12T07:39:38Z) - Situationally-Aware Dynamics Learning [57.698553219660376]
隠れ状態表現のオンライン学習のための新しいフレームワークを提案する。
提案手法は、非観測パラメータが遷移力学と報酬構造の両方に与える影響を明示的にモデル化する。
シミュレーションと実世界の両方の実験は、データ効率、ポリシー性能、安全で適応的なナビゲーション戦略の出現を著しく改善した。
論文 参考訳(メタデータ) (2025-05-26T06:40:11Z) - AnyBody: A Benchmark Suite for Cross-Embodiment Manipulation [59.671764778486995]
ロボット工学におけるスケーラブルで伝達可能な学習を実現する上で、新しい実施形態に対する制御ポリシーの一般化は、依然として根本的な課題である。
本稿では,多種多様な形態素を横断する2つの基礎的タスクリーチとプッシュアラウンドに着目し,クロスボデーメント操作の学習のためのベンチマークを紹介する。
異なるRLポリシーが複数の形態から学習し、新しい政策に一般化する能力を評価する。
論文 参考訳(メタデータ) (2025-05-21T00:21:38Z) - MoVEInt: Mixture of Variational Experts for Learning Human-Robot Interactions from Demonstrations [19.184155232662995]
我々は,人間-ロボットインタラクション(HRI)のための共有潜在空間表現学習のための新しいアプローチを提案する。
本研究では,情報的潜在空間を用いて,ロボットの動きを正規化するための変分オートエンコーダ(VAE)を訓練する。
VAEにおける人間の観察に先立って情報的MDNを使用するアプローチは,より正確なロボットの動きを生成する。
論文 参考訳(メタデータ) (2024-07-10T13:16:12Z) - A VAE-based Framework for Learning Multi-Level Neural Granger-Causal
Connectivity [15.295157876811066]
本稿では, 関連系・異種系系の集合において, 成分間の顆粒・因果関係を共同で学習する変分オートエンコーダに基づくフレームワークを提案する。
提案するフレームワークの性能は,複数の合成データ設定に基づいて評価し,個別のシステム学習用に設計された既存手法と比較した。
論文 参考訳(メタデータ) (2024-02-25T16:11:32Z) - Universal Morphology Control via Contextual Modulation [52.742056836818136]
異なるロボット形態をまたいだ普遍的なポリシーの学習は、継続的な制御における学習効率と一般化を著しく向上させることができる。
既存の手法では、グラフニューラルネットワークやトランスフォーマーを使用して、異種状態と異なる形態のアクション空間を処理する。
本稿では,この依存関係を文脈変調によりモデル化する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:04:12Z) - MILD: Multimodal Interactive Latent Dynamics for Learning Human-Robot
Interaction [34.978017200500005]
我々は,HRI(Human-Robot Interactions)の問題に対処するために,MILD(Multimodal Interactive Latent Dynamics)を提案する。
変分オートエンコーダ(VAE)の潜時空間における相互作用エージェントの結合分布をモデル化するために,Hidden Semi-Markov Models (HSMMs) を用いて実演から相互作用ダイナミクスを学習する。
MILDは、観察されたエージェント(人間の)軌道に条件付けされたときに、制御されたエージェント(ロボット)に対してより正確な軌道を生成する。
論文 参考訳(メタデータ) (2022-10-22T11:25:11Z) - Human-Robot Collaboration and Machine Learning: A Systematic Review of
Recent Research [69.48907856390834]
人間ロボットコラボレーション(Human-robot collaboration、HRC)とは、人間とロボットの相互作用を探索する手法である。
本稿では,HRCの文脈における機械学習技術の利用に関する詳細な文献レビューを提案する。
論文 参考訳(メタデータ) (2021-10-14T15:14:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。