論文の概要: RoboMoRe: LLM-based Robot Co-design via Joint Optimization of Morphology and Reward
- arxiv url: http://arxiv.org/abs/2506.00276v1
- Date: Fri, 30 May 2025 22:16:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-04 21:47:32.590935
- Title: RoboMoRe: LLM-based Robot Co-design via Joint Optimization of Morphology and Reward
- Title(参考訳): RoboMoRe:モルフォロジーとリワードの共同最適化によるLLMロボットの共同設計
- Authors: Jiawei Fang, Yuxuan Sun, Chengtian Ma, Qiuyu Lu, Lining Yao,
- Abstract要約: RoboMoReは、ロボットの共同設計ループ内での共同最適化のための形態と報酬形成を統合するフレームワークである。
粗い最適化段階において、LLMに基づく多様性反射機構は、多様かつ高品質な形態-逆対を生成する。
最適化段階では、LLM誘導報酬とモルフォロジー勾配の更新を交互に行い、上位候補を反復的に洗練する。
- 参考スコア(独自算出の注目度): 21.110738533383277
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Robot co-design, jointly optimizing morphology and control policy, remains a longstanding challenge in the robotics community, where many promising robots have been developed. However, a key limitation lies in its tendency to converge to sub-optimal designs due to the use of fixed reward functions, which fail to explore the diverse motion modes suitable for different morphologies. Here we propose RoboMoRe, a large language model (LLM)-driven framework that integrates morphology and reward shaping for co-optimization within the robot co-design loop. RoboMoRe performs a dual-stage optimization: in the coarse optimization stage, an LLM-based diversity reflection mechanism generates both diverse and high-quality morphology-reward pairs and efficiently explores their distribution. In the fine optimization stage, top candidates are iteratively refined through alternating LLM-guided reward and morphology gradient updates. RoboMoRe can optimize both efficient robot morphologies and their suited motion behaviors through reward shaping. Results demonstrate that without any task-specific prompting or predefined reward/morphology templates, RoboMoRe significantly outperforms human-engineered designs and competing methods across eight different tasks.
- Abstract(参考訳): ロボットの共同設計は、形態と制御ポリシーを共同で最適化するものであり、多くの有望なロボットが開発されているロボットコミュニティにおいて、長年にわたる課題である。
しかし、鍵となる制限は、固定された報酬関数を用いることにより、最適でない設計に収束する傾向にある。
本稿では,ロボット共設計ループ内での共最適化のための形態と報酬形成を統合した大規模言語モデル(LLM)駆動のフレームワークであるRoboMoReを提案する。
粗い最適化段階では、LLMベースのダイバーシティリフレクション機構が多様かつ高品質なモルフォロジー-リワードペアを生成し、それらの分布を効率的に探索する。
最適化段階では、LLM誘導報酬とモルフォロジー勾配の更新を交互に行い、上位候補を反復的に洗練する。
RoboMoReは、報酬形成を通じて、効率的なロボット形態と適切な動作の両方を最適化することができる。
結果は、タスク固有のプロンプトや事前に定義された報酬/形態テンプレートがなければ、RoboMoReは8つの異なるタスクにまたがる人間工学的な設計や競合する手法よりも大幅に優れることを示した。
関連論文リスト
- BodyGen: Advancing Towards Efficient Embodiment Co-Design [33.072802665855626]
エボディメントの共同設計は、ロボットの形態と制御ポリシーを同時に最適化することを目的としている。
設計と制御の両方にトポロジを意識した自己アテンションを利用するBodyGenを提案する。
Bodyは最先端のベースラインに対して平均60.03%のパフォーマンス改善を実現している。
論文 参考訳(メタデータ) (2025-03-01T15:25:42Z) - Simultaneous Multi-Robot Motion Planning with Projected Diffusion Models [57.45019514036948]
MRMP拡散(SMD)は、制約付き最適化を拡散サンプリングプロセスに統合し、運動学的に実現可能な軌道を生成する新しい手法である。
本稿では, ロボット密度, 障害物の複雑度, 動作制約の異なるシナリオ間の軌道計画アルゴリズムを評価するための総合的MRMPベンチマークを提案する。
論文 参考訳(メタデータ) (2025-02-05T20:51:28Z) - STAR: Synthesis of Tailored Architectures [61.080157488857516]
本稿では, 適合型アーキテクチャ (STAR) の新規な合成手法を提案する。
提案手法は線形入力可変系の理論に基づく新しい探索空間を結合し,階層的な数値エンコーディングをアーキテクチャゲノムに支持する。STARゲノムは,複数のモデル品質と効率の指標に最適化するために,勾配のない進化的アルゴリズムで自動的に精製・組換えされる。
STARを用いて、多種多様な計算単位と相互接続パターンを活用し、品質、パラメータサイズ、および自動回帰言語モデリングのための推論キャッシュのフロンティアにおける高度に最適化されたトランスフォーマーとストライプハイブリッドモデルを改善する。
論文 参考訳(メタデータ) (2024-11-26T18:42:42Z) - RoboMorph: Evolving Robot Morphology using Large Language Models [0.5485097145234111]
RoboMorphはモジュラーロボットの設計を自動生成し最適化するためのアプローチである。
我々は,それぞれのロボットデザインを文法として表現し,大規模言語モデル(LLM)の能力を活用して,ロボットデザインの広い範囲をナビゲートする。
実験の結果、RoboMorphは異なる地形に最適化された非自明なロボットをうまく生成できた。
論文 参考訳(メタデータ) (2024-07-11T16:05:56Z) - Task2Morph: Differentiable Task-inspired Framework for Contact-Aware Robot Design [5.4795537587182475]
本稿では,タスク2Morphと呼ばれる接触認識型ロボット設計のための,新しい識別可能なタスクインスパイアされたフレームワークを提案する。
そこでは,マッピング学習と全最適化の両方に勾配情報を活用した,微分可能なロボット設計プロセスにマッピングを組み込む。
実験は3つのシナリオで実施され,Task2MorphがDiffHandより優れていることが確認された。
論文 参考訳(メタデータ) (2024-03-28T02:02:00Z) - CURE: Simulation-Augmented Auto-Tuning in Robotics [15.943773140929856]
本稿では、因果的な設定オプションを識別するCUREを提案する。
CUREは、様々な構成オプションとロボットのパフォーマンス目標との間の因果関係を抽象化する。
物理ロボットとシミュレーションの両方で実験を行うことにより,CUREの有効性と伝達性を示す。
論文 参考訳(メタデータ) (2024-02-08T04:27:14Z) - DiffuseBot: Breeding Soft Robots With Physics-Augmented Generative
Diffusion Models [102.13968267347553]
本稿では,様々なタスクにおいて優れたソフトロボット形態を生成する物理拡張拡散モデルであるDiffuseBotを提案する。
我々は、その能力とともに、シミュレーションされた、そして製造された様々なロボットを紹介します。
論文 参考訳(メタデータ) (2023-11-28T18:58:48Z) - SoftZoo: A Soft Robot Co-design Benchmark For Locomotion In Diverse
Environments [111.91255476270526]
我々は,多様な環境下での移動を支援するソフトロボットの共同設計プラットフォームであるSoftZooを紹介する。
SoftZooは、平らな地面、砂漠、湿地、粘土、氷、雪、浅い水、海などの環境をシミュレートする機能など、自然にヒントを得た幅広い素材セットをサポートしている。
それは、高速な移動、アジャイルな回転、パスフォローなど、ソフトロボティクスに関連するさまざまなタスクを提供し、形態学と制御のための微分可能な設計表現を提供する。
論文 参考訳(メタデータ) (2023-03-16T17:59:50Z) - Universal Morphology Control via Contextual Modulation [52.742056836818136]
異なるロボット形態をまたいだ普遍的なポリシーの学習は、継続的な制御における学習効率と一般化を著しく向上させることができる。
既存の手法では、グラフニューラルネットワークやトランスフォーマーを使用して、異種状態と異なる形態のアクション空間を処理する。
本稿では,この依存関係を文脈変調によりモデル化する階層型アーキテクチャを提案する。
論文 参考訳(メタデータ) (2023-02-22T00:04:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。