Fugu-MT 論文翻訳(概要): Rapid co-design of Buoyancy-assisted robots for Challenging Locomotion using Gaussian Evolutionary Specialists

論文の概要: Rapid co-design of Buoyancy-assisted robots for Challenging Locomotion using Gaussian Evolutionary Specialists

arxiv url: http://arxiv.org/abs/2606.07424v1
Date: Fri, 05 Jun 2026 16:18:15 GMT
ステータス: 翻訳完了
システム内更新日: 2026-06-08 14:33:29.844058
Title: Rapid co-design of Buoyancy-assisted robots for Challenging Locomotion using Gaussian Evolutionary Specialists
Title（参考訳）: ガウス進化スペシャリストを用いた歩行支援ロボットの迅速な共同設計
Authors: Ankit Sinha, Nitish Sontakke, Dennis Hong, Yusuke Tanaka, Sehoon Ha,
Abstract要約: 我々はReinforcement Learningを使ってコントローラを訓練し、ロボット形態学最適化のための設計を評価する。 RLはインロコモーションを成功させたが、ポリシートレーニングを繰り返しているため、共同設計のインナーループで使用するのは高価である。本稿では、ポリシー学習から設計空間分割を分離し、多様な振る舞いを明示的に捉えるフレームワークを提案する。
参考スコア（独自算出の注目度）: 7.552166307522374
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Designing high-performance legged robots requires jointly optimizing morphology and control. Model-free Reinforcement Learning (RL) offers an alternative to model-predictive control for developing robust controllers without explicitly specifying robot dynamics. Thus, we have seen theuse of RL to train controllers and evaluate designs for robot morphology optimization. While RL has shown success inlocomotion, using it in the co-design inner loop is expensive due to repeated policy training. Universal policies conditioned on morphology offer a promising alternative, but suffer from behavioral diversity collapse, converging to a single strategy that performs sub-optimally across designs. On the other hand, end-to-end Mixture-of-Experts (MoE) architectures fail due to a collapse in its representation. We propose Gaussian Evolutionary Specialists (GES), a framework that decouples design-space partitioning from policy learning to capture diverse behaviors explicitly. GES assigns specialist policies to evolving Gaussian regions and iteratively refines them via training, probing, and territory expansion. The resulting specialists are integrated into a design sampling loop, replacing costly re-training with direct evaluation. When tested on the Buoyancy-Assisted Light Legged Unit (BALLU), GES discovers designs with 5 - 25% higher performance than naive universal policies. On hardware, a GES optimized design overcomes a 24 cm tall obstacle - 3x improvement over the baseline BALLU design. Moreover, GES curtails design optimization time by 37%.
Abstract（参考訳）: 高性能脚ロボットの設計には、形態と制御を共同で最適化する必要がある。モデルフリー強化学習(RL)は、ロボット力学を明示的に指定することなく、堅牢なコントローラを開発するためのモデル予測制御の代替を提供する。そこで我々は,ロボット形態学最適化のための制御器の訓練や設計評価にRLが用いられていることを見てきた。 RLはインロコモーションを成功させたが、ポリシートレーニングを繰り返しているため、共同設計のインナーループで使用するのは高価である。形態学に規定された普遍的な政策は、有望な代替手段を提供するが、行動の多様性の崩壊に悩まされ、設計全体にわたって準最適に実行する単一の戦略に収束する。一方、エンドツーエンドのMixture-of-Experts (MoE)アーキテクチャは、その表現の崩壊によって失敗する。本稿では,政策学習から設計空間分割を分離し,多様な行動を明確に把握するフレームワークであるガウス進化スペシャリスト(GES)を提案する。 GESはガウス地方の発展に専門的な政策を割り当て、訓練、調査、領土拡大を通じて反復的にそれを洗練させる。結果として得られたスペシャリストは、設計サンプリングループに統合され、コストのかかる再トレーニングを直接的な評価に置き換える。 Buoyancy-Assisted Light Legged Unit (BALLU)でテストすると、GESは単純で普遍的なポリシーよりも5～25%高い性能を持つ設計を発見する。ハードウェア上では、GES最適化設計は、ベースラインのBALLU設計よりも3倍改善された24cmの高さの障害物を克服する。さらに、GESは設計の最適化時間を37%短縮する。

関連論文リスト

HAD: Combining Hierarchical Diffusion with Metric-Decoupled RL for End-to-End Driving [51.268878540511054]
我々は階層的拡散政策を備えたエンドツーエンドの計画フレームワークであるHADを提案する。我々は,NAVSIMとHUGSIMの両方でHADが新たな最先端性能を実現することを示す。
論文参考訳（メタデータ） (2026-04-04T04:12:47Z)
Supervising Ralph Wiggum: Exploring a Metacognitive Co-Regulation Agentic AI Loop for Engineering Design [9.290591938055673]
工学設計プロセスを自動化するためにLarge Language Model (LLM)エージェントを使用するエージェントAIシステムは、人間を悩ませているのと同じ病理のいくつかが原因である。本稿では,デザインエージェントが自己制御を行い,そのメタ認知を明示的に監視する自己制御ループ(SRL)を提案する。また,メタ認知的共規制エージェントがメタ認知においてデザインエージェントを補助する新しい協調制御設計エージェントループ (CRDAL) を提案する。
論文参考訳（メタデータ） (2026-03-25T19:39:42Z)
Nemotron-Cascade: Scaling Cascaded Reinforcement Learning for General-Purpose Reasoning Models [71.9060068259379]
汎用推論モデルを構築するために,ケースド・ドメインワイド強化学習を提案する。私たちの14Bモデルは、RLの後、LiveCodeBench v5/v6 ProでSFTの教師であるDeepSeek-R1-0528を上回り、インフォマティクスにおける2025 International Olympiad in Informatics (IOI)における銀の医療性能を上回りました。
論文参考訳（メタデータ） (2025-12-15T18:02:35Z)
Taming the Long-Tail: Efficient Reasoning RL Training with Adaptive Drafter [52.111923076688505]
強力な推論能力を持つ大規模言語モデル(LLM)のトレーニングは、複雑な問題解決において新たなフロンティアを解放する重要なマイルストーンとなる。本稿では,適応的投機的復号化を組み込むことで,RL学習の無作為に推論を高速化するシステムであるTLTを提案する。
論文参考訳（メタデータ） (2025-11-20T18:59:25Z)
From Supervision to Exploration: What Does Protein Language Model Learn During Reinforcement Learning? [76.288870982181]
タンパク質言語モデル(PLM)は、大規模事前学習と拡張性のあるアーキテクチャを通じて高度な計算タンパク質科学を持つ。強化学習(RL)は探索を拡大し、タンパク質設計における正確な多目的最適化を可能にした。 RLはサンプリング効率を向上し,さらに重要な点として,教師あり学習で捉えない能力を明らかにするかどうかを問う。
論文参考訳（メタデータ） (2025-10-02T01:31:10Z)
Reinforcement Learning for AMR Charging Decisions: The Impact of Reward and Action Space Design [44.99833362998488]
大規模ブロック積み重ね倉庫における自律移動ロボットの充電戦略を最適化するための新しい強化学習(RL)設計を提案する。本研究は、フレキシブルな設定から、よりガイド付きでドメインインフォームドな設計構成まで、さまざまな報酬とアクション空間の構成がエージェントのパフォーマンスにどのように影響するかに焦点を当てる。
論文参考訳（メタデータ） (2025-05-16T11:33:29Z)
Structural Design Through Reinforcement Learning [0.7874708385247352]
Sogymは、トポロジ最適化(TO)における機械学習を促進するために設計された、オープンソースの強化学習環境である。これは、TOの物理学を報酬関数に統合することで、物理的に実現可能で構造的に堅牢な設計を生成する。
論文参考訳（メタデータ） (2024-07-10T00:38:08Z)
Compositional Generative Inverse Design [69.22782875567547]
入力変数を設計して目的関数を最適化する逆設計は重要な問題である。拡散モデルにより得られた学習エネルギー関数を最適化することにより、そのような逆例を避けることができることを示す。 N-body 相互作用タスクと2次元多面体設計タスクにおいて,実験時に学習した拡散モデルを構成することにより,初期状態と境界形状を設計できることを示す。
論文参考訳（メタデータ） (2024-01-24T01:33:39Z)
ECoDe: A Sample-Efficient Method for Co-Design of Robotic Agents [11.449817465618658]
自律ロボットエージェントを共同設計するには、エージェントのコントローラと物理的設計を同時に最適化する必要がある。デザインスペースが大きくなると、これは難しくなります。共設計のサンプル効率を向上させるための多要素探索手法を提案する。
論文参考訳（メタデータ） (2023-09-08T02:54:31Z)
Multi-Agent Reinforcement Learning for Microprocessor Design Space Exploration [71.95914457415624]
マイクロプロセッサアーキテクトは、高性能でエネルギー効率の追求において、ドメイン固有のカスタマイズにますます頼っている。この問題に対処するために,Multi-Agent RL (MARL) を利用した別の定式化を提案する。評価の結果,MARLの定式化は単エージェントRLのベースラインよりも一貫して優れていた。
論文参考訳（メタデータ） (2022-11-29T17:10:24Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。