論文の概要: Embodiment-conditioned Generalist Control for Multirotor Aerial Robots
- arxiv url: http://arxiv.org/abs/2606.10857v1
- Date: Tue, 09 Jun 2026 13:36:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-10 15:40:58.522483
- Title: Embodiment-conditioned Generalist Control for Multirotor Aerial Robots
- Title(参考訳): マルチロータ空中ロボットのための身体条件付きジェネリスト制御
- Authors: Orestis Konstantaropoulos, Welf Rehberg, Mihir Kulkarni, Kostas Alexis,
- Abstract要約: 本稿では,一組のネットワーク重みで任意のマルチロータ構成を制御できる汎用的な位置制御ポリシーを提案する。
このポリシーは物理地上のエンボディメント記述子に条件付けされている。
我々は,3つのヘキサロタ系上でのこの一般政策のゼロショット実世界移動を実証する。
- 参考スコア(独自算出の注目度): 11.449763494464053
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present a generalist position control policy capable of controlling arbitrary multirotor configurations of a certain rotor count (e.g., hexarotors or quadrotors) with a single set of network weights. The policy is conditioned on a physics-grounded embodiment descriptor: a mass and inertia-normalized control allocation matrix that captures how mass-normalized motor thrusts generate linear and angular accelerations in the body-frame. To train the policy, we sample from a broad distribution of arbitrary multirotor configurations, including non-planar and asymmetric systems, and optimize a single, compact network using Proximal Policy Optimization. Training requires only five minutes on an RTX 3090 GPU using a custom NVIDIA Warp-based dynamics simulator. Through extensive simulation experiments, we show that embodiment conditioning enables robust generalist control across arbitrary morphologies. We demonstrate zero-shot real-world transfer of this generalist policy on three diverse hexarotor systems, including a planar robot, a partially symmetric non-planar system, and a random asymmetric, non-planar configuration.
- Abstract(参考訳): 本稿では, あるロータ数(例えば, ヘキサロタ, クアロタ)の任意のマルチロータ構成を, 1組のネットワーク重みで制御できる汎用的位置制御ポリシーを提案する。
質量および慣性正規化制御割り当て行列は、質量正規化モーター推力がどのように体枠内で線形および角加速度を発生させるかをキャプチャする。
ポリシをトレーニングするために、非平面系や非対称系を含む任意のマルチロータ構成の広い分布からサンプルし、プロキシポリシー最適化を用いて単一のコンパクトネットワークを最適化する。
トレーニングは、カスタムNVIDIA Warpベースのダイナミックスシミュレータを使用して、RTX 3090 GPU上で5分しか必要としない。
広範囲なシミュレーション実験を通して, 実施条件が任意の形態をまたいだ堅牢な一般制御を可能にすることを示す。
我々は、平面ロボット、部分的に対称な非平面システム、ランダムな非対称な非平面構成を含む3つの多様なヘキサロータシステムに対して、このジェネラリストポリシーのゼロショット実世界移動を実証する。
関連論文リスト
- Reinforcement learning in linear embedding space unlocks generalizable control across soft robot configurations [60.42735420750131]
タコや象のトランクのような軟体生物は、顕著な形態的適応性を示す。
近年、様々なソフトロボットが登場し、様々な素材、硬さ、特定のタスクに合わせた形態を特徴としている。
本稿では,多様なソフトロボット構成にまたがる迅速な適応を可能にする汎用制御システムを提案する。
論文 参考訳(メタデータ) (2026-06-06T11:09:46Z) - MARS-Dragonfly: Agile and Robust Flight Control of Modular Aerial Robot Systems [21.471271822760276]
モジュラー・エアリアル・ロボット・システム(MARS)は、再構成可能な連結構造を持つ複数のドローンユニットから構成される。
MARSは単純な準静的モデルと規則に基づくアロケーションに依存しており、不連続かつ非有界なモーターコマンドを生成する。
我々は、受動ドッキング、検出不要な受動ロック、磁気アシスト分離が可能な小型機械システムを開発した。
論文 参考訳(メタデータ) (2026-04-07T06:43:08Z) - PCHC: Enabling Preference Conditioned Humanoid Control via Multi-Objective Reinforcement Learning [50.63196995993855]
多目的強化学習(MORL)を活用してPCHC(Preference-Conditioned Humanoid Control)を実現する新しいフレームワークを提案する。
当社のフレームワークは、単一の嗜好条件のポリシーを多種多様な行動を示すために有効である。
論文 参考訳(メタデータ) (2026-03-25T07:55:37Z) - Transformers As Generalizable Optimal Controllers [14.889781937667067]
異種多入力多出力(MIMO)線形時間不変(LTI)システムの状態フィードバック法則を1つの学習コントローラで捉えることができるかを検討した。
我々は、標準化、パディング、次元符号化、マスク付き損失の共有表現を用いて、異なる状態と入力次元を持つシステムからLQR生成軌道上の1つのトランスフォーマーポリシーを訓練する。
幅広いシステムの全体にわたって、LQR(Linear Quadratic Regulator)と比較して経験的に小さな準最適性を実現し、中程度のパラメータ摂動の下で安定し続け、目に見えないシステムの軽量な微調整の恩恵を受ける。
論文 参考訳(メタデータ) (2026-03-16T07:09:21Z) - Morphogenetic Assembly and Adaptive Control for Heterogeneous Modular Robots [9.732115880925306]
異種モジュールロボットのためのクローズドループ自動化フレームワークを提案する。
移動マニピュレータは異種機能モジュールを処理し、多様なロボット構成を動的に組み立てる。
このフレームワークは、モジュールアセンブリ、ロボットのマージと分割、動的モーション生成を含む全サイクルプロセスを検証する。
論文 参考訳(メタデータ) (2026-02-11T06:18:04Z) - UNO: Unified Self-Supervised Monocular Odometry for Platform-Agnostic Deployment [22.92093036869778]
多様な環境にまたがるロバストかつ姿勢推定を可能にする統合ビジュアル・オドメトリー・フレームワークであるUNOを提案する。
われわれのアプローチは、自動運転車、ドローン、移動ロボット、ハンドヘルドデバイスなど、さまざまな現実のシナリオを効果的に一般化する。
提案手法を3つの主要なベンチマークデータセット上で広範囲に評価する。
論文 参考訳(メタデータ) (2025-06-08T06:30:37Z) - Dimensionless Policies based on the Buckingham $\pi$ Theorem: Is This a
Good Way to Generalize Numerical Results? [66.52698983694613]
本稿では,バッキンガムの$pi$定理を,物理系の制御ポリシを汎用的な知識形式にエンコードするツールとして活用する。
本研究では,(1) パラメータの削減,(2) 特定のシステムに対して数値的に生成された制御ポリシを,入力変数と出力変数を適切にスケーリングすることにより,次元的に類似したシステムのサブセットに正確に転送可能であることを示す。
より複雑な高次元問題に対するポリシーを一般化するために、このアプローチがいかに実用的であるかは、まだわからないが、初期の結果は、それがaであることを示している。
論文 参考訳(メタデータ) (2023-07-29T00:51:26Z) - Learning a Single Near-hover Position Controller for Vastly Different
Quadcopters [56.37274861303324]
本稿では,クワッドコプターのための適応型ニアホバー位置制御器を提案する。
これは、非常に異なる質量、大きさ、運動定数を持つクワッドコプターに展開することができる。
また、実行中に未知の障害に迅速に適応する。
論文 参考訳(メタデータ) (2022-09-19T17:55:05Z) - Policy Search for Model Predictive Control with Application to Agile
Drone Flight [56.24908013905407]
MPCのためのポリシ・フォー・モデル・予測制御フレームワークを提案する。
具体的には、パラメータ化コントローラとしてMPCを定式化し、パラメータ化の難しい決定変数を高レベルポリシーとして表現する。
シミュレーションと実環境の両方において,我々の制御器が堅牢かつリアルタイムに制御性能を発揮することを示す実験を行った。
論文 参考訳(メタデータ) (2021-12-07T17:39:24Z) - Learning Constrained Distributions of Robot Configurations with
Generative Adversarial Network [15.962033896896385]
高次元ロボットシステムでは、有効な構成空間の多様体はしばしば複素形状を持つ。
このような制約下で有効なロボット構成の分布を学習するための生成的敵ネットワークアプローチを提案する。
論文 参考訳(メタデータ) (2020-11-11T11:43:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。