論文の概要: ASTER: Attitude-aware Suspended-payload Quadrotor Traversal via Efficient Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2603.10715v1
- Date: Wed, 11 Mar 2026 12:40:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-21 18:33:56.685793
- Title: ASTER: Attitude-aware Suspended-payload Quadrotor Traversal via Efficient Reinforcement Learning
- Title(参考訳): ASTER: 効率的な強化学習による姿勢認識型サスペンド・ペイロード・クアドロター・トラバーサル
- Authors: Dongcheng Cao, Jin Zhou, Shuo Li,
- Abstract要約: 本稿では,ケーブルサスペンションシステムの自律逆飛行を初めて成功させた,ロバストなRLフレームワークであるASTERについて述べる。
我々は、複雑な軌道を横断する顕著な俊敏性、正確な姿勢アライメント、ロバストなゼロショット・シム・トゥ・リアルトランスファーを示す。
- 参考スコア(独自算出の注目度): 6.13534373131836
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Agile maneuvering of the quadrotor cable-suspended system is significantly hindered by its non-smooth hybrid dynamics. While model-free Reinforcement Learning (RL) circumvents explicit differentiation of complex models, achieving attitude-constrained or inverted flight remains an open challenge due to the extreme reward sparsity under strict orientation requirements. This paper presents ASTER, a robust RL framework that achieves, to our knowledge, the first successful autonomous inverted flight for the cable-suspended system. We propose hybrid-dynamics-informed state seeding (HDSS), an initialization strategy that back-propagates target configurations through physics-consistent kinematic inversions across both taut and slack cable phases. HDSS enables the policy to discover aggressive maneuvers that are unreachable via standard exploration. Extensive simulations and real-world experiments demonstrate remarkable agility, precise attitude alignment, and robust zero-shot sim-to-real transfer across complex trajectories.
- Abstract(参考訳): 4軸ケーブル懸架システムのアジャイル操作は、非滑らかなハイブリッド力学によって著しく妨げられている。
モデルレス強化学習(RL)は複雑なモデルの明示的な分化を回避しているが、厳格な配向条件下での極端な報酬空間のため、姿勢制約や逆転飛行を達成することは未解決の課題である。
本稿では,ケーブルサスペンションシステムの自律逆飛行を初めて成功させた,ロバストなRLフレームワークであるASTERについて述べる。
本研究は,高密度・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力・高出力
HDSSは、標準探査によって到達不可能な攻撃的な操作を発見することができる。
大規模なシミュレーションと実世界の実験は、複雑な軌道を横断する顕著な俊敏性、正確な姿勢アライメント、ロバストなゼロショット・シム・トゥ・リアル移動を示す。
関連論文リスト
- Onboard MuJoCo-based Model Predictive Control for Shipboard Crane with Double-Pendulum Sway Suppression [7.645323708488569]
海上での重荷の移動は、危険なペイロードのスウェイによって制限された効率的なクレーンの運用に依存している。
既存の制御方法はそのような設定で苦労し、しばしば単純化された分析モデルに依存している。
MuJoCo MPCフレームワークを中心とした,完全なリアルタイム制御パイプラインを示す。
論文 参考訳(メタデータ) (2026-03-17T11:43:52Z) - RobotDancing: Residual-Action Reinforcement Learning Enables Robust Long-Horizon Humanoid Motion Tracking [50.200035833530876]
RobotDancingはシンプルでスケーラブルなフレームワークで、残留する関節の目標を予測して、ダイナミックスの不一致を明示的に修正する。
複数分間の高エネルギー動作(ジャンプ、スピン、カートホイール)をトラッキングし、高いモーショントラッキング品質のハードウェアにゼロショットをデプロイする。
論文 参考訳(メタデータ) (2025-09-25T03:30:34Z) - Sycophancy Mitigation Through Reinforcement Learning with Uncertainty-Aware Adaptive Reasoning Trajectories [58.988535279557546]
適応推論トラジェクトリを用いたtextbf sycophancy Mitigation を提案する。
SMARTは,分布外の入力に対して強い性能を維持しながら,サイコファンティクスの挙動を著しく低下させることを示した。
論文 参考訳(メタデータ) (2025-09-20T17:09:14Z) - RIFT: Group-Relative RL Fine-Tuning for Realistic and Controllable Traffic Simulation [13.319344167881383]
データ駆動シミュレーターにおいて、模擬学習事前学習を行う2段階のAV中心シミュレーションフレームワークを導入する。
次に、物理に基づくシミュレータで微調整を学習し、スタイルレベルの制御性を向上する。
微調整段階において,新しいグループ関連RL微調整戦略であるRIFTを提案する。
論文 参考訳(メタデータ) (2025-05-06T09:12:37Z) - Model-Based Reinforcement Learning for Control of Strongly-Disturbed Unsteady Aerodynamic Flows [0.0]
本稿では,モデルに基づく強化学習(MBRL)手法を提案する。
このモデルの精度とロバスト性は、非常に乱れた環境下での投球翼のシナリオで実証される。
乱れのない環境における垂直軸風力タービンへの適用をAppendixで論じる。
論文 参考訳(メタデータ) (2024-08-26T23:21:44Z) - DATT: Deep Adaptive Trajectory Tracking for Quadrotor Control [62.24301794794304]
Deep Adaptive Trajectory Tracking (DATT)は、学習に基づくアプローチであり、現実世界の大きな乱れの存在下で、任意の、潜在的に実現不可能な軌跡を正確に追跡することができる。
DATTは、非定常風場における可溶性および非実用性の両方の軌道に対して、競争適応性非線形およびモデル予測コントローラを著しく上回っている。
適応非線形モデル予測制御ベースラインの1/4未満である3.2ms未満の推論時間で、効率的にオンラインで実行することができる。
論文 参考訳(メタデータ) (2023-10-13T12:22:31Z) - Physics-Inspired Temporal Learning of Quadrotor Dynamics for Accurate
Model Predictive Trajectory Tracking [76.27433308688592]
クオーロタのシステムダイナミクスを正確にモデル化することは、アジャイル、安全、安定したナビゲーションを保証する上で非常に重要です。
本稿では,ロボットの経験から,四重項系の力学を純粋に学習するための新しい物理インスパイアされた時間畳み込みネットワーク(PI-TCN)を提案する。
提案手法は,スパース時間的畳み込みと高密度フィードフォワード接続の表現力を組み合わせて,正確なシステム予測を行う。
論文 参考訳(メタデータ) (2022-06-07T13:51:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。