論文の概要: Precise Aggressive Aerial Maneuvers with Sensorimotor Policies
- arxiv url: http://arxiv.org/abs/2604.05828v2
- Date: Wed, 08 Apr 2026 01:53:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 14:06:05.165452
- Title: Precise Aggressive Aerial Maneuvers with Sensorimotor Policies
- Title(参考訳): センサモレータを応用した高精度空気圧マニピュレータ
- Authors: Tianyue Wu, Guangtong Xu, Zihan Wang, Junxiao Lin, Tianyang Chen, Yuze Wu, Zhichao Han, Zhiyang Liu, Fei Gao,
- Abstract要約: 本稿では,車載視覚とプロプレセプションを直接低レベル制御コマンドにマッピングする。
提案手法は, 四角形を5cmのクリアランスで移動し, 最大90度傾いた場合, ギャップの位置や方向を知ることなく, 四角形を移動させることができる。
- 参考スコア(独自算出の注目度): 14.348190270475214
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Precise aggressive maneuvers with lightweight onboard sensors remains a key bottleneck in fully exploiting the maneuverability of drones. Such maneuvers are critical for expanding the systems' accessible area by navigating through narrow openings in the environment. Among the most relevant problems, a representative one is aggressive traversal through narrow gaps with quadrotors under SE(3) constraints, which require the quadrotors to leverage a momentary tilted attitude and the asymmetry of the airframe to navigate through gaps. In this paper, we achieve such maneuvers by developing sensorimotor policies directly mapping onboard vision and proprioception into low-level control commands. The policies are trained using reinforcement learning (RL) with end-to-end policy distillation in simulation. We mitigate the fundamental hardness of model-free RL's exploration on the restricted solution space with an initialization strategy leveraging trajectories generated by a model-based planner. Careful sim-to-real design allows the policy to control a quadrotor through narrow gaps with low clearances and high repeatability. For instance, the proposed method enables a quadrotor to navigate a rectangular gap at a 5 cm clearance, tilted at up to 90-degree orientation, without knowledge of the gap's position or orientation. Without training on dynamic gaps, the policy can reactively servo the quadrotor to traverse through a moving gap. The proposed method is also validated by training and deploying policies on challenging tracks of narrow gaps placed closely. The flexibility of the policy learning method is demonstrated by developing policies for geometrically diverse gaps, without relying on manually defined traversal poses and visual features.
- Abstract(参考訳): 軽量搭載センサーによる精密な攻撃的な操縦は、ドローンの操縦性を完全に活用する上で、依然として重要なボトルネックとなっている。
このような操作は、環境の狭い開口部をナビゲートすることで、システムのアクセス範囲を拡大するために重要である。
最も関連する問題の1つは、SE(3)制約の下での四辺子との狭い隙間を通るアグレッシブ・トラバーサルであり、この場合、四辺子には瞬間的な傾いた姿勢と空域の非対称性を利用せざるを得ない。
本稿では,車載視覚とプロプレセプションを直接低レベル制御コマンドにマッピングすることで,このような操作を実現する。
これらの政策は、シミュレーションにおけるエンドツーエンドの政策蒸留による強化学習(RL)を用いて訓練される。
我々は,モデルベースプランナが生成する軌道を利用した初期化戦略により,制限された解空間におけるモデルフリーRLの探索の基本的な困難さを軽減する。
注意深いシム・トゥ・リアルな設計により、ポリシーは低クリアランスと高い再現性で狭い隙間を通してクアロータを制御することができる。
例えば、提案手法では、四角形の隙間を5cmのクリアランスで移動させ、その隙間の位置や向きを知ることなく90度まで傾けることができる。
ダイナミックギャップのトレーニングがなければ、このポリシーは四角子を反応的にサーボして移動ギャップを横切ることができる。
提案手法は,狭間を密に配置した難解な軌道上での政策の訓練と展開によっても検証される。
政策学習手法の柔軟性は、手動で定義された横断的なポーズや視覚的特徴に頼ることなく、幾何学的に多様なギャップに対するポリシーを開発することで実証される。
関連論文リスト
- Flow Policy Gradients for Robot Control [67.61978635211048]
フローマッチングポリシ勾配は、より表現力のあるポリシのトレーニングと微調整に有効である。
我々は、スクラッチからトレーニングを行う際に、フロー表現をどのように活用するかを示し、ベースラインよりもきめ細やかな堅牢性を改善する。
論文 参考訳(メタデータ) (2026-02-02T18:56:49Z) - Discrete Diffusion for Reflective Vision-Language-Action Models in Autonomous Driving [55.13109926181247]
離散拡散による安全な軌道生成のためのリフレクション機構を統合した学習ベースのフレームワークであるReflectDriveを紹介する。
我々のアプローチの中心は、勾配のない反復的な自己補正を行う、安全を意識した反射機構である。
本手法は目標条件付き軌道生成から始まり,マルチモーダル運転動作をモデル化する。
論文 参考訳(メタデータ) (2025-09-24T13:35:15Z) - Reinforcement Learning for Decision-Level Interception Prioritization in Drone Swarm Defense [51.736723807086385]
本稿では,この課題に対処する上で,強化学習の実践的メリットを示すケーススタディを提案する。
本研究では,現実的な運用制約を捉えた高忠実度シミュレーション環境を提案する。
エージェントは最適なインターセプション優先順位付けのために複数のエフェクターを調整することを学ぶ。
我々は、何百ものシミュレートされた攻撃シナリオにおいて、手作りルールベースのベースラインに対する学習ポリシーを評価する。
論文 参考訳(メタデータ) (2025-08-01T13:55:39Z) - Navigating Motion Agents in Dynamic and Cluttered Environments through LLM Reasoning [69.5875073447454]
本稿では,大規模言語モデル(LLM)によって強化された動作エージェントを,動的・乱雑な環境における自律的なナビゲーションに向けて前進させる。
トレーニング不要なフレームワークは、マルチエージェント調整、クローズドループ計画、動的障害物回避を、リトレーニングや微調整なしでサポートしています。
論文 参考訳(メタデータ) (2025-03-10T13:39:09Z) - What Matters in Learning A Zero-Shot Sim-to-Real RL Policy for Quadrotor Control? A Comprehensive Study [24.239835581921458]
実世界の四角形におけるゼロショット展開が可能なロバストなRL制御ポリシーを学習するための重要な要因について検討する。
これら5つのテクニックを統合した,PPOベースのトレーニングフレームワークSimpleFlightを開発した。
クレージーフリー四重極に対するSimpleFlightの有効性を検証し,軌道追従誤差を50%以上低減できることを実証した。
論文 参考訳(メタデータ) (2024-12-16T13:31:26Z) - In-Distribution Barrier Functions: Self-Supervised Policy Filters that
Avoid Out-of-Distribution States [84.24300005271185]
本稿では,任意の参照ポリシーをラップした制御フィルタを提案する。
本手法は、トップダウンとエゴセントリックの両方のビュー設定を含むシミュレーション環境における2つの異なるビズモータ制御タスクに有効である。
論文 参考訳(メタデータ) (2023-01-27T22:28:19Z) - Learning Variable Impedance Control for Aerial Sliding on Uneven
Heterogeneous Surfaces by Proprioceptive and Tactile Sensing [42.27572349747162]
本研究では,空中すべり作業に対する学習に基づく適応制御手法を提案する。
提案するコントローラ構造は,データ駆動制御とモデルベース制御を組み合わせたものである。
美術品間相互作用制御手法の微調整状態と比較して,追従誤差の低減と外乱拒否の改善を実現した。
論文 参考訳(メタデータ) (2022-06-28T16:28:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。