論文の概要: E2E-Fly: An Integrated Training-to-Deployment System for End-to-End Quadrotor Autonomy
- arxiv url: http://arxiv.org/abs/2604.12916v1
- Date: Tue, 14 Apr 2026 16:00:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-15 19:11:32.550638
- Title: E2E-Fly: An Integrated Training-to-Deployment System for End-to-End Quadrotor Autonomy
- Title(参考訳): E2E-Fly:エンド・ツー・エンドのクアドロター・オートノミーのための総合的なトレーニング・ツー・デプロイシステム
- Authors: Fangyu Sun, Fanxing Li, Linzuo Zhang, Yu Hu, Renbiao Jin, Shuyu Wu, Wenxian Yu, Danping Zou,
- Abstract要約: E2E-Flyは、アジャイルの4倍体プラットフォームとフルスタックのトレーニング、バリデーション、デプロイメントワークフローを備えた統合フレームワークである。
SIM-to-sim転送とハードウェア・イン・ザ・ループテストを用いた2段階の検証戦略を導入し,2つの物理クオータプラットフォームにポリシをデプロイする。
6つのエンドツーエンド制御タスクをトレーニングし、それらを現実世界に展開するためのフレームワークの有効性を実証する。
- 参考スコア(独自算出の注目度): 12.44680847653453
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Training and transferring learning-based policies for quadrotors from simulation to reality remains challenging due to inefficient visual rendering, physical modeling inaccuracies, unmodeled sensor discrepancies, and the absence of a unified platform integrating differentiable physics learning into end-to-end training. While recent work has demonstrated various end-to-end quadrotor control tasks, few systems provide a systematic, zero-shot transfer pipeline, hindering reproducibility and real-world deployment. To bridge this gap, we introduce E2E-Fly, an integrated framework featuring an agile quadrotor platform coupled with a full-stack training, validation, and deployment workflow. The training framework incorporates a high-performance simulator with support for differentiable physics learning and reinforcement learning, alongside structured reward design tailored to common quadrotor tasks. We further introduce a two-stage validation strategy using sim-to-sim transfer and hardware-in-the-loop testing, and deploy policies onto two physical quadrotor platforms via a dedicated low-level control interface and a comprehensive sim-to-real alignment methodology, encompassing system identification, domain randomization, latency compensation, and noise modeling. To the best of our knowledge, this is the first work to systematically unify differentiable physical learning with training, validation, and real-world deployment for quadrotors. Finally, we demonstrate the effectiveness of our framework for training six end-to-end control tasks and deploy them in the real world.
- Abstract(参考訳): シミュレーションから現実への学習ベースのポリシーのトレーニングと伝達は、非効率な視覚的レンダリング、物理モデリングの不正確さ、非モデル化されたセンサーの不一致、および微分可能な物理学習をエンドツーエンドのトレーニングに統合する統一されたプラットフォームが存在しないために、依然として困難である。
最近の研究は、様々なエンドツーエンドのクオータ制御タスクを実証しているが、体系的なゼロショット転送パイプラインを提供し、再現性や実世界の展開を妨げるシステムはほとんどない。
このギャップを埋めるために、私たちは、フルスタックのトレーニング、バリデーション、デプロイメントワークフローと合わせて、アジャイルの4倍体プラットフォームを備えた統合フレームワークであるE2E-Flyを紹介します。
トレーニングフレームワークには、微分可能な物理学習と強化学習をサポートする高性能シミュレータと、一般的な四重項タスクに合わせた構造化された報酬設計が組み込まれている。
さらに、SIM-to-sim転送とハードウェア・イン・ザ・ループテストを用いた2段階の検証戦略を導入し、システム識別、ドメインのランダム化、遅延補償、ノイズモデリングを含む、専用の低レベル制御インタフェースと総合的なSIM-to-realアライメント手法を介して、2つの物理四重項プラットフォームにポリシーをデプロイする。
私たちの知る限りでは、四元数に対するトレーニング、検証、実世界のデプロイによって、分類可能な物理学習を体系的に統一する最初の試みです。
最後に、6つのエンドツーエンド制御タスクをトレーニングし、それらを現実世界に展開するためのフレームワークの有効性を実証する。
関連論文リスト
- Telecom World Models: Unifying Digital Twins, Foundation Models, and Predictive Planning for 6G [60.29349053952935]
本稿では,テレコムシステムダイナミクスの学習,行動条件,不確実性を考慮したモデリングのためのアーキテクチャであるTWM(Telecom World Model)の概念を紹介する。
本研究では,空間環境予測のためのフィールドワールドモデル,動作条件付きキーパフォーマンス指標(KPI)軌道予測のための制御/力学ワールドモデル,意図翻訳とオーケストレーションのための通信基盤モデルレイヤからなる3層アーキテクチャを提案する。
論文 参考訳(メタデータ) (2026-04-08T09:41:58Z) - VisFly-Lab: Unified Differentiable Framework for First-Order Reinforcement Learning of Quadrotor Control [11.762246555812554]
微分可能なシミュレーションによる一階強化学習は、二次制御に有望である。
しかし、実際の進歩はタスク固有の設定で断片化されている。
マルチタスク四元数制御のための統合微分可能なフレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-22T08:42:26Z) - From Seeing to Experiencing: Scaling Navigation Foundation Models with Reinforcement Learning [59.88543114325153]
本稿では,航法基礎モデルの強化学習能力を高めるためのSeeing-to-Experiencingフレームワークを提案する。
S2Eは、ビデオの事前トレーニングとRLによるポストトレーニングの長所を組み合わせたものだ。
実世界のシーンを3DGSで再現した3D画像に基づく総合的なエンドツーエンド評価ベンチマークであるNavBench-GSを構築した。
論文 参考訳(メタデータ) (2025-07-29T17:26:10Z) - A General Infrastructure and Workflow for Quadrotor Deep Reinforcement Learning and Reality Deployment [48.90852123901697]
本稿では, エンドツーエンドの深層強化学習(DRL)ポリシーを四元数へシームレスに移行できるプラットフォームを提案する。
本プラットフォームは, ホバリング, 動的障害物回避, 軌道追尾, 気球打上げ, 未知環境における計画など, 多様な環境を提供する。
論文 参考訳(メタデータ) (2025-04-21T14:25:23Z) - Digital Twin Synchronization: Bridging the Sim-RL Agent to a Real-Time Robotic Additive Manufacturing Control [2.5709786140685633]
この研究は、産業ロボット工学応用のためのソフトアクター・クライトとデジタルツインの統合を推進している。
システムアーキテクチャはUnityのシミュレーション環境とROS2を組み合わせて、シームレスなデジタル双対同期を実現する。
その結果、シミュレートされた環境と物理的環境の両方において、迅速な政策収束と堅牢なタスク実行が示された。
論文 参考訳(メタデータ) (2025-01-29T22:06:53Z) - Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly lexically) で合成され, 凍結パッチワイド特徴抽出器として, 事前学習された視覚言語モデル (VLM) を用いたフレームワークである。
本研究では,本手法の有効性を,行動クローンによる訓練を実世界のシーンに応用した,四重項フライ・トゥ・ターゲットタスクに適用した。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Mixed-Reality Digital Twins: Leveraging the Physical and Virtual Worlds for Hybrid Sim2Real Transition of Multi-Agent Reinforcement Learning Policies [0.0]
本研究は、並列化シミュレーションワークロードをオンデマンドで選択的にスケーリングすることで、トレーニング速度を向上できる混合現実(MR)デジタルツイン(DT)フレームワークを提案する。
i) エージェントと環境並列化が訓練時間に及ぼす影響, (ii) ドメインランダム化がゼロショットsim2real転送に与える影響について検討した。
その結果、提案した並列化スキームとsim2realのギャップを2.9%に抑えることで、最大76.3%のトレーニング時間を短縮できることがわかった。
論文 参考訳(メタデータ) (2024-03-16T18:47:04Z) - Modular Neural Network Policies for Learning In-Flight Object Catching
with a Robot Hand-Arm System [55.94648383147838]
本稿では,ロボットハンドアームシステムによる飛行物体の捕獲方法の学習を可能にするモジュラーフレームワークを提案する。
本フレームワークは,物体の軌跡予測を学習するオブジェクト状態推定器,(ii)捕捉対象のポーズのスコアとランク付けを学ぶキャッチポーズ品質ネットワーク,(iii)ロボットハンドをキャッチ前ポーズに移動させるように訓練されたリーチ制御ポリシ,(iv)ソフトキャッチ動作を行うように訓練された把握制御ポリシの5つのコアモジュールから構成される。
各モジュールと統合システムのシミュレーションにおいて、我々のフレームワークを広範囲に評価し、飛行における高い成功率を示す。
論文 参考訳(メタデータ) (2023-12-21T16:20:12Z) - A Multifidelity Sim-to-Real Pipeline for Verifiable and Compositional
Reinforcement Learning [18.42455580047624]
本稿では,強化学習システムの訓練と検証のための構成的枠組みを提案し,実証する。
複雑なロボットタスクをコンポーネントサブタスクに分解することで、フレームワークは対応するサブタスクポリシーの独立したトレーニングとテストを可能にする。
実験ケーススタディでは、Warthog無人地上ロボットの操縦を成功させる構成的RLシステムの訓練と展開に、このフレームワークを適用した。
論文 参考訳(メタデータ) (2023-12-02T23:46:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。