論文の概要: FlyMirage: A Fully Automated Generation Pipeline for Diverse and Scalable UAV Flight Data via Generative World Model
- arxiv url: http://arxiv.org/abs/2605.19600v1
- Date: Tue, 19 May 2026 09:41:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-20 15:03:09.25766
- Title: FlyMirage: A Fully Automated Generation Pipeline for Diverse and Scalable UAV Flight Data via Generative World Model
- Title(参考訳): FlyMirage: 生成ワールドモデルによる多変量およびスケーラブルなUAV飛行データのための完全自動生成パイプライン
- Authors: Jinhan Li, Xijie Huang, Zhaoqi Wang, Yijin Wang, Weiqi Ge, Qiyi He, Mo Zhu, Fei Gao, Yuze Wu, Xin Zhou,
- Abstract要約: FlyMirageは、高度にスケーラブルで完全に自動化されたVLN用のデータ生成パイプラインである。
我々は、動的に実現可能な飛行軌跡を持つ大規模で多種多様で光現実的な航空VLNデータセットを生成する。
- 参考スコア(独自算出の注目度): 13.125579202955384
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In the field of Vision-Language Navigation (VLN), aerial datasets remain limited in their ability to combine scale, diversity, and realism, often relying on either costly real-world scenes or visually limited simulations. To address these challenges, we introduce FlyMirage, a highly scalable and fully automated data generation pipeline for aerial VLN. Our approach leverages large language models (LLM) as an environment designer to promote scene diversity, paired with a generative world model that instantiates these designs into high-fidelity 3D Gaussian Splatting (3DGS) scenes. To substantially reduce human labor and ensure the feasibility of flight data, FlyMirage automates scene exploration and semantic information acquisition, and further integrates a dynamically feasible planner for uncrewed aerial vehicle (UAV) trajectory generation. Utilizing this toolchain, we generate a large-scale, diverse, and photorealistic aerial VLN dataset, with dynamically feasible flying trajectories, designed to support the development of next-generation embodied navigation models.
- Abstract(参考訳): VLN(Vision-Language Navigation)の分野では、航空データセットはスケール、多様性、リアリズムを組み合わせられる能力に限られており、しばしばコストがかかる現実世界のシーンや視覚的に制限されたシミュレーションに頼っている。
これらの課題に対処するために、高度にスケーラブルで完全に自動化されたVLNのためのデータ生成パイプラインであるFlyMirageを紹介します。
提案手法は,大規模言語モデル(LLM)を環境デザイナとして活用し,これらのデザインを高忠実度な3Dガウススプラッティング(3DGS)シーンにインスタンス化する生成世界モデルと組み合わせて,シーンの多様性を促進する。
人的労力を大幅に削減し、飛行データの実現性を確保するために、FlyMirageはシーン探索とセマンティック情報取得を自動化し、さらに無人航空機(UAV)軌道生成のための動的実行可能なプランナーを統合する。
このツールチェーンを利用することで、我々は、次世代のエンボディナビゲーションモデルの開発を支援するために、動的に実現可能な飛行軌跡を持つ大規模で多種多様で光現実的な航空VLNデータセットを生成する。
関連論文リスト
- MotionScape: A Large-Scale Real-World Highly Dynamic UAV Video Dataset for World Models [6.680381992984212]
我々は,世界モデリングのための高ダイナミックな動きを持つ大規模実世界のUAVviewビデオデータセットであるMotionScapeを紹介する。
MotionScapeには4K UAVビュービデオが30時間以上含まれており、合計4.5Mのフレームがある。
このデータセットはセマンティックで幾何学的に整合したトレーニングサンプルを備えており、様々な現実世界のUAVビデオが正確な6-DoFカメラ軌道ときめ細かい自然言語記述と密結合されている。
論文 参考訳(メタデータ) (2026-04-09T08:59:40Z) - AirNav: A Large-Scale Real-World UAV Vision-and-Language Navigation Dataset with Natural and Diverse Instructions [6.369522034276603]
本研究では,実際の都市大気データから構築した大規模UAV VLNベンチマークであるAirNavを提案する。
また, スーパービジョンファインチューニングと強化ファインチューニングを組み合わせたAirVLN-R1を導入し, 性能向上と一般化を行った。
論文 参考訳(メタデータ) (2026-01-07T08:46:09Z) - Aerial World Model for Long-horizon Visual Generation and Navigation in 3D Space [48.19308247102762]
本稿では,過去のフレームや行動に照らされた将来の視覚的観察を予測する航空ナビゲーションワールドモデルANWMを提案する。
ANWMは4-DoF UAV軌道で訓練され、物理学にインスパイアされたモジュールであるFuture Frame Projectionを導入した。
実験により、ANWMは長距離視覚予測において既存の世界を著しく上回り、大規模環境でのUAV航法成功率を向上させることが示された。
論文 参考訳(メタデータ) (2025-12-26T06:22:39Z) - OpenFly: A Comprehensive Platform for Aerial Vision-Language Navigation [49.697035403548966]
Vision-Language Navigation (VLN)は、言語命令と視覚的手がかりを活用してエージェントを誘導することを目的としており、AIの具体化において重要な役割を果たす。
各種レンダリングエンジン,多用途ツールチェーン,航空VLNの大規模ベンチマークからなるプラットフォームであるOpenFlyを提案する。
我々は、100kの軌跡を持つ大規模な航空VLNデータセットを構築し、18のシーンにまたがる様々な高さと長さをカバーした。
論文 参考訳(メタデータ) (2025-02-25T09:57:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。