論文の概要: Scalable Modular Synthetic Data Generation for Advancing Aerial Autonomy
- arxiv url: http://arxiv.org/abs/2211.05335v1
- Date: Thu, 10 Nov 2022 04:37:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-11 14:21:32.631765
- Title: Scalable Modular Synthetic Data Generation for Advancing Aerial Autonomy
- Title(参考訳): 航空自律性向上のためのスケーラブルなモジュール合成データ生成
- Authors: Mehrnaz Sabet, Praveen Palanisamy, Sakshi Mishra
- Abstract要約: 航空自律化を進める上での大きな障壁は、機械学習モデルをトレーニングするための大規模な航空データセット収集である。
本研究では,環境の基底マップ上の資産のタイプ非依存分布空間を生成する適応層状領域ランダム化手法を提案する。
我々の研究は、現実の状況に適応できるトレーニングモデルのための強化されたベンチマークデータセットの生成に寄与します。
- 参考スコア(独自算出の注目度): 2.9005223064604078
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Harnessing the benefits of drones for urban innovation at scale requires
reliable aerial autonomy. One major barrier to advancing aerial autonomy has
been collecting large-scale aerial datasets for training machine learning
models. Due to costly and time-consuming real-world data collection through
deploying drones, there has been an increasing shift towards using synthetic
data for training models in drone applications. However, to increase
generalizability of trained policies on synthetic data, incorporating domain
randomization into the data generation workflow for addressing the sim-to-real
problem becomes crucial. Current synthetic data generation tools either lack
domain randomization or rely heavily on manual workload or real samples for
configuring and generating diverse realistic simulation scenes. These
dependencies limit scalability of the data generation workflow. Accordingly,
there is a major challenge in balancing generalizability and scalability in
synthetic data generation. To address these gaps, we introduce a modular
scalable data generation workflow tailored to aerial autonomy applications. To
generate realistic configurations of simulation scenes while increasing
diversity, we present an adaptive layered domain randomization approach that
creates a type-agnostic distribution space for assets over the base map of the
environments before pose generation for drone trajectory. We leverage
high-level scene structures to automatically place assets in valid
configurations and then extend the diversity through obstacle generation and
global parameter randomization. We demonstrate the effectiveness of our method
in automatically generating diverse configurations and datasets and show its
potential for downstream performance optimization. Our work contributes to
generating enhanced benchmark datasets for training models that can generalize
better to real-world situations.
- Abstract(参考訳): 大規模な都市イノベーションにドローンの利点を活用するには、信頼できる航空自律性が必要である。
自律性向上の大きな障壁のひとつは、機械学習モデルをトレーニングするための大規模な空中データセット収集だ。
ドローンの展開によるコストと時間を要する実世界のデータ収集により、ドローンアプリケーションのトレーニングモデルに合成データを使用することへのシフトが増えている。
しかし、合成データに対する訓練されたポリシーの一般化性を高めるために、Ssim-to-real問題に対処するデータ生成ワークフローにドメインランダム化を組み込むことが重要である。
現在の合成データ生成ツールはドメインのランダム化を欠いているか、手動のワークロードや実際のサンプルに依存しており、様々なリアルなシミュレーションシーンの設定と生成を行っている。
これらの依存関係はデータ生成ワークフローのスケーラビリティを制限する。
したがって、合成データ生成の汎用性とスケーラビリティのバランスには大きな課題がある。
これらのギャップに対処するために、空の自律アプリケーションに適したスケーラブルなデータ生成ワークフローを導入します。
シミュレーションシーンのリアルな構成を多様化しながら生成するために,ドローン軌道のポーズ生成に先立って,アセットのタイプに依存しない分布空間を作成する適応型階層化ドメインランダム化手法を提案する。
我々は高レベルなシーン構造を利用して、資産を有効な構成に自動的に配置し、障害物生成とグローバルパラメータのランダム化を通じて多様性を拡大する。
多様な構成やデータセットを自動生成する手法の有効性を実証し、下流の性能最適化の可能性を示す。
我々の研究は、現実の状況に適応できるトレーニングモデルのベンチマークデータセットの強化に寄与します。
関連論文リスト
- Tackling Data Heterogeneity in Federated Time Series Forecasting [61.021413959988216]
時系列予測は、エネルギー消費予測、病気の伝染モニタリング、天気予報など、様々な実世界の応用において重要な役割を果たす。
既存のほとんどのメソッドは、分散デバイスから中央クラウドサーバに大量のデータを収集する、集中的なトレーニングパラダイムに依存しています。
本稿では,情報合成データを補助的知識キャリアとして生成することにより,データの均一性に対処する新しいフレームワークであるFed-TRENDを提案する。
論文 参考訳(メタデータ) (2024-11-24T04:56:45Z) - Generative Expansion of Small Datasets: An Expansive Graph Approach [13.053285552524052]
最小限のサンプルから大規模で情報豊富なデータセットを生成する拡張合成モデルを提案する。
自己アテンション層と最適なトランスポートを持つオートエンコーダは、分散一貫性を洗練させる。
結果は同等のパフォーマンスを示し、モデルがトレーニングデータを効果的に増強する可能性を示している。
論文 参考訳(メタデータ) (2024-06-25T02:59:02Z) - Enhancing Indoor Temperature Forecasting through Synthetic Data in Low-Data Environments [42.8983261737774]
合成データ生成のためのSoTA AI を用いたデータ拡張手法の有効性について検討する。
そこで本研究では,実データと合成データの融合戦略を探求し,予測モデルの改善を図る。
論文 参考訳(メタデータ) (2024-06-07T12:36:31Z) - DiverGen: Improving Instance Segmentation by Learning Wider Data Distribution with More Diverse Generative Data [48.31817189858086]
生成データは、モデルが学習できるデータ分布を拡大し、過剰適合を軽減できると主張している。
DiverGenは強力なX-Pasteよりも優れており、すべてのカテゴリで+1.1ボックスAPと+1.1マスクAPを達成でき、まれなカテゴリでは+1.9ボックスAPと+2.5マスクAPを達成できる。
論文 参考訳(メタデータ) (2024-05-16T15:30:18Z) - SubjectDrive: Scaling Generative Data in Autonomous Driving via Subject Control [59.20038082523832]
我々は、自動走行アプリケーションの改善を継続的に行う方法で、生成データ生産を拡大することが証明された最初のモデルであるSubjectDriveを提案する。
本研究では, 多様なデータを生成するために, 多様な外部データソースを活用可能な, 主観制御機構を備えた新しいモデルを開発する。
論文 参考訳(メタデータ) (2024-03-28T14:07:13Z) - Distribution-Aware Data Expansion with Diffusion Models [55.979857976023695]
本研究では,分散型拡散モデルに基づくトレーニングフリーなデータ拡張フレームワークであるDistDiffを提案する。
DistDiffは、オリジナルデータのみにトレーニングされたモデルと比較して、さまざまなデータセットの精度を一貫して向上させる。
論文 参考訳(メタデータ) (2024-03-11T14:07:53Z) - AgentOhana: Design Unified Data and Training Pipeline for Effective Agent Learning [98.26836657967162]
textbfAgentOhanaは、さまざまなシナリオにまたがって、異なる環境からエージェントのトラジェクトリを集約する。
AIエージェント用に調整された大規模なアクションモデルである textbfxLAM-v0.1 は、さまざまなベンチマークで例外的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-23T18:56:26Z) - Phased Data Augmentation for Training a Likelihood-Based Generative Model with Limited Data [0.0]
生成モデルは現実的なイメージの作成に優れていますが、トレーニングのための広範なデータセットに依存しているため、大きな課題があります。
現在のデータ効率の手法はGANアーキテクチャに重点を置いており、他の生成モデルの訓練にギャップを残している。
位相データ拡張(phased data augmentation)は、このギャップに対処する新しい手法であり、データ分散に固有の変更を加えることなく、限られたデータシナリオでのトレーニングを最適化する。
論文 参考訳(メタデータ) (2023-05-22T03:38:59Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - From Data to Actions in Intelligent Transportation Systems: a
Prescription of Functional Requirements for Model Actionability [10.27718355111707]
この研究は、多種多様なソースから得られたデータが、その資産やシステム、プロセスの効率的な運用のために、データ駆動モデルを学び、適応するためにどのように使用できるかを説明することを目的としている。
ITSのデータモデリングパイプラインでは、データ融合、適応学習、モデル評価という3つの複合ステージに対して、特性、エンジニアリング要件、本質的な課題を定義します。
論文 参考訳(メタデータ) (2020-02-06T12:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。