論文の概要: Scalable Modular Synthetic Data Generation for Advancing Aerial Autonomy
- arxiv url: http://arxiv.org/abs/2211.05335v2
- Date: Fri, 26 May 2023 00:30:58 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-29 23:28:30.401604
- Title: Scalable Modular Synthetic Data Generation for Advancing Aerial Autonomy
- Title(参考訳): 航空自律性向上のためのスケーラブルなモジュール合成データ生成
- Authors: Mehrnaz Sabet, Praveen Palanisamy, Sakshi Mishra
- Abstract要約: 本稿では,自律飛行に適したスケーラブルなAerial Synthetic Data Augmentation (ASDA) フレームワークを提案する。
ASDAは、シーンとデータ拡張を自動的に実行する2つのスクリプト可能なパイプラインを備えた中央データ収集エンジンを拡張している。
多様なデータセットを自動生成する手法の有効性を実証する。
- 参考スコア(独自算出の注目度): 2.9005223064604078
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One major barrier to advancing aerial autonomy has been collecting
large-scale aerial datasets for training machine learning models. Due to costly
and time-consuming real-world data collection through deploying drones, there
has been an increasing shift towards using synthetic data for training models
in drone applications. However, to increase widespread generalization and
transferring models to real-world, increasing the diversity of simulation
environments to train a model over all the varieties and augmenting the
training data, has been proved to be essential. Current synthetic aerial data
generation tools either lack data augmentation or rely heavily on manual
workload or real samples for configuring and generating diverse realistic
simulation scenes for data collection. These dependencies limit scalability of
the data generation workflow. Accordingly, there is a major challenge in
balancing generalizability and scalability in synthetic data generation. To
address these gaps, we introduce a scalable Aerial Synthetic Data Augmentation
(ASDA) framework tailored to aerial autonomy applications. ASDA extends a
central data collection engine with two scriptable pipelines that automatically
perform scene and data augmentations to generate diverse aerial datasets for
different training tasks. ASDA improves data generation workflow efficiency by
providing a unified prompt-based interface over integrated pipelines for
flexible control. The procedural generative approach of our data augmentation
is performant and adaptable to different simulation environments, training
tasks and data collection needs. We demonstrate the effectiveness of our method
in automatically generating diverse datasets and show its potential for
downstream performance optimization.
- Abstract(参考訳): 自律性向上の大きな障壁のひとつは、機械学習モデルをトレーニングするための大規模な空中データセット収集だ。
ドローンの展開によるコストと時間を要する実世界のデータ収集により、ドローンアプリケーションのトレーニングモデルに合成データを使用することへのシフトが増えている。
しかし、広く一般化され、実世界へのモデル転送が促進されるため、全ての種類にわたってモデルを訓練し、トレーニングデータを強化するためのシミュレーション環境の多様化が不可欠であることが証明されている。
現在の合成空中データ生成ツールは、データ拡張の欠如か、手動のワークロードや実際のサンプルに大きく依存している。
これらの依存関係はデータ生成ワークフローのスケーラビリティを制限する。
したがって、合成データ生成の汎用性とスケーラビリティのバランスには大きな課題がある。
これらのギャップに対処するため、航空自律アプリケーションに適したスケーラブルなAerial Synthetic Data Augmentation(ASDA)フレームワークを導入します。
ASDAは中央データ収集エンジンを拡張し、2つのスクリプト可能なパイプラインでシーンとデータ拡張を自動的に実行し、異なるトレーニングタスクのための多様な空中データセットを生成する。
ASDAは、柔軟な制御のために統合パイプライン上で統一されたプロンプトベースのインターフェースを提供することで、データ生成ワークフローの効率を改善する。
データ拡張の手続き的生成アプローチは、異なるシミュレーション環境、トレーニングタスク、データ収集ニーズに適応し、実行可能である。
多様なデータセットを自動生成する手法の有効性を実証し、下流の性能最適化の可能性を示す。
関連論文リスト
- AgentOhana: Design Unified Data and Training Pipeline for Effective
Agent Learning [102.05962453558368]
textbfAgentOhanaは、さまざまなシナリオにまたがって、異なる環境からエージェントのトラジェクトリを集約する。
AIエージェント用に調整された大規模なアクションモデルである textbfxLAM-v0.1 は、さまざまなベンチマークで例外的なパフォーマンスを示している。
論文 参考訳(メタデータ) (2024-02-23T18:56:26Z) - Simulation-Enhanced Data Augmentation for Machine Learning Pathloss
Prediction [9.664420734674088]
本稿では,機械学習パスロス予測のための新しいシミュレーション強化データ拡張手法を提案する。
本手法は,細胞被覆シミュレータから生成した合成データと,独立して収集した実世界のデータセットを統合する。
合成データの統合は、異なる環境におけるモデルの一般化可能性を大幅に向上させる。
論文 参考訳(メタデータ) (2024-02-03T00:38:08Z) - Are Synthetic Time-series Data Really not as Good as Real Data? [29.852306720544224]
時系列データは、データ品質の問題、バイアスと脆弱性、一般化の問題に起因する制限を提示する。
InfoBoostは、時系列表現学習機能を備えた、高度に汎用的なクロスドメインデータ合成フレームワークである。
本研究では,実データを用いて学習したモデルの性能を上回りながら,実データを必要としないモデルトレーニングを可能にする合成データに基づく手法を開発した。
論文 参考訳(メタデータ) (2024-02-01T13:59:04Z) - Importance-Aware Adaptive Dataset Distillation [53.79746115426363]
ディープラーニングモデルの開発は、大規模データセットの可用性によって実現されている。
データセットの蒸留は、大きな元のデータセットから必須情報を保持するコンパクトなデータセットを合成することを目的としている。
本稿では, 蒸留性能を向上する重要適応型データセット蒸留(IADD)法を提案する。
論文 参考訳(メタデータ) (2024-01-29T03:29:39Z) - Deep Generative Modeling-based Data Augmentation with Demonstration
using the BFBT Benchmark Void Fraction Datasets [3.341975883864341]
本稿では、画像データ生成に広く用いられている深部生成モデル(DGM)の科学的データ拡張への応用について検討する。
トレーニングが完了すると、DGMはトレーニングデータに類似した合成データを生成し、データセットのサイズを大幅に拡大するために使用することができる。
論文 参考訳(メタデータ) (2023-08-19T22:19:41Z) - Synthetic data, real errors: how (not) to publish and use synthetic data [86.65594304109567]
生成過程が下流MLタスクにどのように影響するかを示す。
本稿では、生成プロセスモデルパラメータの後方分布を近似するために、Deep Generative Ensemble (DGE)を導入する。
論文 参考訳(メタデータ) (2023-05-16T07:30:29Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - Unsupervised Domain Adaptive Learning via Synthetic Data for Person
Re-identification [101.1886788396803]
人物再識別(re-ID)は、ビデオ監視に広く応用されているため、ますます注目を集めている。
残念なことに、主流のディープラーニング手法では、モデルをトレーニングするために大量のラベル付きデータが必要です。
本稿では,コンピュータゲーム内で合成されたre-IDサンプルを自動的に生成するデータコレクタを開発し,同時にアノテートするデータラベラを構築した。
論文 参考訳(メタデータ) (2021-09-12T15:51:41Z) - From Data to Actions in Intelligent Transportation Systems: a
Prescription of Functional Requirements for Model Actionability [10.27718355111707]
この研究は、多種多様なソースから得られたデータが、その資産やシステム、プロセスの効率的な運用のために、データ駆動モデルを学び、適応するためにどのように使用できるかを説明することを目的としている。
ITSのデータモデリングパイプラインでは、データ融合、適応学習、モデル評価という3つの複合ステージに対して、特性、エンジニアリング要件、本質的な課題を定義します。
論文 参考訳(メタデータ) (2020-02-06T12:02:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。