論文の概要: RealDriveSim: A Realistic Multi-Modal Multi-Task Synthetic Dataset for Autonomous Driving
- arxiv url: http://arxiv.org/abs/2506.16319v1
- Date: Thu, 19 Jun 2025 13:49:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.097688
- Title: RealDriveSim: A Realistic Multi-Modal Multi-Task Synthetic Dataset for Autonomous Driving
- Title(参考訳): RealDriveSim: 自律運転のためのリアルなマルチモーダルマルチタスク合成データセット
- Authors: Arpit Jadon, Haoran Wang, Phillip Thomas, Michael Stanley, S. Nathaniel Cibik, Rachel Laurat, Omar Maher, Lukas Hoyer, Ozan Unal, Dengxin Dai,
- Abstract要約: 本稿では,自律運転のための現実的なマルチモーダル合成データセットであるRealDriveSimを紹介する。
このデータセットは人気のある2DコンピュータビジョンアプリケーションとそのLiDARアプリケーションをサポートし、64クラスまでの詳細なアノテーションを提供する。
提案するデータセットを広範囲のアプリケーションやドメインに対して広範囲に評価し,既存の総合ベンチマークと比較して最先端の結果を示す。
- 参考スコア(独自算出の注目度): 41.78375625472422
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: As perception models continue to develop, the need for large-scale datasets increases. However, data annotation remains far too expensive to effectively scale and meet the demand. Synthetic datasets provide a solution to boost model performance with substantially reduced costs. However, current synthetic datasets remain limited in their scope, realism, and are designed for specific tasks and applications. In this work, we present RealDriveSim, a realistic multi-modal synthetic dataset for autonomous driving that not only supports popular 2D computer vision applications but also their LiDAR counterparts, providing fine-grained annotations for up to 64 classes. We extensively evaluate our dataset for a wide range of applications and domains, demonstrating state-of-the-art results compared to existing synthetic benchmarks. The dataset is publicly available at https://realdrivesim.github.io/.
- Abstract(参考訳): 知覚モデルの開発が進むにつれ、大規模なデータセットの必要性が高まっている。
しかし、データアノテーションは、要求を効果的にスケールし、満たすには、あまりにも高価である。
合成データセットは、大幅なコスト削減でモデルパフォーマンスを向上させるソリューションを提供する。
しかし、現在の合成データセットはスコープ、リアリズムに限られており、特定のタスクやアプリケーションのために設計されている。
本研究では,一般的な2次元コンピュータビジョンアプリケーションだけでなく,LiDAR対応もサポートし,最大64クラスまでの詳細なアノテーションを提供する,自律運転のための現実的なマルチモーダル合成データセットであるRealDriveSimを紹介する。
提案するデータセットを広範囲のアプリケーションやドメインに対して広範囲に評価し,既存の総合ベンチマークと比較して最先端の結果を示す。
データセットはhttps://realdrivesim.github.io/.comで公開されている。
関連論文リスト
- Unraveling the Effects of Synthetic Data on End-to-End Autonomous Driving [35.49042205415498]
SceneCrafterは3Dガウススプレイティングに基づくリアルでインタラクティブで効率的な自動運転シミュレータである(3DGS)。
SceneCrafterは、さまざまなトラフィックシナリオにわたる現実的な運転ログを効率的に生成する。
また、エンドツーエンドモデルの堅牢なクローズドループ評価を可能にする。
論文 参考訳(メタデータ) (2025-03-23T15:27:43Z) - mmE5: Improving Multimodal Multilingual Embeddings via High-quality Synthetic Data [71.352883755806]
マルチモーダル埋め込みモデルは、テキストや画像などの様々なモダリティからデータを統一表現空間にマッピングする能力において、大きな注目を集めている。
しかし、ラベル付きマルチモーダルデータは、しばしば埋め込み性能を妨げる。
近年のアプローチでは、この問題に対処するためにデータ合成を活用しているが、合成データの質は依然として重大なボトルネックとなっている。
論文 参考訳(メタデータ) (2025-02-12T15:03:33Z) - CARLA2Real: a tool for reducing the sim2real gap in CARLA simulator [2.8978140690127328]
我々は、シミュレーションデータのフォトリアリズムを高めるために最先端のアプローチを採用し、それらを実世界のデータセットの視覚的特徴と整合させる。
そこで我々はCARLA2Realを開発した。CARLA2Realは、広く使われているオープンソースのCARLAシミュレーターである。
このツールは、CARLAをほぼリアルタイムで出力し、13FPSのフレームレートを実現し、実世界のデータセットの視覚的スタイルとリアリズムに変換する。
論文 参考訳(メタデータ) (2024-10-23T19:33:30Z) - NAVSIM: Data-Driven Non-Reactive Autonomous Vehicle Simulation and Benchmarking [65.24988062003096]
我々は,視覚に基づく運転ポリシーをベンチマークするフレームワークであるNAVSIMを提案する。
我々のシミュレーションは非反応性であり、評価された政策と環境は互いに影響を与えない。
NAVSIMはCVPR 2024で開催され、143チームが433のエントリーを提出し、いくつかの新たな洞察を得た。
論文 参考訳(メタデータ) (2024-06-21T17:59:02Z) - SCaRL- A Synthetic Multi-Modal Dataset for Autonomous Driving [0.0]
本稿では、自律運転ソリューションのトレーニングと検証を可能にするために、合成生成された新しいマルチモーダルデータセットであるSCaRLを提案する。
SCaRLはCARLA Simulatorに基づく大規模なデータセットであり、多様な動的シナリオとトラフィック条件のためのデータを提供する。
論文 参考訳(メタデータ) (2024-05-27T10:31:26Z) - TRoVE: Transforming Road Scene Datasets into Photorealistic Virtual
Environments [84.6017003787244]
本研究では、シミュレーションデータセットに存在する困難とドメインギャップに対処する合成データ生成パイプラインを提案する。
既存のデータセットからアノテーションや視覚的手がかりを利用すれば、自動マルチモーダルデータ生成が容易になることを示す。
論文 参考訳(メタデータ) (2022-08-16T20:46:08Z) - Towards Optimal Strategies for Training Self-Driving Perception Models
in Simulation [98.51313127382937]
合成ドメインのみにおけるラベルの使用に焦点を当てる。
提案手法では,ニューラル不変表現の学習方法と,シミュレータからデータをサンプリングする方法に関する理論的にインスピレーションを得た視点を導入する。
マルチセンサーデータを用いた鳥眼視車両分割作業におけるアプローチについて紹介する。
論文 参考訳(メタデータ) (2021-11-15T18:37:43Z) - UnrealROX+: An Improved Tool for Acquiring Synthetic Data from Virtual
3D Environments [14.453602631430508]
ロボット画像から合成データを生成するためのツールであるUnrealROXの改良版を紹介します。
UnrealROX+には、Deep Learningフレームワークから仮想環境と対話するalbedoやPython APIを生成する、といった新機能が含まれている。
論文 参考訳(メタデータ) (2021-04-23T18:45:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。