論文の概要: A Style-Based Metric for Quantifying the Synthetic-to-Real Gap in Autonomous Driving Image Datasets
- arxiv url: http://arxiv.org/abs/2510.10203v1
- Date: Sat, 11 Oct 2025 13:09:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:29.84056
- Title: A Style-Based Metric for Quantifying the Synthetic-to-Real Gap in Autonomous Driving Image Datasets
- Title(参考訳): 自律走行画像データセットにおける合成対リアルギャップの定量化のためのスタイルベースメトリクス
- Authors: Dingyi Yao, Xinyao Han, Ruibo Ming, Zhihang Song, Lihui Peng, Jianming Hu, Danya Yao, Yi Zhang,
- Abstract要約: 我々は、自律運転システムにおける合成と現実のギャップを定量化するための体系的な枠組みを確立する。
本稿では,新しい評価指標として,SEDD(Style Embedding Distribution Discrepancy)を提案する。
- 参考スコア(独自算出の注目度): 9.788200709163064
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Ensuring the reliability of autonomous driving perception systems requires extensive environment-based testing, yet real-world execution is often impractical. Synthetic datasets have therefore emerged as a promising alternative, offering advantages such as cost-effectiveness, bias free labeling, and controllable scenarios. However, the domain gap between synthetic and real-world datasets remains a critical bottleneck for the generalization of AI-based autonomous driving models. Quantifying this synthetic-to-real gap is thus essential for evaluating dataset utility and guiding the design of more effective training pipelines. In this paper, we establish a systematic framework for quantifying the synthetic-to-real gap in autonomous driving systems, and propose Style Embedding Distribution Discrepancy (SEDD) as a novel evaluation metric. Our framework combines Gram matrix-based style extraction with metric learning optimized for intra-class compactness and inter-class separation to extract style embeddings. Furthermore, we establish a benchmark using publicly available datasets. Experiments are conducted on a variety of datasets and sim-to-real methods, and the results show that our method is capable of quantifying the synthetic-to-real gap. This work provides a standardized quality control tool that enables systematic diagnosis and targeted enhancement of synthetic datasets, advancing future development of data-driven autonomous driving systems.
- Abstract(参考訳): 自律運転認識システムの信頼性を保証するには、環境ベースの広範囲なテストが必要であるが、実際の実行は現実的ではないことが多い。
したがって、合成データセットは、コスト効率、バイアスフリーラベリング、制御可能なシナリオなどの利点を提供する、有望な代替手段として登場した。
しかし、合成データセットと実世界のデータセットのドメインギャップは、AIベースの自律運転モデルの一般化において、依然として重要なボトルネックとなっている。
したがって、この合成と現実のギャップの定量化は、データセットの有用性を評価し、より効果的なトレーニングパイプラインの設計を導く上で不可欠である。
本稿では,自律運転システムにおける合成と現実のギャップを定量化するための体系的枠組みを構築し,新しい評価指標としてスタイル埋め込み分布離散性(SEDD)を提案する。
本フレームワークは,グラム行列に基づくスタイル抽出と,クラス内コンパクト性とクラス間分離に最適化されたメトリック学習を組み合わせて,スタイル埋め込みを抽出する。
さらに,公開データセットを用いたベンチマークを構築した。
各種データセットとsim-to-real法を用いて実験を行い,本手法が合成-実間ギャップを定量化可能であることを示す。
この研究は、標準化された品質管理ツールを提供し、合成データセットの体系的な診断とターゲットの強化を可能にし、データ駆動自律運転システムの将来的な開発を促進する。
関連論文リスト
- A Synthetic Dataset for Manometry Recognition in Robotic Applications [0.686108371431346]
手続き的レンダリングとAI駆動のビデオ生成を統合したハイブリッドデータ合成パイプラインを提案する。
YOLOベースの検出器は、合成データセットに基づいて訓練され、実際のデータと合成データを組み合わせた。
論文 参考訳(メタデータ) (2025-08-24T17:52:13Z) - Evaluating the Impact of Synthetic Data on Object Detection Tasks in Autonomous Driving [0.0]
実・合成・混合データセットに基づいて訓練された2次元・3次元オブジェクト検出タスクを比較した。
その結果,実データと合成データを組み合わせることで,物体検出モデルのロバスト性や一般化が向上することが示唆された。
論文 参考訳(メタデータ) (2025-03-12T20:13:33Z) - Multi-Armed Bandit Approach for Optimizing Training on Synthetic Data [7.603659241572307]
動的ユーザビリティ指標と組み合わせた UCB ベースのトレーニング手法を提案する。
提案手法は,合成画像と対応する実・合成データセットからの低レベル・高レベル情報を統合する。
提案手法は, ユーザビリティに基づいて, 合成画像のランク付けに有効な方法であることを示す。
論文 参考訳(メタデータ) (2024-12-06T23:36:36Z) - Generating Diverse Synthetic Datasets for Evaluation of Real-life Recommender Systems [0.0]
合成データセットは、機械学習モデルの評価とテストに重要である。
我々は,多様かつ統計的に一貫性のある合成データセットを生成するための新しいフレームワークを開発する。
このフレームワークは、最小限の摩擦で研究を容易にする無料のオープンPythonパッケージとして利用できる。
論文 参考訳(メタデータ) (2024-11-27T09:53:14Z) - Reliability in Semantic Segmentation: Can We Use Synthetic Data? [69.28268603137546]
セマンティックセグメンテーションモデルの現実的信頼性を総合的に評価するために、合成データを具体的に生成する方法を初めて示す。
この合成データは、事前訓練されたセグメンタの堅牢性を評価するために使用される。
セグメンタのキャリブレーションとOOD検出能力を向上するために,我々のアプローチをどのように活用できるかを実証する。
論文 参考訳(メタデータ) (2023-12-14T18:56:07Z) - Open-sourced Data Ecosystem in Autonomous Driving: the Present and Future [130.87142103774752]
このレビューは、70以上のオープンソースの自動運転データセットを体系的に評価する。
高品質なデータセットの作成の基礎となる原則など、さまざまな側面に関する洞察を提供する。
また、解決を保障する科学的、技術的課題も検討している。
論文 参考訳(メタデータ) (2023-12-06T10:46:53Z) - Reimagining Synthetic Tabular Data Generation through Data-Centric AI: A
Comprehensive Benchmark [56.8042116967334]
合成データは、機械学習モデルのトレーニングの代替となる。
合成データが現実世界データの複雑なニュアンスを反映することを保証することは、難しい作業です。
本稿では,データ中心型AI技術の統合による合成データ生成プロセスのガイドの可能性について検討する。
論文 参考訳(メタデータ) (2023-10-25T20:32:02Z) - CAFE: Learning to Condense Dataset by Aligning Features [72.99394941348757]
本稿ではCAFE(Aligning features)によるCondenseデータセットの新しいスキームを提案する。
このアプローチの核心は、さまざまなスケールにわたる実データと合成データから機能を整合させる効果的な戦略です。
提案したCAFEを様々なデータセットで検証し,概ね最先端技術であることを示す。
論文 参考訳(メタデータ) (2022-03-03T05:58:49Z) - Sim-to-Real Domain Adaptation for Lane Detection and Classification in
Autonomous Driving [0.0]
教師なしのドメイン適応(UDA)アプローチは低コストで時間を要すると考えられている。
自動走行における車線検出と分類のための逆判別および生成手法を用いたUDAスキームを提案する。
論文 参考訳(メタデータ) (2022-02-15T02:10:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。