論文の概要: Scaling-Aware Data Selection for End-to-End Autonomous Driving Systems
- arxiv url: http://arxiv.org/abs/2604.08366v1
- Date: Thu, 09 Apr 2026 15:33:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-10 18:34:05.996172
- Title: Scaling-Aware Data Selection for End-to-End Autonomous Driving Systems
- Title(参考訳): エンド・ツー・エンド自動運転システムのスケーリング対応データ選択
- Authors: Tolga Dimlioglu, Nadine Chang, Maying Shen, Rafid Mahmood, Jose M. Alvarez,
- Abstract要約: 物理的なAIアプリケーションのための大規模ディープラーニングモデルは、さまざまなトレーニングデータ収集作業に依存する。
データ選択ポリシーはトレーニングセットの開発を導くことができるが、現在のフレームワークでは、データポイントが異なるメトリクスにどのように影響するかの曖昧さを考慮していない。
i)データセットをドメインに分割し、(ii)各データ領域から評価指標にニューラルスケーリング法則を適合させ、(iii)ドメインからのデータを反復的に追加することでデータ混合を最適化する。
- 参考スコア(独自算出の注目度): 16.070908697593115
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large-scale deep learning models for physical AI applications depend on diverse training data collection efforts. These models and correspondingly, the training data, must address different evaluation criteria necessary for the models to be deployable in real-world environments. Data selection policies can guide the development of the training set, but current frameworks do not account for the ambiguity in how data points affect different metrics. In this work, we propose Mixture Optimization via Scaling-Aware Iterative Collection (MOSAIC), a general data selection framework that operates by: (i) partitioning the dataset into domains; (ii) fitting neural scaling laws from each data domain to the evaluation metrics; and (iii) optimizing a data mixture by iteratively adding data from domains that maximize the change in metrics. We apply MOSAIC to autonomous driving (AD), where an End-to-End (E2E) planner model is evaluated on the Extended Predictive Driver Model Score (EPDMS), an aggregate of driving rule compliance metrics. Here, MOSAIC outperforms a diverse set of baselines on EPDMS with up to 80\% less data.
- Abstract(参考訳): 物理的なAIアプリケーションのための大規模ディープラーニングモデルは、さまざまなトレーニングデータ収集作業に依存する。
これらのモデルとそれに対応するトレーニングデータは、実環境にデプロイ可能なモデルに必要なさまざまな評価基準に対処する必要がある。
データ選択ポリシーはトレーニングセットの開発を導くことができるが、現在のフレームワークでは、データポイントが異なるメトリクスにどのように影響するかの曖昧さを考慮していない。
そこで本研究では,Scaling-Aware Iterative Collection (MOSAIC)によるMixture Optimizationを提案する。
i) データセットをドメインに分割すること。
二 各データ領域から評価指標にニューラルスケーリング法則を適用すること。
三 メトリクスの変化を最大化する領域からのデータを反復的に追加することにより、データの混合を最適化すること。
自動走行(AD)にMOSAICを適用し,EPDMS(Extensioned Predictive Driver Model Score)上でエンド・ツー・エンド(E2E)プランナーモデルを評価した。
ここでは、MOSAICは、最大80%の少ないデータで、EPDMS上の多様なベースラインのセットを上回ります。
関連論文リスト
- Model-Based Policy Adaptation for Closed-Loop End-to-End Autonomous Driving [54.46325690390831]
本稿では,事前学習したE2E運転エージェントのロバスト性と安全性を高めるための汎用フレームワークとして,モデルベースポリシー適応(MPA)を提案する。
MPAは、ジオメトリ一貫性のあるシミュレーションエンジンを用いて、まず様々な対物軌道を生成する。
MPAは拡散ベースのポリシーアダプタを訓練し、基本方針の予測を洗練させ、Q値モデルを多段階に分けて長期的な結果を評価する。
論文 参考訳(メタデータ) (2025-11-26T17:01:41Z) - Middo: Model-Informed Dynamic Data Optimization for Enhanced LLM Fine-Tuning via Closed-Loop Learning [44.53583316198435]
Supervised Fine-Tuning (SFT) Large Language Modelsは高品質なトレーニングデータに依存している。
自己進化型モデル駆動動的データ最適化フレームワークであるMiddoを紹介した。
その結果,Middoはシードデータの品質を継続的に向上し,LLMの性能を平均7.15%向上させることができた。
論文 参考訳(メタデータ) (2025-08-29T12:47:27Z) - TiKMiX: Take Data Influence into Dynamic Mixture for Language Model Pre-training [15.314880713541873]
TiKMiXは、モデルの進化する好みに応じてデータ混合物を動的に調整する手法である。
グループインフルエンス(Group Influence)は、データドメインがモデルに与える影響を評価するための効果的な指標である。
論文 参考訳(メタデータ) (2025-08-25T05:18:32Z) - LLM Data Selection and Utilization via Dynamic Bi-level Optimization [100.20933466418786]
本研究では,各バッチ内で選択したデータの重み付けを調整し,トレーニング中の動的データ利用を実現するための新しいデータ重み付けモデル(DWM)を提案する。
実験により,DWMはランダムに選択されたデータを用いて訓練されたモデルの性能を向上させることが示された。
さらに、トレーニング中にモデルのデータ嗜好がどのように進化するかを分析し、トレーニング中のモデルのデータ嗜好に関する新たな洞察を提供する。
論文 参考訳(メタデータ) (2025-07-22T02:47:12Z) - DIDS: Domain Impact-aware Data Sampling for Large Language Model Training [61.10643823069603]
大規模言語モデルに対するドメインインパクト対応データサンプリング(DIDS)を提案する。
学習効果に基づくDIDSグループトレーニングデータでは、プロキシ言語モデルと次元削減が使用される。
同等のトレーニング効率を維持しながら平均パフォーマンスを3.4%向上させる。
論文 参考訳(メタデータ) (2025-04-17T13:09:38Z) - Data Scaling Laws for End-to-End Autonomous Driving [83.85463296830743]
16時間から8192時間に及ぶ内部駆動データセット上での簡易エンド・ツー・エンド駆動アーキテクチャの性能評価を行った。
具体的には、目標の性能向上を達成するために、どの程度のトレーニングデータが必要かを調査する。
論文 参考訳(メタデータ) (2025-04-06T03:23:48Z) - Larger or Smaller Reward Margins to Select Preferences for Alignment? [47.11487070429289]
嗜好学習は、大きな言語モデルと人間の価値の整合に不可欠である。
モデルが持つ現在の暗黙の報酬マージンと目標の明示的な報酬マージンとのギャップを定量化するアライメントポテンシャル計量を導入する。
実験結果から,この測定値から選択したデータによるトレーニングはアライメント性能を継続的に向上させることが示された。
論文 参考訳(メタデータ) (2025-02-25T06:43:24Z) - Unsupervised Domain Adaption for Neural Information Retrieval [18.97486314518283]
本稿では,Large Language Models やルールベースの文字列操作を用いたクエリ生成による合成アノテーションの比較を行う。
大規模言語モデルは,すべてのシナリオにおいて,ルールベースの手法よりも大きなマージンで優れていることがわかった。
さらに、オープンな大規模言語モデルを用いて、合成データを生成し、中規模モデルで十分であることを示す。
論文 参考訳(メタデータ) (2023-10-13T18:27:33Z) - MSeg: A Composite Dataset for Multi-domain Semantic Segmentation [100.17755160696939]
セマンティックセグメンテーションデータセットを異なるドメインから統合する合成データセットであるMSegを提案する。
一般化と画素レベルのアノテーションのアライメントを調整し,2万枚以上のオブジェクトマスクを8万枚以上の画像で再現する。
MSegでトレーニングされたモデルは、WildDash-v1のリーダーボードで、トレーニング中にWildDashのデータに触れることなく、堅牢なセマンティックセグメンテーションのためにランク付けされている。
論文 参考訳(メタデータ) (2021-12-27T16:16:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。