論文の概要: Diverse Complexity Measures for Dataset Curation in Self-driving
- arxiv url: http://arxiv.org/abs/2101.06554v1
- Date: Sat, 16 Jan 2021 23:45:02 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-28 04:27:35.021306
- Title: Diverse Complexity Measures for Dataset Curation in Self-driving
- Title(参考訳): 自動運転におけるデータセットキュレーションの多種多様な複雑さ対策
- Authors: Abbas Sadat, Sean Segal, Sergio Casas, James Tu, Bin Yang, Raquel
Urtasun, Ersin Yumer
- Abstract要約: トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
- 参考スコア(独自算出の注目度): 80.55417232642124
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Modern self-driving autonomy systems heavily rely on deep learning. As a
consequence, their performance is influenced significantly by the quality and
richness of the training data. Data collecting platforms can generate many
hours of raw data in a daily basis, however, it is not feasible to label
everything. It is thus of key importance to have a mechanism to identify "what
to label". Active learning approaches identify examples to label, but their
interestingness is tied to a fixed model performing a particular task. These
assumptions are not valid in self-driving, where we have to solve a diverse set
of tasks (i.e., perception, and motion forecasting) and our models evolve over
time frequently. In this paper we introduce a novel approach and propose a new
data selection method that exploits a diverse set of criteria that quantize
interestingness of traffic scenes. Our experiments on a wide range of tasks and
models show that the proposed curation pipeline is able to select datasets that
lead to better generalization and higher performance.
- Abstract(参考訳): 現代の自動運転システムはディープラーニングに大きく依存している。
その結果,その性能は,トレーニングデータの質と豊かさに大きく影響される。
データ収集プラットフォームは、毎日何時間もの生データを生成できるが、すべてをラベル付けすることは不可能である。
したがって、"ラベルの付け方"を識別するメカニズムを持つことが重要である。
アクティブラーニングアプローチはラベルの例を特定するが、その興味深い点は特定のタスクを実行する固定モデルに結びついている。
これらの仮定は自動運転では有効ではなく、様々なタスク(知覚、動きの予測など)を解く必要があり、我々のモデルは時間とともに頻繁に進化する。
本稿では,交通シーンの面白さを定量化する多種多様な基準を利用する新しい手法を提案し,新しいデータ選択手法を提案する。
幅広いタスクとモデルを用いた実験により,提案するキュレーションパイプラインは,より汎用性や高いパフォーマンスをもたらすデータセットを選択できることを示した。
関連論文リスト
- Combating Missing Modalities in Egocentric Videos at Test Time [92.38662956154256]
現実のアプリケーションは、プライバシの懸念、効率性の必要性、ハードウェアの問題により、不完全なモダリティを伴う問題に直面することが多い。
再トレーニングを必要とせずに,テスト時にこの問題に対処する新しい手法を提案する。
MiDlは、欠落したモダリティをテスト時にのみ扱う、自己管理型のオンラインソリューションとしては初めてのものだ。
論文 参考訳(メタデータ) (2024-04-23T16:01:33Z) - AIDE: An Automatic Data Engine for Object Detection in Autonomous Driving [68.73885845181242]
本稿では,問題を自動的に識別し,データを効率よくキュレートし,自動ラベル付けによりモデルを改善する自動データエンジン(AIDE)を提案する。
さらに,AVデータセットのオープンワールド検出のためのベンチマークを構築し,様々な学習パラダイムを包括的に評価し,提案手法の優れた性能を低コストで実証する。
論文 参考訳(メタデータ) (2024-03-26T04:27:56Z) - Exploring intra-task relations to improve meta-learning algorithms [1.223779595809275]
我々は,タスクの効果的なミニバッチによるトレーニング安定性向上のために,タスク関係の外部知識を活用することを目的としている。
ミニバッチでタスクの多様なセットを選択すると、完全な勾配がより良く見積もられるため、トレーニングにおけるノイズの低減につながる、という仮説を立てる。
論文 参考訳(メタデータ) (2023-12-27T15:33:52Z) - Rank2Tell: A Multimodal Driving Dataset for Joint Importance Ranking and
Reasoning [19.43430577960824]
本稿では,重要度をランク付けするマルチモーダル・エゴ中心のデータセットである Rank2Tell を紹介し,その重要性の理由を述べる。
クローズドでオープンな様々な視覚的質問応答を用いて、複雑な交通シナリオにおいて、データセットは様々な重要なオブジェクトの様々な意味、空間的、時間的、関係的な属性の密接なアノテーションを提供する。
論文 参考訳(メタデータ) (2023-09-12T20:51:07Z) - A Benchmark Generative Probabilistic Model for Weak Supervised Learning [2.0257616108612373]
アノテーションの負担を軽減するために、弱監視学習アプローチが開発されている。
遅延変数モデル(PLVM)が4つのデータセット間で最先端のパフォーマンスを実現することを示す。
論文 参考訳(メタデータ) (2023-03-31T07:06:24Z) - Frugal Reinforcement-based Active Learning [12.18340575383456]
本稿では,ラベル効率向上のための新しい能動的学習手法を提案する。
提案手法は反復的であり,多様性,表現性,不確実性の基準を混合した制約対象関数の最小化を目的としている。
また、強化学習に基づく新たな重み付け機構を導入し、各トレーニングイテレーションでこれらの基準を適応的にバランスさせる。
論文 参考訳(メタデータ) (2022-12-09T14:17:45Z) - Time-Varying Propensity Score to Bridge the Gap between the Past and Present [104.46387765330142]
本稿では,データ分布の段階的変化を検出するための時間変化確率スコアを提案する。
実装のさまざまな方法を示し、さまざまな問題について評価する。
論文 参考訳(メタデータ) (2022-10-04T07:21:49Z) - Online Coreset Selection for Rehearsal-based Continual Learning [65.85595842458882]
継続的な学習では、後に再生されるトレーニング例(コアセット)のサブセットを格納し、破滅的な忘れを軽減します。
提案するオンラインコアセット選択(OCS, Online Coreset Selection)は, 各イテレーションにおいて最も代表的で情報性の高いコアセットを選択するシンプルで効果的な方法である。
提案手法は,過去のタスクに対して高親和性サンプルを選択しながら,目標データセットへのモデル適応を最大化し,破滅的忘れを直接的に抑制する。
論文 参考訳(メタデータ) (2021-06-02T11:39:25Z) - Just Label What You Need: Fine-Grained Active Selection for Perception
and Prediction through Partially Labeled Scenes [78.23907801786827]
提案手法は,コストに配慮した手法と,部分的にラベル付けされたシーンを通じて詳細なサンプル選択を可能にする一般化を導入している。
実世界の大規模自動運転データセットに関する我々の実験は、微粒な選択が知覚、予測、下流計画タスクのパフォーマンスを向上させることを示唆している。
論文 参考訳(メタデータ) (2021-04-08T17:57:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。