論文の概要: Multi-label Scene Classification for Autonomous Vehicles: Acquiring and Accumulating Knowledge from Diverse Datasets
- arxiv url: http://arxiv.org/abs/2506.17101v3
- Date: Wed, 17 Sep 2025 19:22:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-19 15:20:14.92602
- Title: Multi-label Scene Classification for Autonomous Vehicles: Acquiring and Accumulating Knowledge from Diverse Datasets
- Title(参考訳): 自動車のマルチラベルシーン分類 : 多様なデータセットからの知識の獲得と蓄積
- Authors: Ke Li, Chenyu Zhang, Yuxin Ding, Xianbiao Hu, Ruwen Qin,
- Abstract要約: 本稿では,知識獲得・蓄積(KAA)と一貫性に基づくアクティブラーニング(CAL)を統合した新しいディープラーニング手法を提案する。
新たに開発されたドライビングシーン識別(DSI)データセットのアブレーション調査では、ImageNetで事前トレーニングされたベースラインよりも56.1%改善されている。
KAA-CALはBDD100KとHSDデータセットの最先端のマルチラベル分類手法より優れている。
- 参考スコア(独自算出の注目度): 13.41074576587372
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Driving scenes are inherently heterogeneous and dynamic. Multi-attribute scene identification, as a high-level visual perception capability, provides autonomous vehicles (AVs) with essential contextual awareness to understand, reason through, and interact with complex driving environments. Although scene identification is best modeled as a multi-label classification problem via multitask learning, it faces two major challenges: the difficulty of acquiring balanced, comprehensively annotated datasets and the need to re-annotate all training data when new attributes emerge. To address these challenges, this paper introduces a novel deep learning method that integrates Knowledge Acquisition and Accumulation (KAA) with Consistency-based Active Learning (CAL). KAA leverages monotask learning on heterogeneous single-label datasets to build a knowledge foundation, while CAL bridges the gap between single- and multi-label data, adapting the foundation model for multi-label scene classification. An ablation study on the newly developed Driving Scene Identification (DSI) dataset demonstrates a 56.1% improvement over an ImageNet-pretrained baseline. Moreover, KAA-CAL outperforms state-of-the-art multi-label classification methods on the BDD100K and HSD datasets, achieving this with 85% less data and even recognizing attributes unseen during foundation model training. The DSI dataset and KAA-CAL implementation code are publicly available at https://github.com/KELISBU/KAA-CAL .
- Abstract(参考訳): 運転シーンは本質的に異質でダイナミックである。
マルチ属性のシーン識別は、高レベルな視覚認識能力として、複雑な運転環境を理解し、推論し、相互作用するために必要なコンテキスト認識を備えた自律走行車(AV)を提供する。
シーン識別はマルチタスク学習によるマルチラベル分類問題として最適にモデル化されているが、バランスのとれた包括的な注釈付きデータセットを取得することの難しさと、新しい属性が出現した時にすべてのトレーニングデータを再注釈する必要性の2つの大きな課題に直面している。
本稿では,これらの課題に対処するために,知識獲得・蓄積(KAA)と一貫性に基づくアクティブラーニング(CAL)を統合した新しいディープラーニング手法を提案する。
KAAは、異種単一ラベルデータセットのモノタスク学習を活用して知識基盤を構築する一方で、CALはシングルラベルデータとマルチラベルデータのギャップを埋め、マルチラベルシーン分類のための基礎モデルを適用する。
新たに開発されたドライビングシーン識別(DSI)データセットのアブレーション調査では、ImageNetで事前トレーニングされたベースラインよりも56.1%改善されている。
さらに、KAA-CALはBDD100KとHSDデータセットの最先端のマルチラベル分類手法よりも優れており、85%の少ないデータでこれを実現し、基礎モデルトレーニング中に見つからない属性を認識できる。
DSIデータセットとKAA-CAL実装コードはhttps://github.com/KELISBU/KAA-CAL で公開されている。
関連論文リスト
- TSceneJAL: Joint Active Learning of Traffic Scenes for 3D Object Detection [26.059907173437114]
TSceneJALフレームワークはラベル付きデータとラベルなしデータの両方から、バランスのとれた、多様性のある、複雑なトラフィックシーンを効率的にサンプリングすることができる。
提案手法は,3次元オブジェクト検出タスクにおける既存の最先端手法よりも12%向上した。
論文 参考訳(メタデータ) (2024-12-25T11:07:04Z) - Hybrid Discriminative Attribute-Object Embedding Network for Compositional Zero-Shot Learning [83.10178754323955]
HDA-OE(Hybrid Discriminative Attribute-Object Embedding)ネットワークは,属性とオブジェクトの視覚表現との複雑な相互作用を解決するために提案される。
トレーニングデータの多様性を高めるため、HDA-OEは属性駆動型データ合成(ADDS)モジュールを導入した。
HDA-OEは、モデルの識別能力をさらに向上するため、サブクラス駆動の差別的埋め込み(SDDE)モジュールを導入している。
提案モデルを3つのベンチマークデータセットで評価し,その妥当性と信頼性を検証した。
論文 参考訳(メタデータ) (2024-11-28T09:50:25Z) - Incremental Self-training for Semi-supervised Learning [56.57057576885672]
ISTは単純だが有効であり、既存の自己学習に基づく半教師あり学習手法に適合する。
提案したISTを5つのデータセットと2種類のバックボーンで検証し,認識精度と学習速度を効果的に向上させる。
論文 参考訳(メタデータ) (2024-04-14T05:02:00Z) - Multi-Label Knowledge Distillation [86.03990467785312]
本稿では,新しい多ラベル知識蒸留法を提案する。
一方、マルチラベル学習問題をバイナリ分類問題に分割することにより、ロジットからの情報的意味知識を利用する。
一方,ラベルワイド埋め込みの構造情報を活用することにより,学習した特徴表現の識別性を向上する。
論文 参考訳(メタデータ) (2023-08-12T03:19:08Z) - LVLane: Deep Learning for Lane Detection and Classification in
Challenging Conditions [2.5641096293146712]
本稿では,ディープラーニング手法に基づくエンドツーエンドの車線検出・分類システムを提案する。
本研究では,最新技術(SOTA)レーンローカライゼーションモデルにおいて重要な課題を提起するシナリオを包含する,厳密にキュレートされたユニークなデータセットを提案する。
そこで本研究では,CNNをベースとした検知器とシームレスに統合し,異なるレーンの識別を容易にする分類手法を提案する。
論文 参考訳(メタデータ) (2023-07-13T16:09:53Z) - Association Graph Learning for Multi-Task Classification with Category
Shifts [68.58829338426712]
関連する分類タスクが同じラベル空間を共有し、同時に学習されるマルチタスク分類に焦点を当てる。
我々は、不足クラスのためのタスク間で知識を伝達する関連グラフを学習する。
我々の手法は代表的基準よりも一貫して性能が良い。
論文 参考訳(メタデータ) (2022-10-10T12:37:41Z) - X-Learner: Learning Cross Sources and Tasks for Universal Visual
Representation [71.51719469058666]
本稿では,X-Learnerという表現学習フレームワークを提案する。
X-Learnerは、様々なソースによって管理される複数の視覚タスクの普遍的な特徴を学習する。
X-Learnerは、追加のアノテーションやモダリティ、計算コストを使わずに、様々なタスクで強力なパフォーマンスを達成する。
論文 参考訳(メタデータ) (2022-03-16T17:23:26Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Multi-label Few/Zero-shot Learning with Knowledge Aggregated from
Multiple Label Graphs [8.44680447457879]
本稿では,異なる意味的ラベル関係をコードする複数のラベルグラフから知識を融合する,シンプルな多グラフ集約モデルを提案する。
本研究は,多グラフ知識集約を用いた手法が,少数・ゼロショットラベルのほとんどすべてにおいて,大幅な性能向上を実現していることを示す。
論文 参考訳(メタデータ) (2020-10-15T01:15:43Z) - Knowledge-Guided Multi-Label Few-Shot Learning for General Image
Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。
まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。
次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。
グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文 参考訳(メタデータ) (2020-09-20T15:05:29Z) - Information Condensing Active Learning [4.769747792846005]
本稿では,Deep Bayesian Active Learningを対象としたバッチモードアクティブラーニング(AL)手法である,情報凝縮型アクティブラーニング(ICAL)を紹介する。
ICALはヒルベルト・シュミット独立基準(HSIC)を用いて、候補となる点とラベルなし集合の間の依存性の強さを測定する。
深層学習のためのアートバッチモードAL手法の状態と比較して,複数の画像データセット上でのモデル精度と負のログ可能性(NLL)の面では,大幅な改善が見られた。
論文 参考訳(メタデータ) (2020-02-18T22:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。