Fugu-MT 論文翻訳(概要): Acquiring and Accumulating Knowledge from Diverse Datasets for Multi-label Driving Scene Classification

論文の概要: Acquiring and Accumulating Knowledge from Diverse Datasets for Multi-label Driving Scene Classification

arxiv url: http://arxiv.org/abs/2506.17101v1
Date: Fri, 20 Jun 2025 16:06:53 GMT
ステータス: 翻訳完了
システム内更新日: 2025-06-23 19:00:05.525077
Title: Acquiring and Accumulating Knowledge from Diverse Datasets for Multi-label Driving Scene Classification
Title（参考訳）: 複数ラベル運転シーン分類のための異種データセットからの知識の獲得と蓄積
Authors: Ke Li, Chenyu Zhang, Yuxin Ding, Xianbiao Hu, Ruwen Qin,
Abstract要約: 本稿では,知識獲得・蓄積(KAA)と一貫性に基づくアクティブラーニング(CAL)を併用した新しい学習システムを提案する。ドライビングシーン識別(DSI)データセットのアブレーション調査では、ImageNetで事前トレーニングされたベースラインモデルよりも56.1%のパフォーマンス向上が示されている。
参考スコア（独自算出の注目度）: 12.168265998401193
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Driving scene identification, which assigns multiple non-exclusive class labels to a scene, provides the contextual awareness necessary for enhancing autonomous vehicles' ability to understand, reason about, and interact with the complex driving environment. As a multi-label classification problem, it is better tackled via multitasking learning. However, directly training a multi-label classification model for driving scene identification through multitask learning presents two main challenges: acquiring a balanced, comprehensively annotated multi-label dataset and balancing learning across different tasks. This paper introduces a novel learning system that synergizes knowledge acquisition and accumulation (KAA) with consistency-based active learning (CAL) to address those challenges. KAA acquires and accumulates knowledge about scene identification from various single-label datasets via monotask learning. Subsequently, CAL effectively resolves the knowledge gap caused by the discrepancy between the marginal distributions of individual attributes and their joint distribution. An ablation study on our Driving Scene Identification (DSI) dataset demonstrates a 56.1% performance increase over the baseline model pretrained on ImageNet. Of this, KAA accounts for 31.3% of the gain, and CAL contributes 24.8%. Moreover, KAA-CAL stands out as the best performer when compared to state-of-the-art (SOTA) multi-label models on two public datasets, BDD100K and HSD, achieving this while using 85% less data. The DSI dataset and the implementation code for KAA-CAL are available at https://github.com/KELISBU/KAA-CAL .
Abstract（参考訳）: 複数の非排他的なクラスラベルをシーンに割り当てる運転シーン識別は、複雑な運転環境を理解し、推論し、相互作用する自動運転車の能力を高めるために必要なコンテキスト認識を提供する。マルチラベル分類問題として、マルチタスク学習によりよりうまく取り組まれる。しかし、マルチタスク学習を通じてシーン識別を駆動するためのマルチラベル分類モデルを直接訓練することは、バランスのとれた、包括的な注釈付きマルチラベルデータセットの取得と、異なるタスク間の学習のバランスの2つの大きな課題を提示している。本稿では,これらの課題に対処するために,知識獲得・蓄積(KAA)と一貫性に基づくアクティブラーニング(CAL)を併用した新しい学習システムを提案する。 KAAは、モノタスク学習を通じて、さまざまなシングルラベルデータセットからシーン識別に関する知識を取得し、蓄積する。その後、CALは個々の属性の限界分布とそれらの共同分布との相違に起因する知識ギャップを効果的に解決する。ドライビングシーン識別(DSI)データセットのアブレーション調査では、ImageNetで事前トレーニングされたベースラインモデルよりも56.1%のパフォーマンス向上が示されている。このうち、KAAが31.3%、CALが24.8%を占めている。さらに、KAA-CALは、BDD100KとHSDという2つの公開データセット上の最先端(SOTA)マルチラベルモデルと比較して、これを85%少ないデータで達成する上で、最高のパフォーマーである。 DSIデータセットとKAA-CALの実装コードはhttps://github.com/KELISBU/KAA-CALで公開されている。

関連論文リスト

Image Classification with Deep Reinforcement Active Learning [28.924413229981827]
多くの実世界のシナリオでは、ラベル付きデータは不足しており、ハンドラベルは時間、労力、コストが要求される。アクティブラーニング(英: Active Learning)は、専門家によって注釈付けされ、手作業によるデータのラベル付けを緩和する代替パラダイムである。本研究では,マルコフ決定過程(MDP)に基づく適応型能動学習法を提案する。
論文参考訳（メタデータ） (2024-12-27T18:37:51Z)
TSceneJAL: Joint Active Learning of Traffic Scenes for 3D Object Detection [26.059907173437114]
TSceneJALフレームワークはラベル付きデータとラベルなしデータの両方から、バランスのとれた、多様性のある、複雑なトラフィックシーンを効率的にサンプリングすることができる。提案手法は,3次元オブジェクト検出タスクにおける既存の最先端手法よりも12%向上した。
論文参考訳（メタデータ） (2024-12-25T11:07:04Z)
Hybrid Discriminative Attribute-Object Embedding Network for Compositional Zero-Shot Learning [83.10178754323955]
HDA-OE(Hybrid Discriminative Attribute-Object Embedding)ネットワークは,属性とオブジェクトの視覚表現との複雑な相互作用を解決するために提案される。トレーニングデータの多様性を高めるため、HDA-OEは属性駆動型データ合成(ADDS)モジュールを導入した。 HDA-OEは、モデルの識別能力をさらに向上するため、サブクラス駆動の差別的埋め込み(SDDE)モジュールを導入している。提案モデルを3つのベンチマークデータセットで評価し,その妥当性と信頼性を検証した。
論文参考訳（メタデータ） (2024-11-28T09:50:25Z)
UdeerLID+: Integrating LiDAR, Image, and Relative Depth with Semi-Supervised [12.440461420762265]
道路分割は自動運転システムにとって重要な課題である。我々の研究は、LiDARポイントクラウドデータ、ビジュアルイメージ、および相対深度マップを統合する革新的なアプローチを導入している。主な課題の1つは、大規模で正確にラベル付けされたデータセットの不足である。
論文参考訳（メタデータ） (2024-09-10T03:57:30Z)
Incremental Self-training for Semi-supervised Learning [56.57057576885672]
ISTは単純だが有効であり、既存の自己学習に基づく半教師あり学習手法に適合する。提案したISTを5つのデータセットと2種類のバックボーンで検証し,認識精度と学習速度を効果的に向上させる。
論文参考訳（メタデータ） (2024-04-14T05:02:00Z)
Multi-Label Knowledge Distillation [86.03990467785312]
本稿では,新しい多ラベル知識蒸留法を提案する。一方、マルチラベル学習問題をバイナリ分類問題に分割することにより、ロジットからの情報的意味知識を利用する。一方,ラベルワイド埋め込みの構造情報を活用することにより,学習した特徴表現の識別性を向上する。
論文参考訳（メタデータ） (2023-08-12T03:19:08Z)
LVLane: Deep Learning for Lane Detection and Classification in Challenging Conditions [2.5641096293146712]
本稿では,ディープラーニング手法に基づくエンドツーエンドの車線検出・分類システムを提案する。本研究では,最新技術(SOTA)レーンローカライゼーションモデルにおいて重要な課題を提起するシナリオを包含する,厳密にキュレートされたユニークなデータセットを提案する。そこで本研究では,CNNをベースとした検知器とシームレスに統合し,異なるレーンの識別を容易にする分類手法を提案する。
論文参考訳（メタデータ） (2023-07-13T16:09:53Z)
Recognizing Unseen Objects via Multimodal Intensive Knowledge Graph Propagation [68.13453771001522]
画像の領域と対応するセマンティック埋め込みとをマッチングする多モード集中型ZSLフレームワークを提案する。我々は、大規模な実世界のデータに基づいて、広範囲な実験を行い、そのモデルを評価する。
論文参考訳（メタデータ） (2023-06-14T13:07:48Z)
Association Graph Learning for Multi-Task Classification with Category Shifts [68.58829338426712]
関連する分類タスクが同じラベル空間を共有し、同時に学習されるマルチタスク分類に焦点を当てる。我々は、不足クラスのためのタスク間で知識を伝達する関連グラフを学習する。我々の手法は代表的基準よりも一貫して性能が良い。
論文参考訳（メタデータ） (2022-10-10T12:37:41Z)
X-Learner: Learning Cross Sources and Tasks for Universal Visual Representation [71.51719469058666]
本稿では,X-Learnerという表現学習フレームワークを提案する。 X-Learnerは、様々なソースによって管理される複数の視覚タスクの普遍的な特徴を学習する。 X-Learnerは、追加のアノテーションやモダリティ、計算コストを使わずに、様々なタスクで強力なパフォーマンスを達成する。
論文参考訳（メタデータ） (2022-03-16T17:23:26Z)
UniVIP: A Unified Framework for Self-Supervised Visual Pre-training [50.87603616476038]
単一中心オブジェクトまたは非調和データセット上で,汎用的な視覚表現を学習するための,新しい自己教師型フレームワークを提案する。大規模実験により、非高調波COCOで事前訓練されたUniVIPは、最先端の転送性能を実現することが示された。また、ImageNetのような単一中心オブジェクトのデータセットを利用でき、線形探索において同じ事前学習エポックでBYOLを2.5%上回る。
論文参考訳（メタデータ） (2022-03-14T10:04:04Z)
MSeg: A Composite Dataset for Multi-domain Semantic Segmentation [100.17755160696939]
セマンティックセグメンテーションデータセットを異なるドメインから統合する合成データセットであるMSegを提案する。一般化と画素レベルのアノテーションのアライメントを調整し,2万枚以上のオブジェクトマスクを8万枚以上の画像で再現する。 MSegでトレーニングされたモデルは、WildDash-v1のリーダーボードで、トレーニング中にWildDashのデータに触れることなく、堅牢なセマンティックセグメンテーションのためにランク付けされている。
論文参考訳（メタデータ） (2021-12-27T16:16:35Z)
SCARF: Self-Supervised Contrastive Learning using Random Feature Corruption [72.35532598131176]
本稿では,特徴のランダムなサブセットを乱してビューを形成するコントラスト学習手法であるSCARFを提案する。 SCARFは既存の戦略を補完し、オートエンコーダのような代替手段より優れていることを示す。
論文参考訳（メタデータ） (2021-06-29T08:08:33Z)
Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文参考訳（メタデータ） (2021-01-16T23:45:02Z)
Adaptive Prototypical Networks with Label Words and Joint Representation Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。 FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文参考訳（メタデータ） (2021-01-10T11:25:42Z)
Multi-label Few/Zero-shot Learning with Knowledge Aggregated from Multiple Label Graphs [8.44680447457879]
本稿では,異なる意味的ラベル関係をコードする複数のラベルグラフから知識を融合する,シンプルな多グラフ集約モデルを提案する。本研究は,多グラフ知識集約を用いた手法が,少数・ゼロショットラベルのほとんどすべてにおいて,大幅な性能向上を実現していることを示す。
論文参考訳（メタデータ） (2020-10-15T01:15:43Z)
Knowledge-Guided Multi-Label Few-Shot Learning for General Image Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文参考訳（メタデータ） (2020-09-20T15:05:29Z)
Information Condensing Active Learning [4.769747792846005]
本稿では,Deep Bayesian Active Learningを対象としたバッチモードアクティブラーニング(AL)手法である,情報凝縮型アクティブラーニング(ICAL)を紹介する。 ICALはヒルベルト・シュミット独立基準(HSIC)を用いて、候補となる点とラベルなし集合の間の依存性の強さを測定する。深層学習のためのアートバッチモードAL手法の状態と比較して,複数の画像データセット上でのモデル精度と負のログ可能性(NLL)の面では,大幅な改善が見られた。
論文参考訳（メタデータ） (2020-02-18T22:55:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。