論文の概要: TALISMAN: Targeted Active Learning for Object Detection with Rare
Classes and Slices using Submodular Mutual Information
- arxiv url: http://arxiv.org/abs/2112.00166v1
- Date: Tue, 30 Nov 2021 23:17:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-02 14:38:30.829360
- Title: TALISMAN: Targeted Active Learning for Object Detection with Rare
Classes and Slices using Submodular Mutual Information
- Title(参考訳): TALISMAN:サブモジュール相互情報を用いた希少クラスとスライスによる物体検出のためのアクティブ学習
- Authors: Suraj Kothawade, Saikat Ghosh, Sumit Shekhar, Yu Xiang, Rishabh Iyer
- Abstract要約: 本稿では,希少なスライスによるターゲット型アクティブラーニングやオブジェクト検出のための新しいフレームワークを提案する。
本手法では,関心領域の特徴を用いてインスタンス化されるサブモジュール相互情報関数を用いる。
我々は、PASCAL VOC07+12とBDD100Kという現実世界の自動運転データセット上で、私たちのフレームワークを評価した。
- 参考スコア(独自算出の注目度): 16.34454526943999
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Deep neural networks based object detectors have shown great success in a
variety of domains like autonomous vehicles, biomedical imaging, etc. It is
known that their success depends on a large amount of data from the domain of
interest. While deep models often perform well in terms of overall accuracy,
they often struggle in performance on rare yet critical data slices. For
example, data slices like "motorcycle at night" or "bicycle at night" are often
rare but very critical slices for self-driving applications and false negatives
on such rare slices could result in ill-fated failures and accidents. Active
learning (AL) is a well-known paradigm to incrementally and adaptively build
training datasets with a human in the loop. However, current AL based
acquisition functions are not well-equipped to tackle real-world datasets with
rare slices, since they are based on uncertainty scores or global descriptors
of the image. We propose TALISMAN, a novel framework for Targeted Active
Learning or object detectIon with rare slices using Submodular MutuAl
iNformation. Our method uses the submodular mutual information functions
instantiated using features of the region of interest (RoI) to efficiently
target and acquire data points with rare slices. We evaluate our framework on
the standard PASCAL VOC07+12 and BDD100K, a real-world self-driving dataset. We
observe that TALISMAN outperforms other methods by in terms of average
precision on rare slices, and in terms of mAP.
- Abstract(参考訳): ディープニューラルネットワークに基づくオブジェクト検出器は、自動運転車やバイオメディカルイメージングなど、さまざまな領域で大きな成功を収めている。
彼らの成功は、関心領域からの大量のデータに依存することが知られている。
ディープモデルは全体的な精度でよく機能するが、稀に重要なデータスライスのパフォーマンスに苦戦することが多い。
例えば、"motorcycle at night"や"bicycle at night"といったデータスライスは珍しくないが、自動運転アプリケーションにとって非常に重要なスライスであり、そのようなまれなスライスに対する偽陰性は、不適切な障害や事故を引き起こす可能性がある。
アクティブラーニング(AL)は、ループ内の人間とトレーニングデータセットを漸進的かつ適応的に構築する、よく知られたパラダイムである。
しかし、現在のALベースの取得関数は、画像の不確実性スコアやグローバルディスクリプタに基づいており、稀なスライスで現実世界のデータセットに取り組むには適していない。
本稿では,サブモジュラー相互情報を用いた希少なスライスを用いた,アクティブラーニングや物体検出のための新しいフレームワーク talisman を提案する。
本手法では,関心領域(roi)の特徴を用いてインスタンス化したサブモジュラー相互情報関数を用いて,レアスライスのデータポイントを効率的に対象とし取得する。
当社のフレームワークは,pascal voc07+12とbdd100kという,実世界の自動運転データセット上で評価しています。
我々は,まれなスライスの平均精度およびmAPで,TALISMANが他の手法よりも優れていることを観察した。
関連論文リスト
- STREAMLINE: Streaming Active Learning for Realistic Multi-Distributional
Settings [2.580765958706854]
STREAMLINEは、シナリオ駆動スライス不均衡を緩和する新しいストリーミングアクティブラーニングフレームワークである。
画像分類とオブジェクト検出タスクのための実世界のストリーミングシナリオ上でSTREAMLINEを評価する。
論文 参考訳(メタデータ) (2023-05-18T02:01:45Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - Mitigating Representation Bias in Action Recognition: Algorithms and
Benchmarks [76.35271072704384]
ディープラーニングモデルは、稀なシーンやオブジェクトを持つビデオに適用すると、パフォーマンスが悪くなります。
この問題にはアルゴリズムとデータセットの2つの異なる角度から対処する。
偏りのある表現は、他のデータセットやタスクに転送するとより一般化できることを示す。
論文 参考訳(メタデータ) (2022-09-20T00:30:35Z) - Learning from Temporal Spatial Cubism for Cross-Dataset Skeleton-based
Action Recognition [88.34182299496074]
アクションラベルはソースデータセットでのみ利用可能だが、トレーニング段階のターゲットデータセットでは利用できない。
我々は,2つの骨格に基づく行動データセット間の領域シフトを低減するために,自己スーパービジョン方式を利用する。
時間的セグメントや人体部分のセグメンテーションとパーフォーミングにより、我々は2つの自己教師あり学習分類タスクを設計する。
論文 参考訳(メタデータ) (2022-07-17T07:05:39Z) - Active Data Discovery: Mining Unknown Data using Submodular Information
Measures [1.7491858164568674]
未知のデータスライスやクラスを効率的にマイニングできるアクティブなデータ発見フレームワークを提供する。
既存の最先端のアクティブな学習手法と比較して,提案手法の精度とラベル付け効率が向上することを示す。
論文 参考訳(メタデータ) (2022-06-17T05:52:18Z) - CARLA-GeAR: a Dataset Generator for a Systematic Evaluation of
Adversarial Robustness of Vision Models [61.68061613161187]
本稿では,合成データセットの自動生成ツールであるCARLA-GeARについて述べる。
このツールは、Python APIを使用して、CARLAシミュレータ上に構築されており、自律運転のコンテキストにおいて、いくつかのビジョンタスク用のデータセットを生成することができる。
本稿では,CARLA-GeARで生成されたデータセットが,現実世界の敵防衛のベンチマークとして今後どのように利用されるかを示す。
論文 参考訳(メタデータ) (2022-06-09T09:17:38Z) - Diverse Complexity Measures for Dataset Curation in Self-driving [80.55417232642124]
トラフィックシーンの面白さを定量化する多様な基準を活用した新たなデータ選択手法を提案する。
実験の結果,提案するキュレーションパイプラインは,より汎用的で高いパフォーマンスをもたらすデータセットを選択できることが判明した。
論文 参考訳(メタデータ) (2021-01-16T23:45:02Z) - Stance Detection Benchmark: How Robust Is Your Stance Detection? [65.91772010586605]
Stance Detection (StD) は、あるトピックやクレームに対する著者の姿勢を検出することを目的としている。
マルチデータセット学習環境において、さまざまなドメインの10のStDデータセットから学習するStDベンチマークを導入する。
このベンチマーク設定では、5つのデータセットに新しい最先端結果を表示することができます。
論文 参考訳(メタデータ) (2020-01-06T13:37:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。