論文の概要: Exploring Aleatoric Uncertainty in Object Detection via Vision Foundation Models
- arxiv url: http://arxiv.org/abs/2411.17767v1
- Date: Tue, 26 Nov 2024 07:14:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 15:27:51.401330
- Title: Exploring Aleatoric Uncertainty in Object Detection via Vision Foundation Models
- Title(参考訳): ビジョンファウンデーションモデルによる物体検出の不確かさの探索
- Authors: Peng Cui, Guande He, Dan Zhang, Zhijie Deng, Yinpeng Dong, Jun Zhu,
- Abstract要約: 本稿では,視覚基盤モデルを用いた物体検出データに固有の不確実性をモデル化し,活用することを提案する。
我々は、物体の特徴の混合ガウス構造を仮定し、データの不確実性を定量化するためにマハラノビス距離に基づく測度を考案する。
推定されたアレータリック不確実性はデータセットのアノテーションの余分なレベルとして機能し、任意のモデルでプラグイン・アンド・プレイ方式で利用することができる。
- 参考スコア(独自算出の注目度): 46.71709927361625
- License:
- Abstract: Datasets collected from the open world unavoidably suffer from various forms of randomness or noiseness, leading to the ubiquity of aleatoric (data) uncertainty. Quantifying such uncertainty is particularly pivotal for object detection, where images contain multi-scale objects with occlusion, obscureness, and even noisy annotations, in contrast to images with centric and similar-scale objects in classification. This paper suggests modeling and exploiting the uncertainty inherent in object detection data with vision foundation models and develops a data-centric reliable training paradigm. Technically, we propose to estimate the data uncertainty of each object instance based on the feature space of vision foundation models, which are trained on ultra-large-scale datasets and able to exhibit universal data representation. In particular, we assume a mixture-of-Gaussian structure of the object features and devise Mahalanobis distance-based measures to quantify the data uncertainty. Furthermore, we suggest two curial and practical usages of the estimated uncertainty: 1) for defining uncertainty-aware sample filter to abandon noisy and redundant instances to avoid over-fitting, and 2) for defining sample adaptive regularizer to balance easy/hard samples for adaptive training. The estimated aleatoric uncertainty serves as an extra level of annotations of the dataset, so it can be utilized in a plug-and-play manner with any model. Extensive empirical studies verify the effectiveness of the proposed aleatoric uncertainty measure on various advanced detection models and challenging benchmarks.
- Abstract(参考訳): オープンワールドから収集されたデータセットは、必然的に様々な種類のランダム性やノイズに悩まされ、アレタリックな(データ)不確実性に繋がる。
このような不確実性の定量化は、特にオブジェクト検出において重要であり、画像は、分類において中心的で類似のスケールのオブジェクトを持つ画像とは対照的に、隠蔽、曖昧さ、さらにはノイズの多いアノテーションを含むマルチスケールオブジェクトを含む。
本稿では,物体検出データに固有の不確実性を視覚基礎モデルを用いてモデル化し,データ中心の信頼性トレーニングパラダイムを開発することを提案する。
技術的には、超大規模データセットに基づいて訓練され、普遍的なデータ表現を表現できる視覚基盤モデルの特徴空間に基づいて、各オブジェクトインスタンスのデータ不確実性を推定することを提案する。
特に、物体の特徴の混合ガウス構造を仮定し、データの不確実性を定量化するためにマハラノビス距離に基づく測度を考案する。
さらに、推定不確実性の2つのカリキュラムおよび実用的利用を提案する。
1)過度な適合を避けるため、ノイズや冗長なインスタンスを放棄する不確実性を考慮したサンプルフィルタの定義
2) アダプティブ・トレーニングの容易/硬いサンプルのバランスをとるために, サンプル適応正則化器を定義する。
推定されたアレータリック不確実性はデータセットのアノテーションの余分なレベルとして機能し、任意のモデルでプラグイン・アンド・プレイ方式で利用することができる。
広範囲にわたる実験研究により, 種々の先進的検出モデルと挑戦的ベンチマークに対する, 提案したアレタリック不確実性尺度の有効性が検証された。
関連論文リスト
- Anomaly Detection by Context Contrasting [57.695202846009714]
異常検出は、標準から逸脱するサンプルを特定することに焦点を当てる。
近年の自己教師型学習の進歩は、この点において大きな可能性を秘めている。
我々はコンテキスト拡張を通じて学習するCon$を提案する。
論文 参考訳(メタデータ) (2024-05-29T07:59:06Z) - An Iterative Method for Unsupervised Robust Anomaly Detection Under Data
Contamination [24.74938110451834]
ほとんどの深層異常検出モデルは、データセットから正規性を学ぶことに基づいている。
実際、正規性仮定は実データ分布の性質によってしばしば破られる。
このギャップを減らし、より優れた正規性表現を実現するための学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T02:36:19Z) - A Data-Driven Measure of Relative Uncertainty for Misclassification
Detection [25.947610541430013]
誤分類検出のための観測者に対して,不確実性に関するデータ駆動測度を導入する。
ソフト予測の分布パターンを学習することにより,不確実性を測定することができる。
複数の画像分類タスクに対する経験的改善を示し、最先端の誤分類検出方法より優れていることを示す。
論文 参考訳(メタデータ) (2023-06-02T17:32:03Z) - Reliability-Aware Prediction via Uncertainty Learning for Person Image
Retrieval [51.83967175585896]
UALは、データ不確実性とモデル不確実性を同時に考慮し、信頼性に配慮した予測を提供することを目的としている。
データ不確実性はサンプル固有のノイズを捕捉する」一方、モデル不確実性はサンプルの予測に対するモデルの信頼を表現している。
論文 参考訳(メタデータ) (2022-10-24T17:53:20Z) - NUQ: Nonparametric Uncertainty Quantification for Deterministic Neural
Networks [151.03112356092575]
本研究では,Nadaraya-Watson の条件付きラベル分布の非パラメトリック推定に基づく分類器の予測の不確かさの測定方法を示す。
種々の実世界の画像データセットにおける不確実性推定タスクにおいて,本手法の強い性能を示す。
論文 参考訳(メタデータ) (2022-02-07T12:30:45Z) - Dense Uncertainty Estimation via an Ensemble-based Conditional Latent
Variable Model [68.34559610536614]
我々は、アレータリック不確実性はデータの固有の特性であり、偏見のないオラクルモデルでのみ正確に推定できると論じる。
そこで本研究では,軌道不確実性推定のためのオラクルモデルを近似するために,列車時の新しいサンプリングと選択戦略を提案する。
以上の結果から,提案手法は精度の高い決定論的結果と確実な不確実性推定の両方を達成できることが示唆された。
論文 参考訳(メタデータ) (2021-11-22T08:54:10Z) - CertainNet: Sampling-free Uncertainty Estimation for Object Detection [65.28989536741658]
ニューラルネットワークの不確実性を推定することは、安全クリティカルな設定において基本的な役割を果たす。
本研究では,オブジェクト検出のための新しいサンプリング不要不確実性推定法を提案する。
私たちはそれをCertainNetと呼び、各出力信号に対して、オブジェクト性、クラス、位置、サイズという、別の不確実性を提供するのは、これが初めてです。
論文 参考訳(メタデータ) (2021-10-04T17:59:31Z) - Towards Robust Object Detection: Bayesian RetinaNet for Homoscedastic
Aleatoric Uncertainty Modeling [1.6500749121196985]
COCOデータセットは、データラベルの高レベルのノイズで知られている。
本稿では,画像オブジェクト検出の大規模化に対処する新たな損失関数を提案する。
論文 参考訳(メタデータ) (2021-08-02T11:03:39Z) - Self-Paced Uncertainty Estimation for One-shot Person Re-Identification [9.17071384578203]
本稿では,単発人物の自己ペース不確実性推定ネットワーク(spue-net)を提案する。
自己ペースサンプリング戦略を導入することで,ラベルなしサンプルの擬似ラベルを反復的に推定し,ラベル付きサンプルを拡張できる。
さらに,局所不確実性推定と決定性推定を併用した協調学習手法を適用し,より優れた隠れ空間特徴抽出を実現する。
論文 参考訳(メタデータ) (2021-04-19T09:20:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。