論文の概要: Mitigating Hallucinations in YOLO-based Object Detection Models: A Revisit to Out-of-Distribution Detection
- arxiv url: http://arxiv.org/abs/2503.07330v1
- Date: Mon, 10 Mar 2025 13:42:41 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-11 15:53:26.204480
- Title: Mitigating Hallucinations in YOLO-based Object Detection Models: A Revisit to Out-of-Distribution Detection
- Title(参考訳): YOLOを用いた物体検出モデルにおける幻覚の緩和:分布外検出への再考
- Authors: Weicheng He, Changshun Wu, Chih-Hong Cheng, Xiaowei Huang, Saddek Bensalem,
- Abstract要約: 本稿では,パフォーマンスボトルネックの原因を考察し,パフォーマンスを根本的に改善する手法を提案する。
検出対象にセマンティックに類似したOoDデータセットを慎重に合成する手法を開発することにより,全体の幻覚誤差を88%削減する。
- 参考スコア(独自算出の注目度): 8.206992765692535
- License:
- Abstract: Object detection systems must reliably perceive objects of interest without being overly confident to ensure safe decision-making in dynamic environments. Filtering techniques based on out-of-distribution (OoD) detection are commonly added as an extra safeguard to filter hallucinations caused by overconfidence in novel objects. Nevertheless, evaluating YOLO-family detectors and their filters under existing OoD benchmarks often leads to unsatisfactory performance. This paper studies the underlying reasons for performance bottlenecks and proposes a methodology to improve performance fundamentally. Our first contribution is a calibration of all existing evaluation results: Although images in existing OoD benchmark datasets are claimed not to have objects within in-distribution (ID) classes (i.e., categories defined in the training dataset), around 13% of objects detected by the object detector are actually ID objects. Dually, the ID dataset containing OoD objects can also negatively impact the decision boundary of filters. These ultimately lead to a significantly imprecise performance estimation. Our second contribution is to consider the task of hallucination reduction as a joint pipeline of detectors and filters. By developing a methodology to carefully synthesize an OoD dataset that semantically resembles the objects to be detected, and using the crafted OoD dataset in the fine-tuning of YOLO detectors to suppress the objectness score, we achieve a 88% reduction in overall hallucination error with a combined fine-tuned detection and filtering system on the self-driving benchmark BDD-100K. Our code and dataset are available at: https://gricad-gitlab.univ-grenoble-alpes.fr/dnn-safety/m-hood.
- Abstract(参考訳): オブジェクト検出システムは、動的環境における安全な意思決定を過度に確信することなく、確実に関心のある対象を認識できなければならない。
アウト・オブ・ディストリビューション(OoD)検出に基づくフィルタリング技術は、新しい物体の過信による幻覚をフィルターするための追加の安全ガードとして一般的に用いられる。
それでも、既存のOoDベンチマークでYOLO検出器とそのフィルタを評価することは、しばしば不満足なパフォーマンスをもたらす。
本稿では,パフォーマンスボトルネックの原因を考察し,パフォーマンスを根本的に改善する手法を提案する。
既存のOoDベンチマークデータセットのイメージは、分散(ID)クラス(トレーニングデータセットで定義されたカテゴリ)内にオブジェクトを持たないと主張されているが、オブジェクト検出器によって検出されたオブジェクトの約13%は実際にはIDオブジェクトである。
また、OoDオブジェクトを含むIDデータセットもフィルタの決定境界に悪影響を及ぼす可能性がある。
これらは最終的に、非常に不正確なパフォーマンス推定に繋がる。
第2の貢献は、幻覚減少の課題を検出器とフィルタのジョイントパイプラインとして考えることである。
検出対象にセマンティックに類似したOoDデータセットを慎重に合成する手法を開発し, YOLO検出器の微調整におけるOoDデータセットを用いて対象度を抑える手法により, 自動ベンチマークBDD-100K上での微調整検出・フィルタリングシステムと組み合わせて, 全体幻覚の誤差を88%低減する。
私たちのコードとデータセットは、https://gricad-gitlab.univ-grenoble-alpes.fr/dnn-safety/m-hood.comで利用可能です。
関連論文リスト
- Seamless Detection: Unifying Salient Object Detection and Camouflaged Object Detection [73.85890512959861]
本稿では,SOD(Salient Object Detection)とCOD(Camouflaged Object Detection)を統合化するためのタスク非依存フレームワークを提案する。
我々は、間隔層と大域的コンテキストを含む単純で効果的なコンテキストデコーダを設計し、67fpsの推論速度を実現する。
公開SODデータセットとCODデータセットの実験は、教師なし設定と教師なし設定の両方において、提案したフレームワークの優位性を実証している。
論文 参考訳(メタデータ) (2024-12-22T03:25:43Z) - Oriented Tiny Object Detection: A Dataset, Benchmark, and Dynamic Unbiased Learning [51.170479006249195]
本研究では,新しいデータセット,ベンチマーク,動的粗大な学習手法を提案する。
提案するデータセットであるAI-TOD-Rは、すべてのオブジェクト指向オブジェクト検出データセットの中で最小のオブジェクトサイズを特徴としている。
完全教師付きおよびラベル効率の両アプローチを含む,幅広い検出パラダイムにまたがるベンチマークを提案する。
論文 参考訳(メタデータ) (2024-12-16T09:14:32Z) - On the Inherent Robustness of One-Stage Object Detection against Out-of-Distribution Data [6.267143531261792]
画像データ中の未知物体を検出する新しい検出アルゴリズムを提案する。
モデルによって抽出された特徴に対する次元の呪いの影響を軽減するために、教師付き次元削減技術を利用する。
これは高解像度の特徴マップを用いて、教師なしの方法で潜在的に未知の物体を識別する。
論文 参考訳(メタデータ) (2024-11-07T10:15:25Z) - Revisiting Out-of-Distribution Detection in LiDAR-based 3D Object Detection [12.633311483061647]
アウト・オブ・ディストリビューション(OOD)オブジェクトは誤分類を引き起こし、自動車両の安全性と信頼性に重大なリスクをもたらす。
我々は、ポイントクラウドを変更することなく既存のデータセットを使用できる新しい評価プロトコルを提案する。
提案手法の有効性は,新たに提案したnuScenes OODベンチマークを用いて検証した。
論文 参考訳(メタデータ) (2024-04-24T13:48:38Z) - Sparse Semi-DETR: Sparse Learnable Queries for Semi-Supervised Object Detection [12.417754433715903]
Sparse Semi-DETRは、トランスフォーマーをベースとした、エンドツーエンドの半教師付きオブジェクト検出ソリューションである。
Sparse Semi-DETR には Query Refinement Module が組み込まれており、オブジェクトクエリの品質を高め、小型で部分的に隠されたオブジェクトの検出能力を著しく改善している。
MS-COCOおよびPascal VOCオブジェクト検出ベンチマークでは、Sparse Semi-DETRは現在の最先端手法よりも大幅に改善されている。
論文 参考訳(メタデータ) (2024-04-02T10:22:23Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - SalienDet: A Saliency-based Feature Enhancement Algorithm for Object
Detection for Autonomous Driving [160.57870373052577]
未知の物体を検出するために,サリエンデット法(SalienDet)を提案する。
我々のSaienDetは、オブジェクトの提案生成のための画像機能を強化するために、サリエンシに基づくアルゴリズムを利用している。
オープンワールド検出を実現するためのトレーニングサンプルセットにおいて、未知のオブジェクトをすべてのオブジェクトと区別するためのデータセットレザベリングアプローチを設計する。
論文 参考訳(メタデータ) (2023-05-11T16:19:44Z) - A Tri-Layer Plugin to Improve Occluded Detection [100.99802831241583]
本研究では,2段階物体検出装置の頭部検出のための単純な''モジュールを提案し,部分閉塞物体のリコールを改善する。
モジュールは、ターゲットオブジェクト、オクルーダー、オクラデーのセグメンテーションマスクの三層を予測し、それによってターゲットオブジェクトのマスクをより正確に予測することができる。
また,COCO評価データセットを構築し,部分閉塞オブジェクトと分離オブジェクトのリコール性能を測定した。
論文 参考訳(メタデータ) (2022-10-18T17:59:51Z) - SAFE: Sensitivity-Aware Features for Out-of-Distribution Object
Detection [10.306996649145464]
バッチ正規化による残差畳み込み層は感性認識機能(SAFE)を生じることを示す。
SAFEは、分布外検出と分布内検出を区別するために一貫して強力である。
検出対象毎にSAFEベクターを抽出し,サロゲートタスクで多層パーセプトロンを訓練し,クリーンな分布内例から逆摂動を識別する。
論文 参考訳(メタデータ) (2022-08-29T23:57:55Z) - Labels Are Not Perfect: Inferring Spatial Uncertainty in Object
Detection [26.008419879970365]
本研究では,生成モデルに基づいて,lidar point cloudのバウンディングボックスラベルの不確かさを推定する。
包括的実験により,提案モデルはライダー知覚とラベル品質の複雑な環境雑音を反映していることがわかった。
ラベルの不確実性を組み込んだ新しい評価指標としてJaccard IoUを提案する。
論文 参考訳(メタデータ) (2020-12-18T09:11:44Z) - SESS: Self-Ensembling Semi-Supervised 3D Object Detection [138.80825169240302]
具体的には、ラベルのない新しい未知のデータに基づくネットワークの一般化を促進するための、徹底的な摂動スキームを設計する。
我々のSESSは、50%のラベル付きデータを用いて、最先端の完全教師付き手法と比較して、競争性能を達成している。
論文 参考訳(メタデータ) (2019-12-26T08:48:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。