論文の概要: Query-based Hard-Image Retrieval for Object Detection at Test Time
- arxiv url: http://arxiv.org/abs/2209.11559v1
- Date: Fri, 23 Sep 2022 12:33:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-26 13:45:16.780959
- Title: Query-based Hard-Image Retrieval for Object Detection at Test Time
- Title(参考訳): テスト時の物体検出のためのクエリベースハードイメージ検索
- Authors: Edward Ayers, Jonathan Sadeghi, John Redford, Romain Mueller, Puneet
K. Dokania
- Abstract要約: 問合せに基づくハードイメージ検索タスクとして「ハード」な画像を見つけるという問題を再考する。
我々の手法は完全にポストホックであり、地平線アノテーションは必要とせず、効率的なモンテカルロ推定に依存している。
我々は、広く使われているRetinaNet、Faster-RCNN、Mask-RCNN、Cascade Mask-RCNNオブジェクト検出器を用いて、ランキングと分類タスクの結果を提供する。
- 参考スコア(独自算出の注目度): 10.63460618121976
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: There is a longstanding interest in capturing the error behaviour of object
detectors by finding images where their performance is likely to be
unsatisfactory. In real-world applications such as autonomous driving, it is
also crucial to characterise potential failures beyond simple requirements of
detection performance. For example, a missed detection of a pedestrian close to
an ego vehicle will generally require closer inspection than a missed detection
of a car in the distance. The problem of predicting such potential failures at
test time has largely been overlooked in the literature and conventional
approaches based on detection uncertainty fall short in that they are agnostic
to such fine-grained characterisation of errors. In this work, we propose to
reformulate the problem of finding "hard" images as a query-based hard image
retrieval task, where queries are specific definitions of "hardness", and offer
a simple and intuitive method that can solve this task for a large family of
queries. Our method is entirely post-hoc, does not require ground-truth
annotations, is independent of the choice of a detector, and relies on an
efficient Monte Carlo estimation that uses a simple stochastic model in place
of the ground-truth. We show experimentally that it can be applied successfully
to a wide variety of queries for which it can reliably identify hard images for
a given detector without any labelled data. We provide results on ranking and
classification tasks using the widely used RetinaNet, Faster-RCNN, Mask-RCNN,
and Cascade Mask-RCNN object detectors.
- Abstract(参考訳): オブジェクト検出器の性能が不十分な画像を見つけることで、オブジェクト検出器のエラー挙動を捉えたいという長年の関心がある。
自動運転のような現実世界のアプリケーションでは、検出性能の単純な要件を超えて潜在的な障害を特徴付けることも重要である。
例えば、エゴ車に近い歩行者の発見に失敗した場合、一般的には距離を逸した車両の発見よりも近い検査が必要となる。
このような潜在的な障害をテスト時に予測する問題は、検出の不確実性に基づく文献や従来の手法では、そのようなきめ細かいエラーの特徴化に非依存であるため、ほとんど見過ごされてきた。
そこで本研究では,問合せが「ハードネス」の特定の定義である問合せベースのハード画像検索タスクとして「ハード」画像を見つける問題を再検討し,この課題を大規模な問合せに対して解決できる簡易かつ直感的な方法を提案する。
提案手法は完全にポストホックであり,地平線アノテーションを必要とせず,検出器の選択に依存せず,地平線の代わりに単純な確率モデルを用いた効率的なモンテカルロ推定に依存する。
ラベル付きデータなしで特定の検出器の硬い画像を確実に識別する多種多様なクエリに有効に適用できることを実験的に示す。
我々は、広く使われているRetinaNet、Faster-RCNN、Mask-RCNN、Cascade Mask-RCNNオブジェクト検出器を用いて、ランキングと分類タスクの結果を提供する。
関連論文リスト
- Open-Set Semantic Uncertainty Aware Metric-Semantic Graph Matching [10.439907158831303]
オープンセットオブジェクト検出のためのセマンティック不確実性のメトリクスを計算し、オブジェクトレベルの不確実性追跡フレームワークに組み込む。
提案手法は,頑健でオープンセット,マルチオブジェクト,セマンティック不確実性を考慮したループクロージャ検出のために,海洋環境におけるリアルタイムな使用を可能にする。
論文 参考訳(メタデータ) (2024-09-17T20:53:47Z) - Towards Building Self-Aware Object Detectors via Reliable Uncertainty
Quantification and Calibration [17.461451218469062]
本稿では,自己認識オブジェクト検出(SAOD)タスクを紹介する。
SAODタスクは、自律運転のような安全クリティカルな環境でオブジェクト検出器が直面する課題を尊重し、遵守する。
我々は、多数のオブジェクト検出器をテストするために、新しいメトリクスと大規模なテストデータセットを導入したフレームワークを広範囲に使用しています。
論文 参考訳(メタデータ) (2023-07-03T11:16:39Z) - Semi-Supervised and Long-Tailed Object Detection with CascadeMatch [91.86787064083012]
そこで我々はCascadeMatchと呼ばれる新しい擬似ラベル型検出器を提案する。
我々の検出器は、プログレッシブな信頼しきい値を持つ多段検出ヘッドを備えたカスケードネットワークアーキテクチャを備えている。
CascadeMatchは、長い尾のオブジェクト検出の処理において、既存の最先端の半教師付きアプローチを超越していることを示す。
論文 参考訳(メタデータ) (2023-05-24T07:09:25Z) - SalienDet: A Saliency-based Feature Enhancement Algorithm for Object
Detection for Autonomous Driving [160.57870373052577]
未知の物体を検出するために,サリエンデット法(SalienDet)を提案する。
我々のSaienDetは、オブジェクトの提案生成のための画像機能を強化するために、サリエンシに基づくアルゴリズムを利用している。
オープンワールド検出を実現するためのトレーニングサンプルセットにおいて、未知のオブジェクトをすべてのオブジェクトと区別するためのデータセットレザベリングアプローチを設計する。
論文 参考訳(メタデータ) (2023-05-11T16:19:44Z) - Generalized Few-Shot 3D Object Detection of LiDAR Point Cloud for
Autonomous Driving [91.39625612027386]
我々は,一般的な(ベース)オブジェクトに対して大量のトレーニングデータを持つが,レア(ノーベル)クラスに対してはごく少数のデータしか持たない,一般化された数発の3Dオブジェクト検出という新しいタスクを提案する。
具体的には、画像と点雲の奥行きの違いを分析し、3D LiDARデータセットにおける少数ショット設定の実践的原理を示す。
この課題を解決するために,既存の3次元検出モデルを拡張し,一般的なオブジェクトと稀なオブジェクトの両方を認識するためのインクリメンタルな微調整手法を提案する。
論文 参考訳(メタデータ) (2023-02-08T07:11:36Z) - Towards Hard-Positive Query Mining for DETR-based Human-Object
Interaction Detection [20.809479387186506]
ヒューマンオブジェクトインタラクション(HOI)検出は、高レベル画像理解のコアタスクである。
本稿では、ハード陽性クエリをマイニングすることで、検出変換器(DETR)ベースのHOI検出器を強化することを提案する。
実験の結果,提案手法は既存のDETRベースのHOI検出器に広く適用可能であることがわかった。
論文 参考訳(メタデータ) (2022-07-12T04:03:12Z) - Reference-based Defect Detection Network [57.89399576743665]
最初の問題はテクスチャシフトであり、これはトレーニングされた欠陥検出モデルが目に見えないテクスチャの影響を受けやすいことを意味する。
第2の問題は部分的な視覚的混乱であり、部分的な欠陥ボックスが完全なボックスと視覚的に類似していることを示している。
本稿では,これら2つの問題に対処する参照型欠陥検出ネットワーク(RDDN)を提案する。
論文 参考訳(メタデータ) (2021-08-10T05:44:23Z) - Dynamic Relevance Learning for Few-Shot Object Detection [6.550840743803705]
動的グラフ畳み込みネットワーク(GCN)を構築するために,すべてのサポート画像とクエリ画像上の関心領域(RoI)の関係を利用した動的関連学習モデルを提案する。
提案モデルでは,より一般化された特徴の学習の有効性を示す総合的な性能が得られた。
論文 参考訳(メタデータ) (2021-08-04T18:29:42Z) - AutoOD: Automated Outlier Detection via Curiosity-guided Search and
Self-imitation Learning [72.99415402575886]
外乱検出は重要なデータマイニングの課題であり、多くの実用的応用がある。
本稿では,最適なニューラルネットワークモデルを探すことを目的とした自動外乱検出フレームワークであるAutoODを提案する。
さまざまな実世界のベンチマークデータセットに対する実験結果から、AutoODが特定したディープモデルが最高のパフォーマンスを達成することが示された。
論文 参考訳(メタデータ) (2020-06-19T18:57:51Z) - FairMOT: On the Fairness of Detection and Re-Identification in Multiple
Object Tracking [92.48078680697311]
マルチオブジェクトトラッキング(MOT)はコンピュータビジョンにおいて重要な問題である。
本稿では,FairMOTと呼ばれる,アンカーフリーなオブジェクト検出アーキテクチャCenterNetをベースとした,シンプルかつ効果的なアプローチを提案する。
このアプローチは、検出と追跡の両方において高い精度を達成する。
論文 参考訳(メタデータ) (2020-04-04T08:18:00Z) - Anomaly Detection by One Class Latent Regularized Networks [36.67420338535258]
近年,GANに基づく半教師付きジェネレーティブ・アドバイザリアル・ネットワーク(GAN)手法が,異常検出タスクで人気を集めている。
遅延特徴空間でトレーニングデータの基盤となる構造を捕捉する新しい対角デュアルオートエンコーダネットワークを提案する。
実験の結果,MNISTおよびCIFAR10データセットおよびGTSRB停止信号データセットの最先端結果が得られた。
論文 参考訳(メタデータ) (2020-02-05T02:21:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。