論文の概要: DualMem: Bypassing the Objectness Bottleneck for Calibrated Unknown-Stream Filtering in Open-World Object Detection
- arxiv url: http://arxiv.org/abs/2605.23634v1
- Date: Fri, 22 May 2026 13:50:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-25 17:29:20.372059
- Title: DualMem: Bypassing the Objectness Bottleneck for Calibrated Unknown-Stream Filtering in Open-World Object Detection
- Title(参考訳): DualMem: オープンワールドオブジェクト検出における未知ストリームフィルタの校正のためのオブジェクトネスボタネックをバイパスする
- Authors: Yingjun Xiao, Xi Chen, Gang Fang, Siyuan Chen,
- Abstract要約: オープンワールドオブジェクト検出では、既知のクラスをローカライズすると同時に、将来的な漸進的な学習のために未知のオブジェクトを識別する必要がある。
強いOWOD検出器の未知の予測ストリームが大量に汚染されていることが判明した。
これは情報不足の問題ではなく、オブジェクト指向のヘッドにおける情報のボトルネックであることを示す。
- 参考スコア(独自算出の注目度): 7.854133517485534
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open-world object detection (OWOD) requires detectors to localize known classes while identifying unknown objects for future incremental learning. We find that the unknown prediction streams of strong OWOD detectors are heavily polluted: on M-OWODB, across PROB, OW-DETR, and HypOW, future-task positive unknowns make up less than 10% of unknown predictions, whereas background false positives account for 46-71%. We show that this is not a missing-information problem, but an information bottleneck at the objectness head. On PROB Task 1, a linear probe on the 256-D decoder query achieves an AUROC of 0.908 for positive-versus-negative unknown discrimination, but the final one-dimensional objectness scalar drops to 0.642. A frozen SigLIP feature, without access to the detector, independently recovers much of this proposal-level separability at the filtering stage (AUROC = 0.871). Motivated by this finding, we propose DualMem, a calibrated post-hoc filter that assumes a small image-disjoint annotated calibration split of held-out future-task objects and performs a non-parametric likelihood ratio test in frozen SigLIP feature space. DualMem uses a k-nearest-neighbor positive memory to protect future-task objects and a negative memory to suppress background-like proposals. Its decision threshold is chosen by Neyman-Pearson calibration, giving users an explicit trade-off between false-unknown suppression and novel recall. Across PROB, OW-DETR, and HypOW on M-OWODB Task 1, DualMem reduces background-type false unknown proposals per image by 44.9%-66.3%, with a mean reduction of 56.6%. On PROB Task 1, it more than doubles the reduction achieved by a natural K-means prototype baseline, while leaving known-class mAP unchanged because known detections bypass the filter.
- Abstract(参考訳): オープンワールドオブジェクト検出(OWOD)は、未知のオブジェクトを特定しながら、未知のクラスをローカライズするために検出器を必要とする。
M-OWODB, PROB, OW-DETR, HypOWでは, 将来のタスク正の未知が未知の予測の10%以下であるのに対して, 背景の偽陽性は46-71%である。
これは情報不足の問題ではなく、オブジェクト指向のヘッドにおける情報のボトルネックであることを示す。
PROB Task 1では、256-Dデコーダクエリ上の線形プローブが正逆負の未知の識別に対して0.908のAUROCを達成するが、最後の1次元のオブジェクトネススカラーは0.642に低下する。
凍結したSigLIPは検出器にアクセスせずに、フィルタ段階での提案レベルの分離性の多くを独立に回収する(AUROC = 0.871)。
この発見に触発されてDualMemを提案する。DualMemは、静止した将来のタスクオブジェクトの小さな画像分割アノテートキャリブレーション分割を仮定し、凍結したSigLIP特徴空間で非パラメトリック比検定を行う。
DualMemはk-nearest-neighborの正のメモリを使用して、将来のタスクオブジェクトと負のメモリを保護し、バックグラウンドのような提案を抑える。
決定しきい値はNeyman-Pearsonキャリブレーションによって選択され、偽未知の抑圧と新規リコールの間に明確なトレードオフが与えられる。
Across PROB, OW-DETR, HypOW on M-OWODB Task 1 DualMemは画像毎の背景型未知の提案を44.9%-66.3%削減し、平均56.6%削減した。
PROB Task 1では、既知の検出がフィルタをバイパスするため、既知のクラスmAPをそのまま残しながら、自然なK平均のプロトタイプベースラインによって達成された削減を2倍以上にします。
関連論文リスト
- Revisiting Out-of-Distribution Detection in Real-time Object Detection: From Benchmark Pitfalls to a New Mitigation Paradigm [8.206992765692535]
アウト・オブ・ディストリビューション(OoD)入力はディープラーニングモデルに永続的な課題をもたらす。
この研究は、物体検出におけるOoD検出の2つの見落としられた次元に対処する。
外部OoD検出器とは独立に動作する新しい訓練時間緩和パラダイムを導入する。
論文 参考訳(メタデータ) (2025-03-10T13:42:41Z) - Towards Robust IoT Defense: Comparative Statistics of Attack Detection in Resource-Constrained Scenarios [1.3812010983144802]
リソースの制約は、IoTスマートデバイスに重大なサイバーセキュリティの脅威をもたらす。
我々は、資源制約下でのサイバー攻撃検出アルゴリズムの広範な統計的解析を行い、最も効率的なものを特定する。
論文 参考訳(メタデータ) (2024-10-10T10:58:03Z) - Boosting Few-Shot Open-Set Object Detection via Prompt Learning and Robust Decision Boundary [10.054397736100245]
FOOD(Open-set Object Detection)は、多くのオープンワールドシナリオにおいて課題となる。
訓練サンプルが不足している未知の物体を拒絶しながら、既知の物体を検出するためにオープンセット検出器を訓練することを目的としている。
本手法は,従来の最先端手法よりも優れた性能を実現する。
論文 参考訳(メタデータ) (2024-06-26T15:48:24Z) - Semi-supervised Open-World Object Detection [74.95267079505145]
半教師付きオープンワールド検出(SS-OWOD)という,より現実的な定式化を導入する。
提案したSS-OWOD設定では,最先端OWOD検出器の性能が劇的に低下することが実証された。
我々は,MS COCO, PASCAL, Objects365, DOTAの4つのデータセットを用いた実験を行い, 提案手法の有効性を実証した。
論文 参考訳(メタデータ) (2024-02-25T07:12:51Z) - PETDet: Proposal Enhancement for Two-Stage Fine-Grained Object Detection [26.843891792018447]
PETDet (Proposal Enhancement for Two-stage fine-fine object detection) は, 2段階FGOD法において, サブタスクをよりよく扱うために提案される。
動的ラベル割り当てと注意に基づく分解により, アンカーフリー品質指向提案ネットワーク(QOPN)を提案する。
A novel Adaptive Recognition Loss (ARL)は、R-CNNの責任者が高品質な提案に焦点を合わせるためのガイダンスを提供する。
論文 参考訳(メタデータ) (2023-12-16T18:04:56Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - USD: Unknown Sensitive Detector Empowered by Decoupled Objectness and
Segment Anything Model [14.080744645704751]
Open World Object Detection (OWOD) は、新しいコンピュータビジョンタスクである。
本稿では,この2つの境界の学習をデコーダ層に分割する,シンプルで効果的な学習戦略であるDecoupled Objectness Learning(DOL)を提案する。
また、擬似ラベルとソフトウェイト戦略を用いてノイズの負の影響を緩和する補助的スーパービジョンフレームワーク(ASF)も導入する。
論文 参考訳(メタデータ) (2023-06-04T06:42:09Z) - DetectGPT: Zero-Shot Machine-Generated Text Detection using Probability
Curvature [143.5381108333212]
大規模な言語モデルからサンプリングされたテキストは、モデルのログ確率関数の負の曲率領域を占有する傾向にあることを示す。
次に、与えられたLLMから通路が生成されるかどうかを判断するための新しい曲率ベースの基準を定義する。
我々は、モデルサンプル検出のための既存のゼロショット法よりもディテクターGPTの方が識別性が高いことを発見した。
論文 参考訳(メタデータ) (2023-01-26T18:44:06Z) - A Large-scale Multiple-objective Method for Black-box Attack against
Object Detection [70.00150794625053]
我々は、真正の確率を最小化し、偽正の確率を最大化し、より多くの偽正の物体が新しい真正の有界箱を作らないようにする。
我々は、GARSDCと呼ばれるランダム・サブセット選択とディバイド・アンド・コンカーによる標準的な遺伝的アルゴリズムを拡張し、効率を大幅に改善する。
最先端攻撃法と比較して、GARSDCはmAPでは平均12.0、広範囲な実験ではクエリでは約1000倍減少する。
論文 参考訳(メタデータ) (2022-09-16T08:36:42Z) - CertainNet: Sampling-free Uncertainty Estimation for Object Detection [65.28989536741658]
ニューラルネットワークの不確実性を推定することは、安全クリティカルな設定において基本的な役割を果たす。
本研究では,オブジェクト検出のための新しいサンプリング不要不確実性推定法を提案する。
私たちはそれをCertainNetと呼び、各出力信号に対して、オブジェクト性、クラス、位置、サイズという、別の不確実性を提供するのは、これが初めてです。
論文 参考訳(メタデータ) (2021-10-04T17:59:31Z) - FOVEA: Foveated Image Magnification for Autonomous Navigation [53.69803081925454]
入力キャンバスを小さく保ちながら、ある領域を弾性的に拡大する注意的アプローチを提案する。
提案手法は,高速R-CNNより高速かつ微調整の少ない検出APを高速化する。
Argoverse-HD と BDD100K の自律走行データセットでは,提案手法が標準の高速 R-CNN を超越した検出APを微調整なしで促進することを示す。
論文 参考訳(メタデータ) (2021-08-27T03:07:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。