論文の概要: BEM: Training-Free Background Embedding Memory for False-Positive Suppression in Real-Time Fixed-Background Camera
- arxiv url: http://arxiv.org/abs/2604.11714v1
- Date: Mon, 13 Apr 2026 16:50:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-14 20:13:16.695774
- Title: BEM: Training-Free Background Embedding Memory for False-Positive Suppression in Real-Time Fixed-Background Camera
- Title(参考訳): BEM:False-Positive Suppressionのための訓練不要バックグラウンド埋め込みメモリ
- Authors: Junwoo Park, Jangho Lee, Sunho Lim,
- Abstract要約: COCOライクなベンチマークは、インスタンス密度よりもカテゴリの多様性を強調しており、クラスごとの間隔で訓練された検出器は、密度の高いシングルクラスまたは少数クラスのシーンで苦労する。
提案するバックグラウンド埋め込みメモリ(BEM, background Embedding Memory)は,事前学習した検知器に推論時にアタッチ可能な軽量でトレーニング不要で軽量なモジュールである。
- 参考スコア(独自算出の注目度): 2.2721664313694205
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Pretrained detectors perform well on benchmarks but often suffer performance degradation in real-world deployments due to distribution gaps between training data and target environments. COCO-like benchmarks emphasize category diversity rather than instance density, causing detectors trained under per-class sparsity to struggle in dense, single- or few-class scenes such as surveillance and traffic monitoring. In fixed-camera environments, the quasi-static background provides a stable, label-free prior that can be exploited at inference to suppress spurious detections. To address the issue, we propose Background Embedding Memory (BEM), a lightweight, training-free, weight-frozen module that can be attached to pretrained detectors during inference. BEM estimates clean background embeddings, maintains a prototype memory, and re-scores detection logits with an inverse-similarity, rank-weighted penalty, effectively reducing false positives while maintaining recall. Empirically, background-frame cosine similarity correlates negatively with object count and positively with Precision-Confidence AUC (P-AUC), motivating its use as a training-free control signal. Across YOLO and RT-DETR families on LLVIP and simulated surveillance streams, BEM consistently reduces false positives while preserving real-time performance. Our code is available at https://github.com/Leo-Park1214/Background-Embedding-Memory.git
- Abstract(参考訳): 事前訓練された検出器は、ベンチマークでよく機能するが、トレーニングデータとターゲット環境の間の分散ギャップにより、実世界のデプロイでパフォーマンスが低下することが多い。
COCOライクなベンチマークは、インスタンス密度よりもカテゴリの多様性を強調しており、クラスごとの間隔で訓練された検出器は、監視や交通監視といった、密集したシングルクラスまたは少数クラスのシーンで苦労する。
固定カメラ環境では、準静的な背景は安定なラベルなしの事前を提供し、推論時に利用でき、急激な検出を抑えることができる。
この問題に対処するため,BEM(Background Embedding Memory)を提案する。
BEMはクリーンなバックグラウンド埋め込みを推定し、プロトタイプメモリを維持し、逆相似でランク重み付きペナルティで検出ロジットを再スコアし、リコールを維持しながら偽陽性を効果的に低減する。
経験的に、背景フレームのコサイン類似性は、対象数と負の相関を持ち、精度信頼AUC(P-AUC)と正の相関を持ち、トレーニング不要な制御信号としての使用を動機付けている。
LLVIPおよびシミュレートされた監視ストリーム上のYOLOおよびRT-DETRファミリー全体で、BEMは、リアルタイムのパフォーマンスを維持しながら、常に偽陽性を減らす。
私たちのコードはhttps://github.com/Leo-Park1214/Background-Embedding-Memory.gitで利用可能です。
関連論文リスト
- G-Drift MIA: Membership Inference via Gradient-Induced Feature Drift in LLMs [1.8986796884429726]
メンバーシップ推論攻撃(MIA)は、トレーニング中に特定の例が使用されたかどうかを判断することを目的としている。
G-Drift MIAは,勾配誘起特徴量ドリフトに基づくホワイトボックスメンバシップ推論手法である。
G-Driftは信頼性ベース、パープレキシティベース、参照ベースアタックを大きく上回る。
論文 参考訳(メタデータ) (2026-04-01T03:01:27Z) - PPEDCRF: Privacy-Preserving Enhanced Dynamic CRF for Location-Privacy Protection for Sequence Videos with Minimal Detection Degradation [7.329775099113131]
本稿では,バックグラウンドベース検索攻撃下での位置情報プライバシリークについて検討する。
プライバシ保護型条件付きランダムフィールドフレームワークであるPEDCRFを提案する。
公共運転データセットの実験では、PPEDCRFが位置検索攻撃の成功を著しく減少させることが示された。
論文 参考訳(メタデータ) (2026-03-02T08:18:53Z) - LeakBoost: Perceptual-Loss-Based Membership Inference Attack [4.82560917771631]
LeakBoostは知覚的ロスに基づく尋問フレームワークで、モデルの内部表現を積極的に調査して、隠されたメンバシップ信号を公開する。
LeakBoostは、複数の画像分類データセットと多様なニューラルネットワークアーキテクチャで、低い偽陽性率で大幅に改善されている。
論文 参考訳(メタデータ) (2026-02-05T15:15:35Z) - STAMP: Outlier-Aware Test-Time Adaptation with Stable Memory Replay [76.06127233986663]
テスト時間適応(TTA)は、トレーニングデータとテストデータの間の分散シフトに、未ラベルのデータのみを用いて対処することを目的としている。
本稿では,サンプル認識とオフリエ拒絶の両方を行う問題に注意を払っている。
本稿では,STAble Memory rePlay (STAMP) と呼ばれる新しい手法を提案する。
論文 参考訳(メタデータ) (2024-07-22T16:25:41Z) - RTracker: Recoverable Tracking via PN Tree Structured Memory [71.05904715104411]
本稿では,木構造メモリを用いてトラッカーと検出器を動的に関連付け,自己回復を可能にするRTrackerを提案する。
具体的には,正負と負のターゲットサンプルを時系列に保存し,維持する正負のツリー構造メモリを提案する。
我々の中核となる考え方は、正と負の目標カテゴリーの支持サンプルを用いて、目標損失の信頼性評価のための相対的距離に基づく基準を確立することである。
論文 参考訳(メタデータ) (2024-03-28T08:54:40Z) - Improving Adversarial Robustness of Masked Autoencoders via Test-time
Frequency-domain Prompting [133.55037976429088]
BERTプリトレーニング(BEiT, MAE)を備えた視覚変換器の対向ロバスト性について検討する。
意外な観察は、MAEが他のBERT事前訓練法よりも敵の頑健さが著しく悪いことである。
我々は,MAEの対角的堅牢性を高めるための,シンプルで効果的な方法を提案する。
論文 参考訳(メタデータ) (2023-08-20T16:27:17Z) - Cascaded Regression Tracking: Towards Online Hard Distractor
Discrimination [202.2562153608092]
本稿では,2段階の逐次回帰トラッカーを提案する。
第1段階では, 容易に同定可能な負の候補を抽出する。
第2段階では、残留するあいまいな硬質試料をダブルチェックするために、離散サンプリングに基づくリッジ回帰を設計する。
論文 参考訳(メタデータ) (2020-06-18T07:48:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。