論文の概要: Prototype-Driven Adaptation for Few-Shot Object Detection
- arxiv url: http://arxiv.org/abs/2510.25318v1
- Date: Wed, 29 Oct 2025 09:32:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 15:50:45.376127
- Title: Prototype-Driven Adaptation for Few-Shot Object Detection
- Title(参考訳): Few-Shotオブジェクト検出のためのプロトタイプ駆動型適応
- Authors: Yushen Huang, Zhiming Wang,
- Abstract要約: Prototype-Driven Alignment (PDA)は、DeFRCN用の軽量なプラグインメトリックヘッドである。
PDAはサポートのみのプロトタイプを維持し、ミスマッチを減らすためにプロトタイプ条件のRoIアライメントを適用している。
FSOD と GFSOD のベンチマーク実験により、PDA はベースクラスと無視可能な計算オーバーヘッドに最小限の影響を伴って、新しいクラスのパフォーマンスを一貫して改善することが示された。
- 参考スコア(独自算出の注目度): 9.557416198772673
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Few-shot object detection (FSOD) often suffers from base-class bias and unstable calibration when only a few novel samples are available. We propose Prototype-Driven Alignment (PDA), a lightweight, plug-in metric head for DeFRCN that provides a prototype-based "second opinion" complementary to the linear classifier. PDA maintains support-only prototypes in a learnable identity-initialized projection space and optionally applies prototype-conditioned RoI alignment to reduce geometric mismatch. During fine-tuning, prototypes can be adapted via exponential moving average(EMA) updates on labeled foreground RoIs-without introducing class-specific parameters-and are frozen at inference to ensure strict protocol compliance. PDA employs a best-of-K matching scheme to capture intra-class multi-modality and temperature-scaled fusion to combine metric similarities with detector logits. Experiments on VOC FSOD and GFSOD benchmarks show that PDA consistently improves novel-class performance with minimal impact on base classes and negligible computational overhead.
- Abstract(参考訳): FSOD (Few-shot Object Detection) は、いくつかの新しいサンプルが利用可能となると、しばしばベースクラスの偏差と不安定な校正に悩まされる。
線形分類器を補完するプロトタイプベースの「第2の意見」を提供するDeFRCN用の軽量なプラグイン計量ヘッドであるPDAを提案する。
PDAは、学習可能なアイデンティティ初期化プロジェクション空間でサポートのみのプロトタイプを維持し、任意にプロトタイプ条件付きRoIアライメントを適用して幾何学的ミスマッチを低減する。
微調整中、プロトタイプはラベル付き前景RoIsの指数的な移動平均(EMA)更新によって適応できるが、クラス固有のパラメータを導入せずに、厳密なプロトコルコンプライアンスを保証するために推論時に凍結される。
PDAは、距離類似性と検出器ロジットを組み合わせるために、クラス内の多重モードと温度スケールの融合を捉えるために、ベスト・オブ・Kマッチング方式を採用している。
VOC FSOD と GFSOD のベンチマーク実験により、PDA はベースクラスと無視可能な計算オーバーヘッドに最小限の影響を伴って、新しいクラスのパフォーマンスを一貫して改善することが示された。
関連論文リスト
- Multi-Cache Enhanced Prototype Learning for Test-Time Generalization of Vision-Language Models [7.542207462593201]
ゼロショット設定では、テスト時間適応はテストフェーズからのラベルなしデータを用いて事前訓練されたモデルを調整し、未知のテスト分布の性能を向上させる。
本研究は,キャッシュ強化性能とクラス内コンパクト性との正の相関性を明らかにする。
3つのキャッシュを備えたマルチキャッシュ拡張プロトタイプベーステスト時間適応(MCP)を提案する。
論文 参考訳(メタデータ) (2025-08-02T06:43:43Z) - Probabilistic Prototype Calibration of Vision-Language Models for Generalized Few-shot Semantic Segmentation [75.18058114915327]
一般化されたFew-Shot Semanticnative(GFSS)は、いくつかの注釈付き例だけでセグメンテーションモデルを新しいクラスに拡張することを目的としている。
プリトレーニング済みCLIPのマルチモーダルプロトタイプ上での確率的プロトタイプ校正フレームワークであるFewCLIPを提案する。
FewCLIPはGFSSとクラスインクリメンタルセッティングの両方で最先端のアプローチを著しく上回っている。
論文 参考訳(メタデータ) (2025-06-28T18:36:22Z) - FastRef:Fast Prototype Refinement for Few-Shot Industrial Anomaly Detection [18.487111110151115]
FS-IAD (Few-shot Industrial Anomaly Detection) は, 自動検査システムにおいて重要な課題である。
本稿では,FS-IADのための新規かつ効率的なプロトタイプ改良フレームワークであるFastRefを提案する。
PatchCore、FastRecon、WinCLIP、AnomalyDINOの3つの競合するプロトタイプベースのFS-IADメソッドとFastRefを統合する。
論文 参考訳(メタデータ) (2025-06-26T15:46:28Z) - Demystifying Catastrophic Forgetting in Two-Stage Incremental Object Detector [42.40881712297689]
破滅的な忘れ物は主にRoIヘッドに局在している。
NSGP-RePREは2種類のプロトタイプのリプレイを通じて忘れを緩和する。
NSGP-RePREはPascal VOCおよびMS COCOデータセット上で最先端のパフォーマンスを達成する。
論文 参考訳(メタデータ) (2025-02-08T12:10:02Z) - PCoTTA: Continual Test-Time Adaptation for Multi-Task Point Cloud Understanding [40.42904797189929]
マルチタスクポイントクラウド理解におけるCoTTA(Continuous Test-Time Adaptation)の革新的フレームワークであるPCoTTAを提案する。
我々のPCoTTAは、自動プロトタイプ混合(APM)、ガウススプレート機能シフト(GSFS)、コントラストプロトタイプ反発(CPR)の3つの重要なコンポーネントで構成されています。
CPRは、最も近い学習可能なプロトタイプをテスト機能に近づけ、他のプロトタイプから切り離して、各プロトタイプを適応中に区別できるようにするために提案されている。
論文 参考訳(メタデータ) (2024-11-01T14:41:36Z) - Rethinking Few-shot 3D Point Cloud Semantic Segmentation [62.80639841429669]
本稿では,FS-PCSによる3Dポイント・クラウドセマンティックセマンティックセグメンテーションについて再検討する。
我々は、最先端の2つの重要な問題、前景の漏洩とスパースポイントの分布に焦点をあてる。
これらの問題に対処するために、新しいベンチマークを構築するための標準化されたFS-PCS設定を導入する。
論文 参考訳(メタデータ) (2024-03-01T15:14:47Z) - Decoupled Prototype Learning for Reliable Test-Time Adaptation [50.779896759106784]
テスト時間適応(TTA)は、推論中にトレーニング済みのソースモデルをターゲットドメインに継続的に適応させるタスクである。
1つの一般的なアプローチは、推定擬似ラベルによるクロスエントロピー損失を伴う微調整モデルである。
本研究は, 各試料の分類誤差を最小化することで, クロスエントロピー損失の脆弱性がラベルノイズを引き起こすことを明らかにした。
本稿では,プロトタイプ中心の損失計算を特徴とする新しいDPL法を提案する。
論文 参考訳(メタデータ) (2024-01-15T03:33:39Z) - UniPC: A Unified Predictor-Corrector Framework for Fast Sampling of
Diffusion Models [92.43617471204963]
拡散確率モデル(DPM)は高分解能画像合成において非常に有望な能力を示した。
我々は既存のDPMサンプリング器の後に適用可能な統一補正器(UniC)を開発し、精度を向上する。
そこで我々は,DPMの高速サンプリングのためのUniPCと呼ばれる統合予測器・相関器フレームワークを提案する。
論文 参考訳(メタデータ) (2023-02-09T18:59:48Z) - Contrastive Prototype Learning with Augmented Embeddings for Few-Shot
Learning [58.2091760793799]
拡張埋め込み(CPLAE)モデルを用いた新しいコントラスト型プロトタイプ学習を提案する。
クラスプロトタイプをアンカーとして、CPLは、同じクラスのクエリサンプルを、異なるクラスのサンプルを、さらに遠くに引き出すことを目的としている。
いくつかのベンチマークによる大規模な実験により,提案したCPLAEが新たな最先端を実現することが示された。
論文 参考訳(メタデータ) (2021-01-23T13:22:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。