Fugu-MT 論文翻訳(概要): Decoupled Prototype Matching with Vision Foundation Models for Few-Shot Industrial Object Detection

論文の概要: Decoupled Prototype Matching with Vision Foundation Models for Few-Shot Industrial Object Detection

arxiv url: http://arxiv.org/abs/2604.26404v1
Date: Wed, 29 Apr 2026 08:16:01 GMT
ステータス: 翻訳完了
システム内更新日: 2026-04-30 15:59:36.308023
Title: Decoupled Prototype Matching with Vision Foundation Models for Few-Shot Industrial Object Detection
Title（参考訳）: ファウショット産業オブジェクト検出のための視覚基礎モデルとの分離型プロトタイプマッチング
Authors: Hari Prasanth S. M., Nilusha Jayawickrama, Risto Ojala,
Abstract要約: 視覚基盤モデルを利用して最小限の監視で物体を認識できる検出フレームワークを提案する。特徴表現を抽出することにより、参照サンプルの小さなセットからクラスプロトタイプを構築する。我々は、最先端のトレーニング不要検出法と比較してAPを6.9%向上させる競合検出性能を実証した。
参考スコア（独自算出の注目度）: 0.6474217812459662
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Industrial object detection systems typically rely on large annotated datasets, which are expensive to collect and challenging to maintain in industrial scenarios where the inventory of objects changes frequently. This work addresses the challenge of few-shot object detection in such industrial scenarios, where only a limited number of labeled samples are available for newly introduced objects. We present a detection framework that leverages vision foundation models to recognize objects with minimal supervision. The method constructs class prototypes from a small set of reference samples by extracting feature representations. For a given query scene during inference, object regions are generated using a segmentation model, and feature embeddings are extracted and matched with class prototypes using similarity matching. We evaluate the detection method on three established industrial datasets from the Benchmark for 6D Object Pose Estimation benchmark following the official 2D object detection evaluation protocol. We demonstrate competitive detection performance, improving AP by 6.9% compared to the state-of-the-art training-free detection methods. Furthermore, the presented method is able to onboard new objects using only a few reference images, without requiring any CAD models or large annotated datasets. These properties make the approach well-suited for real-world industrial applications.
Abstract（参考訳）: 産業オブジェクト検出システムは一般的に大きな注釈付きデータセットに依存しており、収集には高価であり、頻繁にオブジェクトの在庫が変化する産業シナリオでは維持が困難である。この研究は、新しく導入されたオブジェクトに対して限られた数のラベル付きサンプルしか利用できない、そのような産業シナリオにおける、数発のオブジェクト検出の課題に対処する。視覚基盤モデルを利用して最小限の監視で物体を認識できる検出フレームワークを提案する。特徴表現を抽出することにより、参照サンプルの小さなセットからクラスプロトタイプを構築する。推論中に与えられたクエリシーンに対して、セグメンテーションモデルを用いてオブジェクト領域を生成し、類似性マッチングを用いて特徴埋め込みを抽出し、クラスプロトタイプとマッチングする。我々は,公式な2次元オブジェクト検出評価プロトコルに従って,Benchmark for 6D Object Pose Estimationベンチマークから確立された3つの産業用データセットに対する検出方法を評価する。我々は、最先端のトレーニング不要検出法と比較してAPを6.9%向上させる競合検出性能を実証した。さらに,CADモデルや大規模な注釈付きデータセットを必要とせずに,少数の参照画像のみを用いて新しいオブジェクトをオンボードすることができる。これらの性質は、実世界の産業用途に適している。

関連論文リスト

Few-Shot Pattern Detection via Template Matching and Regression [52.79291493477272]
本稿では,テンプレートマッチングと回帰に基づく簡易かつ効果的な検出器TMRを提案する。凍結したバックボーンの上に少数の学習可能な畳み込み層や投射層を持つ最小限の構造を通して、経験者の空間的レイアウトを効果的に保存し、活用する。提案手法は, RPINE, FSCD-147, FSCD-LVISの3つのベンチマークにおける最先端手法よりも優れ, クロスデータセット評価において強い一般化を示す。
論文参考訳（メタデータ） (2025-08-25T03:52:42Z)
Bayesian Detector Combination for Object Detection with Crowdsourced Annotations [49.43709660948812]
制約のない画像できめ細かなオブジェクト検出アノテーションを取得するのは、時間がかかり、コストがかかり、ノイズに悩まされる。ノイズの多いクラウドソースアノテーションでオブジェクト検出をより効果的に訓練するための新しいベイズ検出結合(BDC)フレームワークを提案する。 BDCはモデルに依存しず、アノテータのスキルレベルに関する事前の知識を必要とせず、既存のオブジェクト検出モデルとシームレスに統合される。
論文参考訳（メタデータ） (2024-07-10T18:00:54Z)
Exploring Robust Features for Few-Shot Object Detection in Satellite Imagery [17.156864650143678]
従来の2段階アーキテクチャに基づく数発の物体検出器を開発した。大規模な事前訓練モデルを使用して、クラス参照の埋め込みやプロトタイプを構築する。課題と稀なオブジェクトを含む2つのリモートセンシングデータセットの評価を行う。
論文参考訳（メタデータ） (2024-03-08T15:20:27Z)
Open World Object Detection in the Era of Foundation Models [53.683963161370585]
5つの実世界のアプリケーション駆動データセットを含む新しいベンチマークを導入する。本稿では,オープンワールドのための新しいオブジェクト検出モデル(FOMO)を提案する。
論文参考訳（メタデータ） (2023-12-10T03:56:06Z)
PatchContrast: Self-Supervised Pre-training for 3D Object Detection [14.493213289990962]
PatchContrastは、3Dオブジェクト検出のための新しい自己教師付きポイントクラウド事前学習フレームワークである。提案手法は,3つの一般的な3次元検出データセットにおいて,既存の最先端モデルよりも優れていることを示す。
論文参考訳（メタデータ） (2023-08-14T07:45:54Z)
Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文参考訳（メタデータ） (2023-07-07T04:03:48Z)
D\'etection d'Objets dans les documents num\'eris\'es par r\'eseaux de neurones profonds [0.0]
本研究では,テキスト行の検出,動作分割,筆記支援など,文書レイアウト解析に関連する複数のタスクについて検討する。 2つの異なるアプローチに従う2つのディープニューラルネットワークモデルを提案する。
論文参考訳（メタデータ） (2023-01-27T14:45:45Z)
Slender Object Detection: Diagnoses and Improvements [74.40792217534]
本稿では,超高アスペクト比,すなわちtextbfslender オブジェクトの特定タイプの検出について検討する。古典的物体検出法では、細い物体に対してのみ評価される場合、COCO上の18.9%のmAPの劇的な低下が観察される。
論文参考訳（メタデータ） (2020-11-17T09:39:42Z)
Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文参考訳（メタデータ） (2020-10-19T12:36:11Z)
Few-shot Object Detection on Remote Sensing Images [11.40135025181393]
リモートセンシング画像におけるオブジェクト検出のための数ショットの学習手法を提案する。我々は、YOLOv3アーキテクチャに基づいて、少数ショットオブジェクト検出モデルを構築し、マルチスケールオブジェクト検出フレームワークを開発する。
論文参考訳（メタデータ） (2020-06-14T07:18:10Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。