論文の概要: Few-shot Object Counting and Detection
- arxiv url: http://arxiv.org/abs/2207.10988v1
- Date: Fri, 22 Jul 2022 10:09:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-25 13:07:29.504335
- Title: Few-shot Object Counting and Detection
- Title(参考訳): 少数ショット物体の計数と検出
- Authors: Thanh Nguyen, Chau Pham, Khoi Nguyen, Minh Hoai
- Abstract要約: 我々は、ターゲットオブジェクトクラスのいくつかの例のバウンディングボックスを考慮に入れ、ターゲットクラスのすべてのオブジェクトをカウントし、検出する新しいタスクに取り組む。
このタスクは、数ショットのオブジェクトカウントと同じ監督を共有しますが、オブジェクトのバウンディングボックスと総オブジェクトカウントを出力します。
本稿では,新しい2段階トレーニング戦略と,新しい不確実性に留意した小ショットオブジェクト検出器であるCounting-DETRを紹介する。
- 参考スコア(独自算出の注目度): 25.61294147822642
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We tackle a new task of few-shot object counting and detection. Given a few
exemplar bounding boxes of a target object class, we seek to count and detect
all objects of the target class. This task shares the same supervision as the
few-shot object counting but additionally outputs the object bounding boxes
along with the total object count. To address this challenging problem, we
introduce a novel two-stage training strategy and a novel uncertainty-aware
few-shot object detector: Counting-DETR. The former is aimed at generating
pseudo ground-truth bounding boxes to train the latter. The latter leverages
the pseudo ground-truth provided by the former but takes the necessary steps to
account for the imperfection of pseudo ground-truth. To validate the
performance of our method on the new task, we introduce two new datasets named
FSCD-147 and FSCD-LVIS. Both datasets contain images with complex scenes,
multiple object classes per image, and a huge variation in object shapes,
sizes, and appearance. Our proposed approach outperforms very strong baselines
adapted from few-shot object counting and few-shot object detection with a
large margin in both counting and detection metrics. The code and models are
available at \url{https://github.com/VinAIResearch/Counting-DETR}.
- Abstract(参考訳): 我々は、少数のオブジェクトのカウントと検出という新しいタスクに取り組む。
対象のオブジェクトクラスのいくつかの典型的なバウンディングボックスを考えると、ターゲットのクラスのすべてのオブジェクトをカウントして検出しようとします。
このタスクは、少数ショットオブジェクトカウントと同じ監督を共有し、さらにオブジェクトバウンディングボックスと合計オブジェクトカウントを出力します。
この課題に対処するために、新しい2段階トレーニング戦略と、新しい不確実性を認識した複数ショットオブジェクト検出器、Counting-DETRを導入する。
前者は、後者を訓練するための擬似接地箱を作成することを目的としている。
後者は、前者が提供した擬似的地中真理を利用するが、擬似的地中真理の不完全性を考慮するために必要なステップを踏む。
提案手法の有効性を検証するため,FSCD-147とFSCD-LVISという2つの新しいデータセットを導入した。
どちらのデータセットも複雑なシーン、画像ごとに複数のオブジェクトクラス、オブジェクトの形状、サイズ、外観に大きなバリエーションがある。
提案手法は,少数ショットのオブジェクトカウントと少数ショットのオブジェクト検出に適応した強力なベースラインに優れ,測定値と検出値の両方に大きな差がある。
コードとモデルは \url{https://github.com/vinairesearch/counting-detr} で入手できる。
関連論文リスト
- A Novel Unified Architecture for Low-Shot Counting by Detection and Segmentation [10.461109095311546]
ローショットオブジェクトカウンタは、注釈付き例題をほとんどあるいは全く使用せずに画像内のオブジェクト数を推定する。
既存のアプローチは、しばしば過一般化と偽陽性検出につながる。
本稿では,オブジェクト検出,セグメンテーション,カウント推定を行う新しいローショットカウンタであるGeCoを紹介する。
論文 参考訳(メタデータ) (2024-09-27T12:20:29Z) - Few-shot Oriented Object Detection with Memorable Contrastive Learning in Remote Sensing Images [11.217630579076237]
リモートセンシングの分野では、FSOD(Few-shot Object Detection)が注目されている。
本稿では,Few-shot Oriented Object Detection with Memorable Contrastive Learning (FOMC) という,リモートセンシングのための新しいFSOD法を提案する。
具体的には、従来の水平有界ボックスの代わりに指向的有界ボックスを用いて、任意指向の空中オブジェクトのより優れた特徴表現を学習する。
論文 参考訳(メタデータ) (2024-03-20T08:15:18Z) - Few-shot Object Detection in Remote Sensing: Lifting the Curse of
Incompletely Annotated Novel Objects [23.171410277239534]
物体検出のための自己学習型FSOD (ST-FSOD) アプローチを提案する。
提案手法は,様々なFSOD設定における最先端性能を大きなマージンで向上させる。
論文 参考訳(メタデータ) (2023-09-19T13:00:25Z) - Object-Centric Multiple Object Tracking [124.30650395969126]
本稿では,多目的追跡パイプラインのためのビデオオブジェクト中心モデルを提案する。
オブジェクト中心のスロットを検出出力に適応するインデックスマージモジュールと、オブジェクトメモリモジュールで構成される。
オブジェクト中心学習に特化して、オブジェクトのローカライゼーションと機能バインディングのためのスパース検出ラベルしか必要としない。
論文 参考訳(メタデータ) (2023-09-01T03:34:12Z) - Beyond SOT: Tracking Multiple Generic Objects at Once [141.36900362724975]
ジェネリックオブジェクト追跡(ジェネリックオブジェクト追跡、英: Generic Object Tracking、GOT)は、ビデオの最初のフレームでボックスをバウンディングすることによって指定されたターゲットオブジェクトを追跡する問題である。
大規模GOTベンチマークであるLaGOTを導入し,複数のアノテート対象オブジェクトをシーケンス毎に含む。
提案手法は単一オブジェクトのGOTデータセットに対して高い競合性を実現し,TrackingNet上での新たな技術状態が84.4%の成功率で設定されている。
論文 参考訳(メタデータ) (2022-12-22T17:59:19Z) - Incremental-DETR: Incremental Few-Shot Object Detection via
Self-Supervised Learning [60.64535309016623]
本稿では,DeTRオブジェクト検出器上での微調整および自己教師型学習によるインクリメンタル・デクリメンタル・デクリメンタル・デクリメンタル・オブジェクト検出を提案する。
まず,DeTRのクラス固有のコンポーネントを自己監督で微調整する。
さらに,DeTRのクラス固有のコンポーネントに知識蒸留を施した数発の微調整戦略を導入し,破滅的な忘れを伴わずに新しいクラスを検出するネットワークを奨励する。
論文 参考訳(メタデータ) (2022-05-09T05:08:08Z) - A Survey of Self-Supervised and Few-Shot Object Detection [19.647681501581225]
自己教師付き手法は、オブジェクト検出などの下流タスクにうまく転送されるラベルのないデータから表現を学習することを目的としている。
ほとんどショットされていないオブジェクト検出は、ほとんどデータを持たない新しい(見えない)オブジェクトクラスのモデルをトレーニングすることです。
本調査では, 少数ショット・自己監督型物体検出における最新のアプローチを概観し, 特徴付けする。
論文 参考訳(メタデータ) (2021-10-27T18:55:47Z) - You Better Look Twice: a new perspective for designing accurate
detectors with reduced computations [56.34005280792013]
BLT-netは、新しい低計算の2段階オブジェクト検出アーキテクチャである。
非常にエレガントな第1ステージを使用して、オブジェクトをバックグラウンドから分離することで、計算を削減します。
結果のイメージ提案は、高度に正確なモデルによって第2段階で処理される。
論文 参考訳(メタデータ) (2021-07-21T12:39:51Z) - A Few-Shot Sequential Approach for Object Counting [63.82757025821265]
画像中のオブジェクトに逐次出席するクラスアテンション機構を導入し,それらの特徴を抽出する。
提案手法は点レベルのアノテーションに基づいて訓練され,モデルのクラス依存的・クラス依存的側面を乱す新しい損失関数を用いる。
本稿では,FSODやMS COCOなど,さまざまなオブジェクトカウント/検出データセットについて報告する。
論文 参考訳(メタデータ) (2020-07-03T18:23:39Z) - Any-Shot Object Detection [81.88153407655334]
「アニーショット検出」とは、全く見えず、数発のカテゴリが推論中に同時に共起できる場所である。
我々は、ゼロショットと少数ショットの両方のオブジェクトクラスを同時に検出できる、統合された任意のショット検出モデルを提案する。
我々のフレームワークは、ゼロショット検出とFewショット検出タスクにのみ使用できる。
論文 参考訳(メタデータ) (2020-03-16T03:43:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。