論文の概要: OS2D: One-Stage One-Shot Object Detection by Matching Anchor Features
- arxiv url: http://arxiv.org/abs/2003.06800v2
- Date: Wed, 19 Aug 2020 13:59:00 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-23 08:54:37.217149
- Title: OS2D: One-Stage One-Shot Object Detection by Matching Anchor Features
- Title(参考訳): OS2D:アンカー機能マッチングによるワンステップワンショットオブジェクト検出
- Authors: Anton Osokin, Denis Sumin, Vasily Lomakin
- Abstract要約: ワンショットオブジェクト検出は、単一のデモによって定義されたオブジェクトを検出することで構成される。
ローカライズと認識を共同で行うワンステージシステムを構築している。
いくつかの挑戦的領域に対する実験的評価は,本手法が未知のクラスを検出できることを示唆している。
- 参考スコア(独自算出の注目度): 14.115782214599015
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we consider the task of one-shot object detection, which
consists in detecting objects defined by a single demonstration. Differently
from the standard object detection, the classes of objects used for training
and testing do not overlap. We build the one-stage system that performs
localization and recognition jointly. We use dense correlation matching of
learned local features to find correspondences, a feed-forward geometric
transformation model to align features and bilinear resampling of the
correlation tensor to compute the detection score of the aligned features. All
the components are differentiable, which allows end-to-end training.
Experimental evaluation on several challenging domains (retail products, 3D
objects, buildings and logos) shows that our method can detect unseen classes
(e.g., toothpaste when trained on groceries) and outperforms several baselines
by a significant margin. Our code is available online:
https://github.com/aosokin/os2d .
- Abstract(参考訳): 本稿では,1つの実演で定義された物体を検知するワンショット物体検出の課題について考察する。
標準的なオブジェクト検出とは異なり、トレーニングやテストに使用されるオブジェクトのクラスは重複しない。
ローカライズと認識を共同で行うワンステージシステムを構築している。
学習した局所特徴の密相関マッチングを用いて対応関係を求め,特徴を整列するフィードフォワード幾何変換モデルを用いて相関テンソルの双線型再サンプリングを行い,対応特徴の検出スコアを計算する。
すべてのコンポーネントは微分可能であり、エンドツーエンドのトレーニングを可能にする。
いくつかの挑戦的ドメイン(小売品,3Dオブジェクト,建物,ロゴ)を実験的に評価したところ,本手法は未確認のクラス(例えば,食料品で訓練した場合の歯磨き粉)を検出し,いくつかのベースラインを著しく上回っている。
私たちのコードはオンラインで利用可能です。
関連論文リスト
- PatchContrast: Self-Supervised Pre-training for 3D Object Detection [14.603858163158625]
PatchContrastは、3Dオブジェクト検出のための新しい自己教師付きポイントクラウド事前学習フレームワークである。
提案手法は,3つの一般的な3次元検出データセットにおいて,既存の最先端モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-14T07:45:54Z) - On Hyperbolic Embeddings in 2D Object Detection [76.12912000278322]
双曲幾何学が対象分類空間の基盤構造に適合するかどうかを考察する。
2段階、キーポイントベース、トランスフォーマーベースオブジェクト検出アーキテクチャに双曲型分類器を組み込む。
分類空間の構造に現れる分類階級階層を観察し、分類誤差を低くし、全体的な対象検出性能を高める。
論文 参考訳(メタデータ) (2022-03-15T16:43:40Z) - Contrastive Object Detection Using Knowledge Graph Embeddings [72.17159795485915]
一つのホットアプローチで学習したクラス埋め込みの誤差統計と、自然言語処理や知識グラフから意味的に構造化された埋め込みを比較した。
本稿では,キーポイントベースおよびトランスフォーマーベースオブジェクト検出アーキテクチャの知識埋め込み設計を提案する。
論文 参考訳(メタデータ) (2021-12-21T17:10:21Z) - Multi-patch Feature Pyramid Network for Weakly Supervised Object
Detection in Optical Remote Sensing Images [39.25541709228373]
マルチパッチ特徴ピラミッドネットワーク(MPFP-Net)を用いたオブジェクト検出のための新しいアーキテクチャを提案する。
MPFP-Netは、トレーニング中の最も差別的なパッチのみを追求する現在のモデルとは異なる。
残余値の正則化と核融合遷移層を厳密にノルム保存する有効な方法を提案する。
論文 参考訳(メタデータ) (2021-08-18T09:25:39Z) - Pretrained equivariant features improve unsupervised landmark discovery [69.02115180674885]
我々は、この課題を克服する2段階の教師なしアプローチを、強力なピクセルベースの特徴を初めて学習することによって定式化する。
本手法は,いくつかの難解なランドマーク検出データセットにおいて最先端の結果を生成する。
論文 参考訳(メタデータ) (2021-04-07T05:42:11Z) - Modulating Localization and Classification for Harmonized Object
Detection [40.82723262074911]
2つのタスクを変調する相互学習フレームワークを提案する。
特に,2つのタスクは,新たな相互ラベル付け戦略によって互いに学習することを余儀なくされる。
COCOデータセットのベースライン検出器に対する大幅なパフォーマンス向上を実現しました。
論文 参考訳(メタデータ) (2021-03-16T10:36:02Z) - Unsupervised Part Discovery via Feature Alignment [15.67978793872039]
我々はニューラルネットワークの特徴がニュアンス変数にほとんど不変であるという特性を利用する。
対応する特徴写像のアフィンアライメントを通して、同じポーズで同じオブジェクトカテゴリのインスタンスを示す類似した画像のセットを見つける。
推論中は、部品検出はシンプルで高速で、フィードフォワードニューラルネットワーク以外の追加モジュールやオーバーヘッドは不要である。
論文 参考訳(メタデータ) (2020-12-01T07:25:00Z) - Synthesizing the Unseen for Zero-shot Object Detection [72.38031440014463]
そこで本研究では,視覚領域における視覚的特徴と視覚的対象の両方を学習するために,視覚的特徴を合成することを提案する。
クラスセマンティックスを用いた新しい生成モデルを用いて特徴を生成するだけでなく,特徴を識別的に分離する。
論文 参考訳(メタデータ) (2020-10-19T12:36:11Z) - Multi-scale Interactive Network for Salient Object Detection [91.43066633305662]
本稿では,隣接レベルからの機能を統合するためのアグリゲート・インタラクション・モジュールを提案する。
より効率的なマルチスケール機能を得るために、各デコーダユニットに自己相互作用モジュールを埋め込む。
5つのベンチマークデータセットによる実験結果から,提案手法は後処理を一切行わず,23の最先端手法に対して良好に動作することが示された。
論文 参考訳(メタデータ) (2020-07-17T15:41:37Z) - Attention-based Joint Detection of Object and Semantic Part [4.389917490809522]
我々のモデルは2つのFaster-RCNNモデルに基づいて作成され、それらの特徴を共有して両方の表現を拡張します。
PASCAL-Part 2010データセットの実験では、関節検出は物体検出と部分検出の両方を同時に改善できることが示された。
論文 参考訳(メタデータ) (2020-07-05T18:54:10Z) - One-Shot Object Detection without Fine-Tuning [62.39210447209698]
本稿では,第1ステージのMatching-FCOSネットワークと第2ステージのStructure-Aware Relation Moduleからなる2段階モデルを提案する。
また,検出性能を効果的に向上する新たなトレーニング戦略を提案する。
提案手法は,複数のデータセット上で一貫した最先端のワンショット性能を上回る。
論文 参考訳(メタデータ) (2020-05-08T01:59:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。