論文の概要: Few-shot Weakly-Supervised Object Detection via Directional Statistics
- arxiv url: http://arxiv.org/abs/2103.14162v1
- Date: Thu, 25 Mar 2021 22:34:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-30 00:32:15.563299
- Title: Few-shot Weakly-Supervised Object Detection via Directional Statistics
- Title(参考訳): 方向統計による微弱監視対象検出
- Authors: Amirreza Shaban, Amir Rahimi, Thalaiyasingam Ajanthan, Byron Boots,
Richard Hartley
- Abstract要約: 少数ショットコモンオブジェクトローカライゼーション(COL)と少数ショット弱監視オブジェクト検出(WSOD)のための確率論的多重インスタンス学習手法を提案する。
本モデルでは,新しいオブジェクトの分布を同時に学習し,期待-最大化ステップにより局所化する。
提案手法は, 単純であるにもかかわらず, 少数のCOLとWSOD, 大規模WSODタスクにおいて, 高いベースラインを達成できることを示す。
- 参考スコア(独自算出の注目度): 55.97230224399744
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting novel objects from few examples has become an emerging topic in
computer vision recently. However, these methods need fully annotated training
images to learn new object categories which limits their applicability in real
world scenarios such as field robotics. In this work, we propose a
probabilistic multiple instance learning approach for few-shot Common Object
Localization (COL) and few-shot Weakly Supervised Object Detection (WSOD). In
these tasks, only image-level labels, which are much cheaper to acquire, are
available. We find that operating on features extracted from the last layer of
a pre-trained Faster-RCNN is more effective compared to previous episodic
learning based few-shot COL methods. Our model simultaneously learns the
distribution of the novel objects and localizes them via
expectation-maximization steps. As a probabilistic model, we employ von
Mises-Fisher (vMF) distribution which captures the semantic information better
than Gaussian distribution when applied to the pre-trained embedding space.
When the novel objects are localized, we utilize them to learn a linear
appearance model to detect novel classes in new images. Our extensive
experiments show that the proposed method, despite being simple, outperforms
strong baselines in few-shot COL and WSOD, as well as large-scale WSOD tasks.
- Abstract(参考訳): 少数の例から新しい物体を検出することは、近年コンピュータビジョンにおける新しい話題となっている。
しかし、これらの方法は、フィールドロボティクスのような現実世界のシナリオで適用性を制限する新しいオブジェクトカテゴリを学ぶために、完全に注釈付きトレーニングイメージを必要とする。
本研究では,少数の共通オブジェクトローカライゼーション (COL) と少数のWeakly Supervised Object Detection (WSOD) のための確率論的マルチインスタンス学習手法を提案する。
これらのタスクでは、より安価に取得できる画像レベルのラベルのみが利用可能である。
我々は,事前学習したfaster-rcnnの最終層から抽出した特徴の操作が,前回より効果的であることを示す。
本モデルでは,新しいオブジェクトの分布を同時に学習し,期待-最大化ステップにより局所化する。
確率モデルとして,事前学習した埋め込み空間に適用した場合に,ガウス分布よりも意味情報をよりよくキャプチャするvon Mises-Fisher(vMF)分布を用いる。
新たなオブジェクトがローカライズされると、新しいイメージの新しいクラスを検出するリニアな外観モデルを学ぶためにそれらを利用する。
提案手法は, 単純であるにもかかわらず, 少数のCOLやWSOD, 大規模WSODタスクにおいて, 高いベースラインを達成できることを示す。
関連論文リスト
- Few-shot Object Detection in Remote Sensing: Lifting the Curse of
Incompletely Annotated Novel Objects [23.171410277239534]
物体検出のための自己学習型FSOD (ST-FSOD) アプローチを提案する。
提案手法は,様々なFSOD設定における最先端性能を大きなマージンで向上させる。
論文 参考訳(メタデータ) (2023-09-19T13:00:25Z) - Improved Region Proposal Network for Enhanced Few-Shot Object Detection [23.871860648919593]
Few-shot Object Detection (FSOD) メソッドは、古典的なオブジェクト検出手法の限界に対する解決策として登場した。
FSODトレーニング段階において,未ラベルの新規物体を正のサンプルとして検出し,利用するための半教師付きアルゴリズムを開発した。
地域提案ネットワーク(RPN)の階層的サンプリング戦略の改善により,大規模オブジェクトに対するオブジェクト検出モデルの認識が向上する。
論文 参考訳(メタデータ) (2023-08-15T02:35:59Z) - Identification of Novel Classes for Improving Few-Shot Object Detection [12.013345715187285]
Few-shot Object Detection (FSOD) メソッドは、クラス毎に少数のトレーニングサンプルのみを使用して、堅牢なオブジェクト検出を実現することで、改善を提供する。
我々は、FSOD性能を向上させるためのトレーニング中に、未ラベルの新規物体を正のサンプルとして検出し、利用するための半教師付きアルゴリズムを開発した。
実験の結果,本手法は既存のSOTA FSOD法よりも有効であり,優れた結果が得られた。
論文 参考訳(メタデータ) (2023-03-18T14:12:52Z) - Scaling Novel Object Detection with Weakly Supervised Detection
Transformers [21.219817483091166]
Weakly Supervised Detection Transformerを提案する。これは大規模な事前学習データセットからWSODファインタニングへの効率的な知識伝達を可能にする。
提案手法は, 大規模オブジェクト検出データセットにおいて, 従来の最先端モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2022-07-11T21:45:54Z) - Budget-aware Few-shot Learning via Graph Convolutional Network [56.41899553037247]
本稿では,いくつかの例から新しい視覚概念を学習することを目的とした,数ショット学習の課題に取り組む。
数ショット分類における一般的な問題設定は、データラベルの取得においてランダムサンプリング戦略を前提としている。
そこで我々は,新しい対象カテゴリーの学習を目的とした,予算に配慮した数発の学習問題を新たに導入する。
論文 参考訳(メタデータ) (2022-01-07T02:46:35Z) - Discovery-and-Selection: Towards Optimal Multiple Instance Learning for
Weakly Supervised Object Detection [86.86602297364826]
複数インスタンス学習(DS-MIL)と融合した発見・選択手法を提案する。
我々の提案するDS-MILアプローチは,最先端の性能を報告しながら,ベースラインを一貫して改善することができる。
論文 参考訳(メタデータ) (2021-10-18T07:06:57Z) - Dynamic Relevance Learning for Few-Shot Object Detection [6.550840743803705]
動的グラフ畳み込みネットワーク(GCN)を構築するために,すべてのサポート画像とクエリ画像上の関心領域(RoI)の関係を利用した動的関連学習モデルを提案する。
提案モデルでは,より一般化された特徴の学習の有効性を示す総合的な性能が得られた。
論文 参考訳(メタデータ) (2021-08-04T18:29:42Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - Multi-Scale Positive Sample Refinement for Few-Shot Object Detection [61.60255654558682]
Few-shot Object Detection (FSOD) は、ディテクターがトレーニングインスタンスをほとんど持たない未確認のクラスに適応するのに役立つ。
FSODにおけるオブジェクトスケールを拡張化するためのMPSR(Multi-scale Positive Sample Refinement)アプローチを提案する。
MPSRは、オブジェクトピラミッドとして多スケールの正のサンプルを生成し、様々なスケールで予測を洗練させる。
論文 参考訳(メタデータ) (2020-07-18T09:48:29Z) - Any-Shot Object Detection [81.88153407655334]
「アニーショット検出」とは、全く見えず、数発のカテゴリが推論中に同時に共起できる場所である。
我々は、ゼロショットと少数ショットの両方のオブジェクトクラスを同時に検出できる、統合された任意のショット検出モデルを提案する。
我々のフレームワークは、ゼロショット検出とFewショット検出タスクにのみ使用できる。
論文 参考訳(メタデータ) (2020-03-16T03:43:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。