論文の概要: Learning to Discover and Detect Objects
- arxiv url: http://arxiv.org/abs/2210.10774v1
- Date: Wed, 19 Oct 2022 17:59:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 14:55:11.989522
- Title: Learning to Discover and Detect Objects
- Title(参考訳): オブジェクトの発見と検出を学ぶ
- Authors: Vladimir Fomenko, Ismail Elezi, Deva Ramanan, Laura Leal-Taix\'e,
Aljo\v{s}a O\v{s}ep
- Abstract要約: 新たなクラス発見・検出・ローカライゼーション(NCDL)の課題に取り組む。
この設定では、よく観察されるクラスのオブジェクトのラベル付きソースデータセットを仮定する。
検出ネットワークをエンドツーエンドでトレーニングすることにより、さまざまなクラスに対してすべてのリージョン提案を分類することが可能になる。
- 参考スコア(独自算出の注目度): 43.52208526783969
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We tackle the problem of novel class discovery, detection, and localization
(NCDL). In this setting, we assume a source dataset with labels for objects of
commonly observed classes. Instances of other classes need to be discovered,
classified, and localized automatically based on visual similarity, without
human supervision. To this end, we propose a two-stage object detection network
Region-based NCDL (RNCDL), that uses a region proposal network to localize
object candidates and is trained to classify each candidate, either as one of
the known classes, seen in the source dataset, or one of the extended set of
novel classes, with a long-tail distribution constraint on the class
assignments, reflecting the natural frequency of classes in the real world. By
training our detection network with this objective in an end-to-end manner, it
learns to classify all region proposals for a large variety of classes,
including those that are not part of the labeled object class vocabulary. Our
experiments conducted using COCO and LVIS datasets reveal that our method is
significantly more effective compared to multi-stage pipelines that rely on
traditional clustering algorithms or use pre-extracted crops. Furthermore, we
demonstrate the generality of our approach by applying our method to a
large-scale Visual Genome dataset, where our network successfully learns to
detect various semantic classes without explicit supervision.
- Abstract(参考訳): そこで我々は,新しいクラス発見,検出,局所化(NCDL)の問題に取り組む。
この設定では、よく観察されるクラスのオブジェクトのラベル付きソースデータセットを仮定する。
他のクラスのインスタンスは人間の監督なしに視覚的類似性に基づいて自動的に発見、分類、ローカライズする必要がある。
本研究では,対象候補のローカライズに領域提案ネットワークを用いた2段階のオブジェクト検出ネットワークであるncdl(rncdl)を提案する。対象候補のローカライズには,ソースデータセットで見られる既知のクラスの1つとして,あるいは拡張された新規クラスの1つとして,実世界のクラスの自然な頻度を反映して,クラス割り当てにロングテール分布制約を課すように,各候補を分類する訓練を行う。
検出ネットワークをエンドツーエンドでトレーニングすることにより、ラベル付きオブジェクトクラス語彙の一部ではないものを含む、さまざまなクラスに対するすべてのリージョン提案を分類することを学ぶ。
COCOおよびLVISデータセットを用いて実施した実験により,従来のクラスタリングアルゴリズムや事前抽出作物を用いたマルチステージパイプラインと比較して,本手法の方がはるかに効果的であることが判明した。
さらに,本手法を大規模視覚ゲノムデータセットに適用し,ネットワークが明示的な監督なしに様々な意味クラスの検出を成功させる手法の汎用性を示す。
関連論文リスト
- Debiased Novel Category Discovering and Localization [40.02326438622898]
新たなクラスディスカバリー・ローカライゼーション(NCDL)の課題に焦点をあてる。
本稿では,クラス非依存領域提案ネットワーク(RPN)とクラス対応RPNを組み合わせたデバイアスドリージョンマイニング(DRM)手法を提案する。
我々はNCDLベンチマークで広範な実験を行い、提案手法が従来の手法よりもはるかに優れていることを示す。
論文 参考訳(メタデータ) (2024-02-29T03:09:16Z) - Weakly Supervised Open-Vocabulary Object Detection [31.605276665964787]
本稿では、従来のWSODを拡張するために、弱教師付きオープン語彙オブジェクト検出フレームワーク、すなわちWSOVODを提案する。
これを実現するために、データセットレベルの特徴適応、画像レベルの有意なオブジェクトローカライゼーション、地域レベルの視覚言語アライメントを含む3つの重要な戦略を検討する。
論文 参考訳(メタデータ) (2023-12-19T18:59:53Z) - ECEA: Extensible Co-Existing Attention for Few-Shot Object Detection [52.16237548064387]
Few-shot Object Detection (FSOD) は、非常に少数のアノテーション付きサンプルからオブジェクトを識別する。
近年のFSOD法の多くは、2段階の学習パラダイムを適用しており、このパラダイムは豊富なベースクラスから学んだ知識を、グローバルな特徴を学習することで、数発の検知を補助する。
本研究では,局所的な部分に応じて大域的オブジェクトを推論するための拡張可能共存注意(ECEA)モジュールを提案する。
論文 参考訳(メタデータ) (2023-09-15T06:55:43Z) - Weakly-supervised Contrastive Learning for Unsupervised Object Discovery [52.696041556640516]
ジェネリックな方法でオブジェクトを発見できるため、教師なしのオブジェクト発見は有望である。
画像から高レベルな意味的特徴を抽出する意味誘導型自己教師学習モデルを設計する。
オブジェクト領域のローカライズのための主成分分析(PCA)を導入する。
論文 参考訳(メタデータ) (2023-07-07T04:03:48Z) - Clustering augmented Self-Supervised Learning: Anapplication to Land
Cover Mapping [10.720852987343896]
本稿では,自己教師型学習のためのクラスタリングに基づくプレテキストタスクを用いて,土地被覆マッピングの新しい手法を提案する。
社会的に関係のある2つのアプリケーションに対して,本手法の有効性を示す。
論文 参考訳(メタデータ) (2021-08-16T19:35:43Z) - Learning Open-World Object Proposals without Learning to Classify [110.30191531975804]
本研究では,各領域の位置と形状がどの接地トラストオブジェクトとどのように重なり合うかによって,各領域の目的性を純粋に推定する,分類不要なオブジェクトローカライゼーションネットワークを提案する。
この単純な戦略は一般化可能な対象性を学び、クロスカテゴリの一般化に関する既存の提案より優れている。
論文 参考訳(メタデータ) (2021-08-15T14:36:02Z) - Distribution Alignment: A Unified Framework for Long-tail Visual
Recognition [52.36728157779307]
長尾視覚認識のための分散アライメント戦略を提案する。
次に,二段階学習における一般化された再重み付け法を導入して,事前のクラスバランスをとる。
提案手法は, 4つの認識タスクすべてにおいて, 単純で統一されたフレームワークを用いて最先端の結果を得る。
論文 参考訳(メタデータ) (2021-03-30T14:09:53Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。