論文の概要: UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation
- arxiv url: http://arxiv.org/abs/2006.07502v3
- Date: Wed, 3 Mar 2021 20:34:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-22 04:27:23.098868
- Title: UniT: Unified Knowledge Transfer for Any-shot Object Detection and
Segmentation
- Title(参考訳): ユニット:any-shotオブジェクト検出とセグメンテーションのための統一知識転送
- Authors: Siddhesh Khandelwal, Raghav Goyal, Leonid Sigal
- Abstract要約: オブジェクト検出とセグメンテーションの方法は、トレーニングのための大規模インスタンスレベルのアノテーションに依存します。
本稿では,直感的かつ統一的な半教師付きモデルを提案する。
- 参考スコア(独自算出の注目度): 52.487469544343305
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Methods for object detection and segmentation rely on large scale
instance-level annotations for training, which are difficult and time-consuming
to collect. Efforts to alleviate this look at varying degrees and quality of
supervision. Weakly-supervised approaches draw on image-level labels to build
detectors/segmentors, while zero/few-shot methods assume abundant
instance-level data for a set of base classes, and none to a few examples for
novel classes. This taxonomy has largely siloed algorithmic designs. In this
work, we aim to bridge this divide by proposing an intuitive and unified
semi-supervised model that is applicable to a range of supervision: from zero
to a few instance-level samples per novel class. For base classes, our model
learns a mapping from weakly-supervised to fully-supervised
detectors/segmentors. By learning and leveraging visual and lingual
similarities between the novel and base classes, we transfer those mappings to
obtain detectors/segmentors for novel classes; refining them with a few novel
class instance-level annotated samples, if available. The overall model is
end-to-end trainable and highly flexible. Through extensive experiments on
MS-COCO and Pascal VOC benchmark datasets we show improved performance in a
variety of settings.
- Abstract(参考訳): オブジェクトの検出とセグメンテーションの方法は、トレーニングのための大規模なインスタンスレベルのアノテーションに依存しています。
このことを緩和する努力は、様々な程度と監督の質に目を向ける。
弱い教師付きアプローチは画像レベルのラベルを使って検出器/セグメンタを構築し、zero/few-shotメソッドはベースクラスのセットに豊富なインスタンスレベルのデータを仮定する。
この分類はアルゴリズムの設計をサイロ化している。
本研究は,新規クラスの0からいくつかのインスタンスレベルのサンプルを対象とする,直感的で統一された半教師付きモデルを提案することによって,この分割を橋渡しすることを目的とする。
基本クラスでは,弱教師付きから完全教師付き検出器/セグメンタへのマッピングを学習する。
新しいクラスとベースクラスの視覚的および言語的類似性を学習し、活用することにより、これらのマッピングを新しいクラスの検出器/セグメンタに転送し、利用可能であればいくつかの新しいクラスインスタンスレベルのアノテーション付きサンプルでそれらを精査する。
全体的なモデルはエンドツーエンドでトレーニング可能で、非常に柔軟です。
MS-COCOおよびPascal VOCベンチマークデータセットに関する広範な実験を通じて、様々な環境での性能改善を示す。
関連論文リスト
- Integrated Image-Text Based on Semi-supervised Learning for Small Sample Instance Segmentation [1.3157419797035321]
本稿では,既存情報の利用を最大化する観点から,新しいサンプルインスタンス分割法を提案する。
まず、ラベルのないデータを学習して擬似ラベルを生成し、利用可能なサンプルの数を増やすことで、モデルが完全に活用するのに役立つ。
第二に、テキストと画像の特徴を統合することにより、より正確な分類結果を得ることができる。
論文 参考訳(メタデータ) (2024-10-21T14:44:08Z) - LC-Protonets: Multi-label Few-shot learning for world music audio tagging [65.72891334156706]
ラベル結合型プロトタイプネットワーク(LC-Protonets)を導入し,複数ラベルの複数ショット分類の問題に対処する。
LC-Protonetsは、限られたトレーニング項目に存在するラベルのパワーセットから、ラベルの組み合わせごとに1つのプロトタイプを生成する。
本手法は,様々な文化をカバーし,現代音楽と伝統音楽の両方を含む,多様な音楽データセットにまたがる自動音声タグ付けに適用する。
論文 参考訳(メタデータ) (2024-09-17T15:13:07Z) - Investigating Self-Supervised Methods for Label-Efficient Learning [27.029542823306866]
低撮影能力のためのコントラスト学習、クラスタリング、マスク付き画像モデリングなど、さまざまな自己教師付きプレテキストタスクについて検討する。
マスク画像モデリングとクラスタリングの両方をプリテキストタスクとして含むフレームワークを導入する。
実規模データセット上でモデルをテストした場合,マルチクラス分類,マルチラベル分類,セマンティックセマンティックセグメンテーションにおける性能向上を示す。
論文 参考訳(メタデータ) (2024-06-25T10:56:03Z) - Towards Few-Annotation Learning for Object Detection: Are
Transformer-based Models More Efficient ? [11.416621957617334]
本稿では,現在最先端のオブジェクト検出器であるDeformable DETRに適した半教師付き手法を提案する。
本手法はCOCOとPascal VOCの半教師付きオブジェクト検出ベンチマークで評価し,特にアノテーションが少ない場合,従来の手法よりも優れていた。
論文 参考訳(メタデータ) (2023-10-30T18:51:25Z) - Rethinking Multiple Instance Learning for Whole Slide Image Classification: A Good Instance Classifier is All You Need [18.832471712088353]
MIL設定下では,インスタンスレベルの弱教師付きコントラスト学習アルゴリズムを初めて提案する。
また,プロトタイプ学習による正確な擬似ラベル生成手法を提案する。
論文 参考訳(メタデータ) (2023-07-05T12:44:52Z) - Learning to Detect Instance-level Salient Objects Using Complementary
Image Labels [55.049347205603304]
本報告では,本問題に対する第1の弱教師付きアプローチを提案する。
本稿では,候補対象の特定にクラス整合性情報を活用するSaliency Detection Branch,オブジェクト境界をデライン化するためにクラス整合性情報を利用するBundary Detection Branch,サブティナイズ情報を用いたCentroid Detection Branchを提案する。
論文 参考訳(メタデータ) (2021-11-19T10:15:22Z) - Semi-supervised Active Learning for Instance Segmentation via Scoring
Predictions [25.408505612498423]
インスタンスセグメンテーションのための新規かつ原則的な半教師付きアクティブ学習フレームワークを提案する。
具体的には,クラス,バウンディングボックス,マスクの手がかりを明示的に評価するトリプレットスコア予測(tsp)という不確実性サンプリング戦略を提案する。
医用画像データセットを用いた結果から,提案手法が有意義な方法で利用可能なデータから知識を具現化することを示す。
論文 参考訳(メタデータ) (2020-12-09T02:36:52Z) - Region Comparison Network for Interpretable Few-shot Image
Classification [97.97902360117368]
新しいクラスのモデルをトレーニングするために、ラベル付きサンプルの限られた数だけを効果的に活用するための画像分類が提案されている。
本研究では,領域比較ネットワーク (RCN) と呼ばれる距離学習に基づく手法を提案する。
また,タスクのレベルからカテゴリへの解釈可能性の一般化も提案する。
論文 参考訳(メタデータ) (2020-09-08T07:29:05Z) - A Few-Shot Sequential Approach for Object Counting [63.82757025821265]
画像中のオブジェクトに逐次出席するクラスアテンション機構を導入し,それらの特徴を抽出する。
提案手法は点レベルのアノテーションに基づいて訓練され,モデルのクラス依存的・クラス依存的側面を乱す新しい損失関数を用いる。
本稿では,FSODやMS COCOなど,さまざまなオブジェクトカウント/検出データセットについて報告する。
論文 参考訳(メタデータ) (2020-07-03T18:23:39Z) - Incremental Few-Shot Object Detection [96.02543873402813]
OpeN-ended Centre nEtは、いくつかの例でクラスオブジェクトの検出を漸進的に学習する検出器である。
ONCEはインクリメンタルな学習パラダイムを十分に尊重しており、新しいクラス登録では、数発のトレーニングサンプルを1回だけフォワードパスするだけでよい。
論文 参考訳(メタデータ) (2020-03-10T12:56:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。