論文の概要: CaT: Weakly Supervised Object Detection with Category Transfer
- arxiv url: http://arxiv.org/abs/2108.07487v1
- Date: Tue, 17 Aug 2021 07:59:34 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-18 20:36:03.310072
- Title: CaT: Weakly Supervised Object Detection with Category Transfer
- Title(参考訳): CaT:カテゴリー移動による物体検出の弱さ
- Authors: Tianyue Cao, Lianyu Du, Xiaoyun Zhang, Siheng Chen, Ya Zhang, Yan-Feng
Wang
- Abstract要約: 完全な教師対象検出と弱い教師対象検出の間には大きなギャップがある。
弱教師付きオブジェクト検出のための新しいカテゴリ転送フレームワークを提案する。
当社のフレームワークは63.5%のmAPと80.3%のCorLocを実現しており、2つのデータセット間で5つのカテゴリが重なり合っている。
- 参考スコア(独自算出の注目度): 41.34509685442456
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A large gap exists between fully-supervised object detection and
weakly-supervised object detection. To narrow this gap, some methods consider
knowledge transfer from additional fully-supervised dataset. But these methods
do not fully exploit discriminative category information in the
fully-supervised dataset, thus causing low mAP. To solve this issue, we propose
a novel category transfer framework for weakly supervised object detection. The
intuition is to fully leverage both visually-discriminative and
semantically-correlated category information in the fully-supervised dataset to
enhance the object-classification ability of a weakly-supervised detector. To
handle overlapping category transfer, we propose a double-supervision mean
teacher to gather common category information and bridge the domain gap between
two datasets. To handle non-overlapping category transfer, we propose a
semantic graph convolutional network to promote the aggregation of semantic
features between correlated categories. Experiments are conducted with Pascal
VOC 2007 as the target weakly-supervised dataset and COCO as the source
fully-supervised dataset. Our category transfer framework achieves 63.5% mAP
and 80.3% CorLoc with 5 overlapping categories between two datasets, which
outperforms the state-of-the-art methods. Codes are avaliable at
https://github.com/MediaBrain-SJTU/CaT.
- Abstract(参考訳): 完全教師付き物体検出と弱い教師付き物体検出との間には大きなギャップが存在する。
このギャップを狭めるために、追加の完全教師付きデータセットからの知識転送を検討する方法もある。
しかし、これらの手法は、完全な教師付きデータセットにおける識別カテゴリー情報を十分に活用していないため、低いmAPを引き起こす。
そこで本研究では,弱教師付きオブジェクト検出のためのカテゴリ転送フレームワークを提案する。
直観は、完全な教師付きデータセットにおいて、視覚識別的および意味的に相関するカテゴリ情報の両方を十分に活用し、弱い教師付き検出器のオブジェクト分類能力を高めることである。
重複するカテゴリ転送を扱うために,2つのデータセット間の共通カテゴリ情報を収集し,ドメインギャップを埋める2つの平均教師を提案する。
非重複カテゴリ転送を扱うために,相関カテゴリ間の意味的特徴の集約を促進するセマンティックグラフ畳み込みネットワークを提案する。
実験はPascal VOC 2007で実施され、ターゲットは弱教師付きデータセット、COCOはソース完全教師付きデータセットである。
当社のカテゴリ転送フレームワークは、63.5%のマップと80.3%のコロケートを達成し、2つのデータセット間で5つの重複するカテゴリを実現しています。
コードはhttps://github.com/MediaBrain-SJTU/CaT.comにある。
関連論文リスト
- COTET: Cross-view Optimal Transport for Knowledge Graph Entity Typing [27.28214706269035]
知識グラフエンティティタイピングは、知識グラフに欠けているエンティティタイプのインスタンスを推論することを目的としている。
これまでの研究は主に、エンティティに関連するコンテキスト情報を活用することに焦点を当ててきた。
本稿では,知識グラフのエンティティ型付けのためのクロスビュー最適トランスポートを提案する。
論文 参考訳(メタデータ) (2024-05-22T12:53:12Z) - Debiased Novel Category Discovering and Localization [40.02326438622898]
新たなクラスディスカバリー・ローカライゼーション(NCDL)の課題に焦点をあてる。
本稿では,クラス非依存領域提案ネットワーク(RPN)とクラス対応RPNを組み合わせたデバイアスドリージョンマイニング(DRM)手法を提案する。
我々はNCDLベンチマークで広範な実験を行い、提案手法が従来の手法よりもはるかに優れていることを示す。
論文 参考訳(メタデータ) (2024-02-29T03:09:16Z) - Dynamic Conceptional Contrastive Learning for Generalized Category
Discovery [76.82327473338734]
Generalized category discovery (GCD) は、部分的にラベル付けされたデータを自動でクラスタリングすることを目的としている。
ラベル付きデータには、ラベル付きデータの既知のカテゴリだけでなく、新しいカテゴリのインスタンスも含まれている。
GCDの効果的な方法の1つは、ラベルなしデータの識別表現を学習するために自己教師付き学習を適用することである。
本稿では,クラスタリングの精度を効果的に向上する動的概念コントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-30T14:04:39Z) - Fine-grained Category Discovery under Coarse-grained supervision with
Hierarchical Weighted Self-contrastive Learning [37.6512548064269]
粗粒度監視(FCDC)下での細粒度カテゴリー発見という新たな実践シナリオについて検討する。
FCDCは、粗いラベル付きデータのみを用いて、既知のデータと異なる粒度のカテゴリにモデルを適応させ、かなりのラベル付けコストを削減できるきめ細かなカテゴリを発見することを目的としている。
本稿では,新しい重み付き自己コントラストモジュールを構築し,それを階層的に教師付き学習と組み合わせることで,階層型自己コントラストネットワークを提案する。
論文 参考訳(メタデータ) (2022-10-14T12:06:23Z) - Cluster-to-adapt: Few Shot Domain Adaptation for Semantic Segmentation
across Disjoint Labels [80.05697343811893]
クラスタ・トゥ・アダプティブ(Cluster-to-Adapt, C2A)は、セグメンテーションデータセット間のドメイン適応のための、計算的に効率的なクラスタリングベースのアプローチである。
変換された特徴空間に強制されるそのようなクラスタリングの目的は、ソースドメインとターゲットドメインのカテゴリを自動的に選択するのに役立つことを示す。
論文 参考訳(メタデータ) (2022-08-04T17:57:52Z) - Free Lunch for Co-Saliency Detection: Context Adjustment [14.688461235328306]
市販のサリエンシ検出データセットからの画像を利用して新しいサンプルを合成する「コストフリー」グループカットペースト(GCP)手順を提案する。
我々は、Context Adjustment Trainingと呼ばれる新しいデータセットを収集します。データセットの2つのバリエーション、すなわち、CATとCAT+は、それぞれ16,750と33,500の画像で構成されています。
論文 参考訳(メタデータ) (2021-08-04T14:51:37Z) - Visual Boundary Knowledge Translation for Foreground Segmentation [57.32522585756404]
視覚境界知識を明示的に考慮したモデルの構築を試みており、未確認カテゴリのセグメンテーションにおけるトレーニングの労力を減らそうとしている。
数十のラベル付きサンプルをガイダンスとして使うだけで、Trans-Netは完全な教師付きメソッドと同等のクローズな結果が得られる。
論文 参考訳(メタデータ) (2021-08-01T07:10:25Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - EHSOD: CAM-Guided End-to-end Hybrid-Supervised Object Detection with
Cascade Refinement [53.69674636044927]
本稿では,エンド・ツー・エンドのハイブリッド型オブジェクト検出システムであるEHSODについて述べる。
完全なアノテートと弱いアノテートの両方で、ワンショットでトレーニングすることができる。
完全なアノテートされたデータの30%しか持たない複数のオブジェクト検出ベンチマークで、同等の結果が得られる。
論文 参考訳(メタデータ) (2020-02-18T08:04:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。