論文の概要: Progressive One-shot Human Parsing
- arxiv url: http://arxiv.org/abs/2012.11810v2
- Date: Tue, 16 Mar 2021 04:50:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-26 07:47:42.840981
- Title: Progressive One-shot Human Parsing
- Title(参考訳): 進歩的ワンショットヒューマンパーシング
- Authors: Haoyu He, Jing Zhang, Bhavani Thuraisingham, Dacheng Tao
- Abstract要約: 単発ヒューマンパーシング(OSHP)という新しい問題を提案する。
oshpは、人間を1つの参照例で定義されたオープンリファレンスクラスにパースする必要がある。
本稿では,2つの重要な課題に対処するために,新しいプログレッシブワンショットパーシングネットワーク(POPNet)を考案する。
- 参考スコア(独自算出の注目度): 75.18661230253558
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Prior human parsing models are limited to parsing humans into classes
pre-defined in the training data, which is not flexible to generalize to unseen
classes, e.g., new clothing in fashion analysis. In this paper, we propose a
new problem named one-shot human parsing (OSHP) that requires to parse human
into an open set of reference classes defined by any single reference example.
During training, only base classes defined in the training set are exposed,
which can overlap with part of reference classes. In this paper, we devise a
novel Progressive One-shot Parsing network (POPNet) to address two critical
challenges , i.e., testing bias and small sizes. POPNet consists of two
collaborative metric learning modules named Attention Guidance Module and
Nearest Centroid Module, which can learn representative prototypes for base
classes and quickly transfer the ability to unseen classes during testing,
thereby reducing testing bias. Moreover, POPNet adopts a progressive human
parsing framework that can incorporate the learned knowledge of parent classes
at the coarse granularity to help recognize the descendant classes at the fine
granularity, thereby handling the small sizes issue. Experiments on the ATR-OS
benchmark tailored for OSHP demonstrate POPNet outperforms other representative
one-shot segmentation models by large margins and establishes a strong
baseline. Source code can be found at
https://github.com/Charleshhy/One-shot-Human-Parsing.
- Abstract(参考訳): 事前のヒューマンパースモデルは、トレーニングデータで予め定義されたクラスに人間をパースすることに限定されており、ファッション分析の新しい服など、目に見えないクラスに一般化することは柔軟ではない。
本稿では,人間を1つの参照例で定義されたオープンリファレンスクラスにパースする必要がある,one-shot human parse(oshp)という新しい問題を提案する。
トレーニング中、トレーニングセットで定義されたベースクラスのみが公開され、参照クラスの一部と重複する可能性がある。
本稿では,新しいプログレッシブ・ワンショット・パーシング・ネットワーク(POPNet)を考案し,テストバイアスと小型化という2つの重要な課題に対処する。
POPNetは,Attention Guidance ModuleとNearest Centroid Moduleという2つの共同メトリック学習モジュールで構成されている。
さらに、POPNetは、親クラスの学習知識を粗粒度に組み込むプログレッシブなヒューマンパーシングフレームワークを採用し、子孫クラスを粒度の細かい粒度で認識し、小さなサイズの問題に対処する。
OSHP用に調整されたATR-OSベンチマークの実験では、POPNetは他の代表的なワンショットセグメンテーションモデルよりも大きなマージンで優れ、強力なベースラインを確立している。
ソースコードはhttps://github.com/Charleshhy/One-shot-Human-Parsingにある。
関連論文リスト
- Few-Shot Class-Incremental Learning via Training-Free Prototype
Calibration [67.69532794049445]
既存のメソッドでは、新しいクラスのサンプルをベースクラスに誤分類する傾向があり、新しいクラスのパフォーマンスが低下する。
我々は,新しいクラスの識別性を高めるため,簡易かつ効果的なトレーニング-フレア・カロブラシアン (TEEN) 戦略を提案する。
論文 参考訳(メタデータ) (2023-12-08T18:24:08Z) - Harmonizing Base and Novel Classes: A Class-Contrastive Approach for
Generalized Few-Shot Segmentation [78.74340676536441]
本稿では,プロトタイプの更新を規制し,プロトタイプ間の距離を広くするために,クラス間のコントラスト損失とクラス関係損失を提案する。
提案手法は,PASCAL VOC および MS COCO データセット上での一般化された小ショットセグメンテーションタスクに対して,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-24T00:30:25Z) - Rethinking Semantic Segmentation: A Prototype View [126.59244185849838]
学習不可能なプロトタイプをベースとした非パラメトリックセマンティックセマンティックセマンティクスモデルを提案する。
我々のフレームワークは、いくつかのデータセットに対して魅力的な結果をもたらす。
この作業が、現在のデファクトセマンティックセグメンテーションモデル設計を再考することを期待しています。
論文 参考訳(メタデータ) (2022-03-28T21:15:32Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - End-to-end One-shot Human Parsing [91.5113227694443]
One-shot Human Parsing (OSHP) タスクでは、テスト例によって定義されたオープンなクラスに人間を解析する必要がある。
EOP-Net (End-to-end One-shot Human Parsing Network) が提案されている。
EOP-Netは、一発セグメンテーションモデルを大きなマージンで上回る。
論文 参考訳(メタデータ) (2021-05-04T01:35:50Z) - Adaptive Prototypical Networks with Label Words and Joint Representation
Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。
クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。
FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文 参考訳(メタデータ) (2021-01-10T11:25:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。