論文の概要: End-to-end One-shot Human Parsing
- arxiv url: http://arxiv.org/abs/2105.01241v1
- Date: Tue, 4 May 2021 01:35:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-05 21:07:49.928016
- Title: End-to-end One-shot Human Parsing
- Title(参考訳): エンドツーエンドのワンショットパーシング
- Authors: Haoyu He, Jing Zhang, Bohan Zhuang, Jianfei Cai, Dacheng Tao
- Abstract要約: 新しいワンショットヒューマンパーシング(OSHP)タスクでは、テスト例によって定義されたオープンなクラスに人間を解析する必要がある。
EOP-Net(End-to-end Human Parsing Network)を開発。
EOP-Netは、一発セグメンテーションモデルを大きなマージンで上回る。
- 参考スコア(独自算出の注目度): 123.63803983491607
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Previous human parsing models are limited to parsing humans into pre-defined
classes, which is inflexible for applications that need to handle new classes.
In this paper, we define a new one-shot human parsing (OSHP) task that requires
parsing humans into an open set of classes defined by any test example. During
training, only base classes are exposed, which only overlap with part of
test-time classes. To address three main challenges in OSHP, i.e., small sizes,
testing bias, and similar parts, we devise a novel End-to-end One-shot human
Parsing Network (EOP-Net). Firstly, an end-to-end human parsing framework is
proposed to mutually share semantic information with different granularities
and help recognize the small-size human classes. Then, we devise two
collaborative metric learning modules to learn representative prototypes for
base classes, which can quickly adapt to unseen classes and mitigate the
testing bias. Moreover, we empirically find that robust prototypes empower
feature representations with higher transferability to the novel concepts,
hence, we propose to adopt momentum-updated dynamic prototypes generated by
gradually smoothing the training time prototypes and employ contrastive loss at
the prototype level. Experiments on three popular benchmarks tailored for OSHP
demonstrate that EOP-Net outperforms representative one-shot segmentation
models by large margins, which serves as a strong benchmark for further
research on this new task. The source code will be made publicly available.
- Abstract(参考訳): 従来の人間のパースモデルは、人間が定義済みのクラスにパースすることに限定されており、新しいクラスを扱うアプリケーションには柔軟性がない。
本稿では,テスト例によって定義されたオープンなクラスに人間を解析することを必要とする,新しいワンショットヒューマンパーシング(OSHP)タスクを定義する。
トレーニング中は、ベースクラスのみが公開され、テスト時間クラスの一部にのみ重複する。
oshpの3つの主な課題、すなわち小さなサイズ、テストバイアス、および類似部分に対処するために、我々は、新しいエンドツーエンドのワンショット人間解析ネットワーク(eop-net)を考案する。
まず、異なる粒度で意味情報を相互に共有し、小型のヒューマンクラスを認識するために、エンド・ツー・エンドのヒューマン・パーシング・フレームワークを提案する。
そして、2つの協調的なメトリック学習モジュールを考案し、ベースクラスの代表的なプロトタイプを学習し、未確認のクラスに迅速に適応し、テストバイアスを軽減する。
さらに,ロバストなプロトタイプは,新しい概念に高い転送性を持つ特徴表現を付与できることを実証的に見出し,トレーニング時間のプロトタイプを徐々に平滑化し,プロトタイプレベルでの対比損失を生かした運動量更新動的プロトタイプを採用することを提案する。
OSHP用に調整された3つの人気のあるベンチマークの実験では、EOP-Netは1ショットセグメンテーションモデルを大きなマージンで上回り、この新しいタスクのさらなる研究のための強力なベンチマークとなっている。
ソースコードは一般公開される予定だ。
関連論文リスト
- Harmonizing Base and Novel Classes: A Class-Contrastive Approach for
Generalized Few-Shot Segmentation [78.74340676536441]
本稿では,プロトタイプの更新を規制し,プロトタイプ間の距離を広くするために,クラス間のコントラスト損失とクラス関係損失を提案する。
提案手法は,PASCAL VOC および MS COCO データセット上での一般化された小ショットセグメンテーションタスクに対して,新しい最先端性能を実現する。
論文 参考訳(メタデータ) (2023-03-24T00:30:25Z) - Dual Prototypical Contrastive Learning for Few-shot Semantic
Segmentation [55.339405417090084]
本稿では,FSSタスクに適合する2つの特徴的コントラスト学習手法を提案する。
第一の考え方は、プロトタイプの特徴空間におけるクラス内距離を減少させながら、クラス間距離を増やすことで、プロトタイプをより差別的にすることである。
提案手法は,PASCAL-5iおよびCOCO-20iデータセット上で,最先端のFSS手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2021-11-09T08:14:50Z) - Differentiable Multi-Granularity Human Representation Learning for
Instance-Aware Human Semantic Parsing [131.97475877877608]
カテゴリーレベルの人間のセマンティックセグメンテーションとマルチパーソンポーズ推定を共同およびエンドツーエンドで学習するために,新たなボトムアップ方式を提案する。
さまざまな人間の粒度にわたって構造情報を利用する、コンパクトで効率的で強力なフレームワークです。
3つのインスタンス認識型ヒューマンデータセットの実験は、我々のモデルがより効率的な推論で他のボトムアップの代替案よりも優れていることを示している。
論文 参考訳(メタデータ) (2021-03-08T06:55:00Z) - Nondiscriminatory Treatment: a straightforward framework for multi-human
parsing [14.254424142949741]
マルチヒューマンパーシングは、すべての人間のインスタンスのすべてのボディ部分をセグメントすることを目的としている。
我々は,新しい直感的視点から,エンドツーエンドでボックスフリーなパイプラインを提案する。
実験の結果,ネットワークは最先端の手法に対して優れた性能を示す。
論文 参考訳(メタデータ) (2021-01-26T16:31:21Z) - Few-shot Action Recognition with Prototype-centered Attentive Learning [88.10852114988829]
2つの新しい構成要素からなるプロトタイプ中心型注意学習(pal)モデル。
まず,従来のクエリ中心学習目標を補完するために,プロトタイプ中心のコントラスト学習損失を導入する。
第二に、PALは注意深いハイブリッド学習機構を統合しており、アウトレーヤの負の影響を最小限に抑えることができる。
論文 参考訳(メタデータ) (2021-01-20T11:48:12Z) - Adaptive Prototypical Networks with Label Words and Joint Representation
Learning for Few-Shot Relation Classification [17.237331828747006]
本研究は,少ショット関係分類(FSRC)に焦点を当てる。
クラスプロトタイプの表現にラベル単語を追加するための適応的混合機構を提案する。
FewRelでは、異なる数ショット(FS)設定で実験が行われた。
論文 参考訳(メタデータ) (2021-01-10T11:25:42Z) - Progressive One-shot Human Parsing [75.18661230253558]
単発ヒューマンパーシング(OSHP)という新しい問題を提案する。
oshpは、人間を1つの参照例で定義されたオープンリファレンスクラスにパースする必要がある。
本稿では,2つの重要な課題に対処するために,新しいプログレッシブワンショットパーシングネットワーク(POPNet)を考案する。
論文 参考訳(メタデータ) (2020-12-22T03:06:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。