論文の概要: Hierarchical Human Parsing with Typed Part-Relation Reasoning
- arxiv url: http://arxiv.org/abs/2003.04845v2
- Date: Wed, 11 Mar 2020 10:14:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-24 21:21:09.821602
- Title: Hierarchical Human Parsing with Typed Part-Relation Reasoning
- Title(参考訳): 型付き部分関係推論を用いた階層的人間解析
- Authors: Wenguan Wang, Hailong Zhu, Jifeng Dai, Yanwei Pang, Jianbing Shen, and
Ling Shao
- Abstract要約: このタスクでは、人体構造をモデル化する方法が中心的なテーマである。
深層グラフネットワークの表現能力と階層的人間構造を同時に活用することを模索する。
- 参考スコア(独自算出の注目度): 179.64978033077222
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Human parsing is for pixel-wise human semantic understanding. As human bodies
are underlying hierarchically structured, how to model human structures is the
central theme in this task. Focusing on this, we seek to simultaneously exploit
the representational capacity of deep graph networks and the hierarchical human
structures. In particular, we provide following two contributions. First, three
kinds of part relations, i.e., decomposition, composition, and dependency, are,
for the first time, completely and precisely described by three distinct
relation networks. This is in stark contrast to previous parsers, which only
focus on a portion of the relations and adopt a type-agnostic relation modeling
strategy. More expressive relation information can be captured by explicitly
imposing the parameters in the relation networks to satisfy the specific
characteristics of different relations. Second, previous parsers largely ignore
the need for an approximation algorithm over the loopy human hierarchy, while
we instead address an iterative reasoning process, by assimilating generic
message-passing networks with their edge-typed, convolutional counterparts.
With these efforts, our parser lays the foundation for more sophisticated and
flexible human relation patterns of reasoning. Comprehensive experiments on
five datasets demonstrate that our parser sets a new state-of-the-art on each.
- Abstract(参考訳): 人間の構文解析は、ピクセルワイドな人間の意味理解のためのものである。
人体は階層的に構造されているため、人間の構造をモデル化する方法がこのタスクの中心的なテーマである。
これに着目し,深層グラフネットワークと階層型人体構造の表現能力を同時に活用することを目指す。
特に、以下の2つの貢献がある。
第一に、3種類の部分関係、すなわち分解、構成、依存は、初めて、3つの異なる関係ネットワークによって完全に正確に記述される。
これは、関係の一部だけに焦点を当て、型に依存しない関係モデリング戦略を採用する以前のパーサーとは対照的である。
より表現豊かな関係情報は、関係ネットワーク内のパラメータを明示的に指定することで、異なる関係の特定の特性を満たすことができる。
第2に、従来のパーサーはループ型人間の階層に対する近似アルゴリズムの必要性をほとんど無視するが、代わりに、エッジ型、畳み込み型で汎用的なメッセージパッシングネットワークを同化することにより、反復的な推論プロセスに対処する。
これらの取り組みにより、我々のパーサーは推論のより洗練された柔軟な人間関係パターンの基礎を築いた。
5つのデータセットに関する包括的な実験は、パーサがそれぞれに新しい最先端を設定することを証明します。
関連論文リスト
- Prototype-based Embedding Network for Scene Graph Generation [105.97836135784794]
現在のシーングラフ生成(SGG)手法は、コンテキスト情報を探索し、エンティティペア間の関係を予測する。
被写体と対象物の組み合わせが多様であるため、各述語カテゴリーには大きなクラス内変異が存在する。
プロトタイプベースのEmbedding Network (PE-Net) は、エンティティ/述語を、プロトタイプに準拠したコンパクトで独特な表現でモデル化する。
PLは、PE-Netがそのようなエンティティ述語マッチングを効率的に学習するのを助けるために導入され、不明瞭なエンティティ述語マッチングを緩和するためにプロトタイプ正規化(PR)が考案されている。
論文 参考訳(メタデータ) (2023-03-13T13:30:59Z) - Deep Learning for Human Parsing: A Survey [54.812353922568995]
本研究では,人間の意味解析の先駆的な研究の幅広い範囲を網羅する,最先端の人間の構文解析手法の解析を行う。
1) 構造駆動型アーキテクチャは,人体の異なる部分と固有の階層構造を生かし,(2) グラフベースのネットワークは,効率的で完全な人体分析を実現するためにグローバルな情報を捉え,(3) コンテキスト認識ネットワークは,対応するクラスのピクセルを特徴付けるために,すべてのピクセルにわたって有用なコンテキストを探索し,(4) LSTMベースの手法は,短距離と長距離空間の依存関係を結合して,豊富な局所的・グローバルなコンテキストをうまく活用することができる。
論文 参考訳(メタデータ) (2023-01-29T10:54:56Z) - Differentiable Multi-Granularity Human Representation Learning for
Instance-Aware Human Semantic Parsing [131.97475877877608]
カテゴリーレベルの人間のセマンティックセグメンテーションとマルチパーソンポーズ推定を共同およびエンドツーエンドで学習するために,新たなボトムアップ方式を提案する。
さまざまな人間の粒度にわたって構造情報を利用する、コンパクトで効率的で強力なフレームワークです。
3つのインスタンス認識型ヒューマンデータセットの実験は、我々のモデルがより効率的な推論で他のボトムアップの代替案よりも優れていることを示している。
論文 参考訳(メタデータ) (2021-03-08T06:55:00Z) - Learning Relation Prototype from Unlabeled Texts for Long-tail Relation
Extraction [84.64435075778988]
本稿では,ラベルのないテキストから関係プロトタイプを学習するための一般的なアプローチを提案する。
我々は、エンティティ間の暗黙的な要因として関係プロトタイプを学習する。
私たちは、New York TimesとGoogle Distant Supervisionの2つの公開データセットで実験を行います。
論文 参考訳(メタデータ) (2020-11-27T06:21:12Z) - Correlating Edge, Pose with Parsing [35.27973063976257]
本稿では,人間の意味的境界とキーポイント位置が協調的に人間の解析を改善する方法について検討する。
本研究では,不均一な非局所ブロックを用いた相関解析装置(CorrPM)を提案する。
論文 参考訳(メタデータ) (2020-05-04T12:39:13Z) - Learning Compositional Neural Information Fusion for Human Parsing [181.48380078517525]
我々はこのアプローチを神経情報融合フレームワークとして定式化する。
我々のモデルは階層上の3つの推論プロセスから情報を収集する。
モデル全体がエンドツーエンドで識別可能であり、情報フローと構造を明示的にモデル化する。
論文 参考訳(メタデータ) (2020-01-19T10:35:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。