論文の概要: CDGNet: Class Distribution Guided Network for Human Parsing
- arxiv url: http://arxiv.org/abs/2111.14173v1
- Date: Sun, 28 Nov 2021 15:18:53 GMT
- ステータス: 処理完了
- システム内更新日: 2021-11-30 17:07:10.574095
- Title: CDGNet: Class Distribution Guided Network for Human Parsing
- Title(参考訳): CDGNet: ヒューマンパーシングのためのクラス配信ガイドネットワーク
- Authors: Kunliang Liu, Ouk Choi, Jianming Wang, Wonjun Hwang
- Abstract要約: 我々は,水平方向と垂直方向の人間のパーシングラベルを蓄積することにより,事例クラス分布を作成する。
我々は2つのガイド付き特徴を組み合わせて空間誘導マップを作成し、それを乗算と連結によりベースラインネットワーク上に重ね合わせます。
- 参考スコア(独自算出の注目度): 7.779985252025487
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The objective of human parsing is to partition a human in an image into
constituent parts. This task involves labeling each pixel of the human image
according to the classes. Since the human body comprises hierarchically
structured parts, each body part of an image can have its sole position
distribution characteristics. Probably, a human head is less likely to be under
the feet, and arms are more likely to be near the torso. Inspired by this
observation, we make instance class distributions by accumulating the original
human parsing label in the horizontal and vertical directions, which can be
utilized as supervision signals. Using these horizontal and vertical class
distribution labels, the network is guided to exploit the intrinsic position
distribution of each class. We combine two guided features to form a spatial
guidance map, which is then superimposed onto the baseline network by
multiplication and concatenation to distinguish the human parts precisely. We
conducted extensive experiments to demonstrate the effectiveness and
superiority of our method on three well-known benchmarks: LIP, ATR, and CIHP
databases.
- Abstract(参考訳): 人間の解析の目的は、人間の画像を構成要素に分割することである。
このタスクでは、人間のイメージの各ピクセルをクラスに従ってラベル付けする。
人体は階層的に構成された部分からなるので、画像の各本体部は単独の位置分布特性を有することができる。
おそらく、人間の頭は足の下にある可能性が低く、腕は胴体の近くにある可能性が高い。
この観察に触発されて,原文のパースラベルを水平方向および垂直方向に蓄積してインスタンスクラス分布を作成し,監視信号として活用する。
これらの水平クラスおよび垂直クラス分布ラベルを用いて、各クラスの固有位置分布を利用するようにネットワークを誘導する。
2つのガイド付き特徴を組み合わせて空間誘導マップを作成し、それを乗算と連結によりベースラインネットワーク上に重ね合わせ、人間の部位を正確に識別する。
LIP, ATR, CIHP の3つのベンチマークにおいて, 提案手法の有効性と優位性を検証した。
関連論文リスト
- Understanding the Role of Pathways in a Deep Neural Network [4.456675543894722]
分類タスクで訓練された畳み込みニューラルネットワーク(CNN)を分析し,個々の画素の拡散経路を抽出するアルゴリズムを提案する。
画像からの個々のピクセルの最も大きな経路は、分類に重要な各層の特徴マップを横断する傾向にある。
論文 参考訳(メタデータ) (2024-02-28T07:53:19Z) - Cross-view and Cross-pose Completion for 3D Human Understanding [22.787947086152315]
画像のみを用いて人間中心のデータを扱う自己教師付き学習に基づく事前学習手法を提案する。
身体中心タスクのためのモデルと手中心タスクのためのモデルを事前訓練する。
汎用的なトランスフォーマーアーキテクチャでは、これらのモデルは、広範囲の人間中心の下流タスクにおいて、既存の自己教師付き事前学習方法より優れている。
論文 参考訳(メタデータ) (2023-11-15T16:51:18Z) - Semantic Human Parsing via Scalable Semantic Transfer over Multiple
Label Domains [25.083197183341007]
本稿では,強力な人間構文解析ネットワークを学習するための新しい訓練パラダイムを提案する。
2つの一般的なアプリケーションシナリオが対処され、ユニバーサルパースと専用パースと呼ばれる。
実験により、SSTは有望な普遍的パーシング性能を効果的に達成できることを示した。
論文 参考訳(メタデータ) (2023-04-09T02:44:29Z) - Mine yOur owN Anatomy: Revisiting Medical Image Segmentation with Extremely Limited Labels [54.58539616385138]
我々は、Mine yOur owN Anatomy (MONA) と呼ばれる、新しい半教師付き2次元医用画像セグメンテーションフレームワークを紹介する。
まず、先行研究では、すべてのピクセルがモデルトレーニングに等しく重要であると論じており、我々はこの1つだけで意味のある解剖学的特徴を定義できないことを経験的に観察している。
第2に,医療画像を解剖学的特徴の集合に分解できるモデルを構築する。
論文 参考訳(メタデータ) (2022-09-27T15:50:31Z) - KTN: Knowledge Transfer Network for Learning Multi-person 2D-3D
Correspondences [77.56222946832237]
画像中の複数の人物の密着度を検出するための新しい枠組みを提案する。
提案手法は知識伝達ネットワーク(KTN)の2つの問題に対処する。
特徴解像度を同時に維持し、背景画素を抑圧し、この戦略は精度を大幅に向上させる。
論文 参考訳(メタデータ) (2022-06-21T03:11:37Z) - Unsupervised Part Discovery from Contrastive Reconstruction [90.88501867321573]
自己監督型視覚表現学習の目標は、強く伝達可能な画像表現を学習することである。
対象部分の発見とセグメンテーションに対する教師なしアプローチを提案する。
本手法は, 細粒度, 視覚的に異なるカテゴリ間でセマンティックな部分を生成する。
論文 参考訳(メタデータ) (2021-11-11T17:59:42Z) - Semantic Segmentation with Generative Models: Semi-Supervised Learning
and Strong Out-of-Domain Generalization [112.68171734288237]
本論文では,画像とラベルの再生モデルを用いた識別画素レベルのタスクのための新しいフレームワークを提案する。
我々は,共同画像ラベルの分布を捕捉し,未ラベル画像の大規模な集合を用いて効率的に訓練する生成的対向ネットワークを学習する。
ドメイン内性能をいくつかのベースラインと比較し,ドメイン外一般化を極端に示す最初の例である。
論文 参考訳(メタデータ) (2021-04-12T21:41:25Z) - HumanGPS: Geodesic PreServing Feature for Dense Human Correspondences [60.89437526374286]
先行芸術はフレーム間の小さな動きを仮定するか、または大きな動きや視覚的に曖昧な身体部分を扱うことができないローカル記述子に依存します。
本稿では,各画素を特徴空間にマッピングし,特徴距離が画素間の測地距離を反映する深層学習フレームワークを提案する。
セマンティックアノテーションがなければ、提案する埋め込みは自動的に学習し、視覚的に類似した部分を区別し、異なる主題を統一された機能空間にまとめる。
論文 参考訳(メタデータ) (2021-03-29T12:43:44Z) - Liquid Warping GAN with Attention: A Unified Framework for Human Image
Synthesis [58.05389586712485]
我々は、人間の動きの模倣、外見の移入、新しい視点の合成など、人間の画像合成に取り組む。
本稿では,ポーズと形状を乱す3次元ボディーメッシュ回収モジュールを提案する。
我々はまた、人間の動きの模倣、外観伝達、新しいビュー合成を評価するために、新しいデータセット、すなわちiPERデータセットを構築した。
論文 参考訳(メタデータ) (2020-11-18T02:57:47Z) - Identity-Guided Human Semantic Parsing for Person Re-Identification [42.705908907250986]
そこで本研究では,人物の身元と身元の両方を画素レベルで特定し,人物の身元を識別する「身元案内型人間意味解析」手法を提案する。
論文 参考訳(メタデータ) (2020-07-27T12:12:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。