論文の概要: AIParsing: Anchor-free Instance-level Human Parsing
- arxiv url: http://arxiv.org/abs/2207.06854v1
- Date: Thu, 14 Jul 2022 12:19:32 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-15 14:19:17.193886
- Title: AIParsing: Anchor-free Instance-level Human Parsing
- Title(参考訳): AIParsing:アンカーレスインスタンスレベルのヒューマンパーシング
- Authors: Sanyi Zhang, Xiaochun Cao, Guo-Jun Qi, Zhanjie Song, and Jie Zhou
- Abstract要約: 我々は、アンカーフリーで画素レベルで解決可能なインスタンスレベルのヒューマンパーシングネットワークを設計した。
ボックス予測のためのアンカーフリー検出ヘッドと、人間のセグメンテーションのためのエッジ誘導パーシングヘッドの2つの単純なサブネットワークで構成されている。
提案手法は,最先端のワンステージトップダウン方式よりも優れたグローバルレベルおよびインスタンスレベルの性能を実現する。
- 参考スコア(独自算出の注目度): 98.80740676794254
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Most state-of-the-art instance-level human parsing models adopt two-stage
anchor-based detectors and, therefore, cannot avoid the heuristic anchor box
design and the lack of analysis on a pixel level. To address these two issues,
we have designed an instance-level human parsing network which is anchor-free
and solvable on a pixel level. It consists of two simple sub-networks: an
anchor-free detection head for bounding box predictions and an edge-guided
parsing head for human segmentation. The anchor-free detector head inherits the
pixel-like merits and effectively avoids the sensitivity of hyper-parameters as
proved in object detection applications. By introducing the part-aware boundary
clue, the edge-guided parsing head is capable to distinguish adjacent human
parts from among each other up to 58 parts in a single human instance, even
overlapping instances. Meanwhile, a refinement head integrating box-level score
and part-level parsing quality is exploited to improve the quality of the
parsing results. Experiments on two multiple human parsing datasets (i.e., CIHP
and LV-MHP-v2.0) and one video instance-level human parsing dataset (i.e., VIP)
show that our method achieves the best global-level and instance-level
performance over state-of-the-art one-stage top-down alternatives.
- Abstract(参考訳): ほとんどの最先端のインスタンスレベルの人間解析モデルは、2段階のアンカーベースの検出器を採用するため、ヒューリスティックアンカーボックスの設計やピクセルレベルでの分析の欠如を避けることはできない。
これら2つの問題に対処するため、我々は、アンカーフリーで画素レベルで解決可能なインスタンスレベルのヒューマンパーシングネットワークを設計した。
ボックス予測のためのアンカーフリー検出ヘッドと、人間のセグメンテーションのためのエッジ誘導解析ヘッドの2つの単純なサブネットワークで構成されている。
アンカーフリー検出器ヘッドは画素様の利点を継承し、オブジェクト検出アプリケーションで証明されたハイパーパラメータの感度を効果的に回避する。
この部分認識境界手がかりの導入により、エッジ誘導解析ヘッドは、重複したインスタンスであっても、1つの人間のインスタンスにおいて、隣り合う人間の部分と58個の部分とを区別することができる。
一方、ボックスレベルスコアと部分レベル解析品質を統合した精細化ヘッドを利用して解析結果の品質を向上する。
2つのヒューマンパーシングデータセット(CIHPとLV-MHP-v2.0)と1つのビデオインスタンスレベルのヒューマンパーシングデータセット(VIP)の実験により、我々の手法は最先端のワンステージトップダウンモデルよりも優れたグローバルレベルおよびインスタンスレベルのパフォーマンスを達成することが示された。
関連論文リスト
- DROP: Decouple Re-Identification and Human Parsing with Task-specific
Features for Occluded Person Re-identification [15.910080319118498]
本稿では,隠蔽者再識別(ReID)のためのDouple Re-identificatiOnとHuman Parsing(DROP)手法について紹介する。
ReIDと人間の構文解析の同時学習にグローバルな特徴を用いる主流のアプローチとは異なり、DROPは、前者の劣る性能はReIDと人間の解析機能の異なる要件に起因すると主張している。
実験の結果、DROPの有効性、特にOccluded-Dukeで76.8%のランク1の精度を達成し、2つの主要な方法を超えた。
論文 参考訳(メタデータ) (2024-01-31T17:54:43Z) - COMICS: End-to-end Bi-grained Contrastive Learning for Multi-face Forgery Detection [56.7599217711363]
顔偽造認識法は一度に1つの顔しか処理できない。
ほとんどの顔偽造認識法は一度に1つの顔しか処理できない。
マルチフェイスフォージェリ検出のためのエンドツーエンドフレームワークであるCOMICSを提案する。
論文 参考訳(メタデータ) (2023-08-03T03:37:13Z) - Integrating Human Parsing and Pose Network for Human Action Recognition [12.308394270240463]
動作認識のための新しいモダリティとして,人間の解析特徴マップを導入する。
本稿では,行動認識のためのヒューマンパーシングとポースネットワーク(IPP-Net)の統合を提案する。
IPP-Netは、スケルトンと人間のパース機能マップの両方を活用する最初の方法である。
論文 参考訳(メタデータ) (2023-07-16T07:58:29Z) - Technical Report: Disentangled Action Parsing Networks for Accurate
Part-level Action Parsing [65.87931036949458]
Part-level Action Parsingは、ビデオにおけるアクション認識を促進するための部分状態解析を目的としている。
DAP(disentangled action parsing)というシンプルなアプローチを提案する。
論文 参考訳(メタデータ) (2021-11-05T02:29:32Z) - LabOR: Labeling Only if Required for Domain Adaptive Semantic
Segmentation [79.96052264984469]
本稿では,UDAモデルが不確実な点に対して,少ないラベルを適応的に付与する手法を提案する。
作業コストを最小化しつつ、ドメイン適応型セマンティックセマンティックセマンティクスのための新しいフレームワークの利点を示す。
論文 参考訳(メタデータ) (2021-08-12T07:35:40Z) - Mining the Benefits of Two-stage and One-stage HOI Detection [26.919979955155664]
2段階の手法は、数年にわたって人-物体相互作用(HOI)の検出を支配してきた。
1段階の手法は、マルチタスク学習、すなわちオブジェクト検出と相互作用分類において適切なトレードオフを行うことが困難である。
本稿では,カスケード方式で人物体検出と相互作用分類を両立させる新しい一段階フレームワークを提案する。
論文 参考訳(メタデータ) (2021-08-11T07:38:09Z) - End-to-end One-shot Human Parsing [91.5113227694443]
One-shot Human Parsing (OSHP) タスクでは、テスト例によって定義されたオープンなクラスに人間を解析する必要がある。
EOP-Net (End-to-end One-shot Human Parsing Network) が提案されている。
EOP-Netは、一発セグメンテーションモデルを大きなマージンで上回る。
論文 参考訳(メタデータ) (2021-05-04T01:35:50Z) - Differentiable Multi-Granularity Human Representation Learning for
Instance-Aware Human Semantic Parsing [131.97475877877608]
カテゴリーレベルの人間のセマンティックセグメンテーションとマルチパーソンポーズ推定を共同およびエンドツーエンドで学習するために,新たなボトムアップ方式を提案する。
さまざまな人間の粒度にわたって構造情報を利用する、コンパクトで効率的で強力なフレームワークです。
3つのインスタンス認識型ヒューマンデータセットの実験は、我々のモデルがより効率的な推論で他のボトムアップの代替案よりも優れていることを示している。
論文 参考訳(メタデータ) (2021-03-08T06:55:00Z) - Nondiscriminatory Treatment: a straightforward framework for multi-human
parsing [14.254424142949741]
マルチヒューマンパーシングは、すべての人間のインスタンスのすべてのボディ部分をセグメントすることを目的としている。
我々は,新しい直感的視点から,エンドツーエンドでボックスフリーなパイプラインを提案する。
実験の結果,ネットワークは最先端の手法に対して優れた性能を示す。
論文 参考訳(メタデータ) (2021-01-26T16:31:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。