論文の概要: Body Meshes as Points
- arxiv url: http://arxiv.org/abs/2105.02467v1
- Date: Thu, 6 May 2021 06:58:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-07 13:24:23.506781
- Title: Body Meshes as Points
- Title(参考訳): ポイントとしてのボディーメッシュ
- Authors: Jianfeng Zhang, Dongdong Yu, Jun Hao Liew, Xuecheng Nie, Jiashi Feng
- Abstract要約: 既存の方法は、主に2段階に基づく1段階の人物のローカライズと、他の段階の個々のボディメッシュ推定である。
BMP(Body Meshes as Points)というシングルステージモデルを提案し、パイプラインを簡素化し、効率性とパフォーマンスを向上する。
- 参考スコア(独自算出の注目度): 84.61457490195743
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We consider the challenging multi-person 3D body mesh estimation task in this
work. Existing methods are mostly two-stage based--one stage for person
localization and the other stage for individual body mesh estimation, leading
to redundant pipelines with high computation cost and degraded performance for
complex scenes (e.g., occluded person instances). In this work, we present a
single-stage model, Body Meshes as Points (BMP), to simplify the pipeline and
lift both efficiency and performance. In particular, BMP adopts a new method
that represents multiple person instances as points in the spatial-depth space
where each point is associated with one body mesh. Hinging on such
representations, BMP can directly predict body meshes for multiple persons in a
single stage by concurrently localizing person instance points and estimating
the corresponding body meshes. To better reason about depth ordering of all the
persons within the same scene, BMP designs a simple yet effective
inter-instance ordinal depth loss to obtain depth-coherent body mesh
estimation. BMP also introduces a novel keypoint-aware augmentation to enhance
model robustness to occluded person instances. Comprehensive experiments on
benchmarks Panoptic, MuPoTS-3D and 3DPW clearly demonstrate the
state-of-the-art efficiency of BMP for multi-person body mesh estimation,
together with outstanding accuracy. Code can be found at:
https://github.com/jfzhang95/BMP.
- Abstract(参考訳): 本稿では,多人数3次元ボディーメッシュ推定課題について考察する。
既存の手法は、パーソナライズのための2段階ベースのステージと、個々のボディメッシュ推定のためのステージに分かれており、計算コストが高く、複雑なシーン(例えば、オクルードされたパーソナライズインスタンス)のパフォーマンスが低下した冗長なパイプラインに繋がる。
本研究では,パイプラインを簡素化し,効率と性能の両立を図るために,単段モデルであるボディーメッシュ・アズ・ポイント(bmp)を提案する。
特に,BMPでは,各点が1つの体メッシュに関連付けられている空間深度空間の点として,複数の個人インスタンスを表す新しい手法を採用している。
このような表現をベースとして、BMPは、人物のインスタンスポイントを同時にローカライズし、対応するボディーメッシュを推定することにより、複数の人のボディメッシュを単一のステージで直接予測することができる。
BMPは、同一シーン内のすべての人物の深度順序についてより正確に推論するために、単純だが効果的なインスタンス間順序深度損失を設計し、深度コヒーレントなボディーメッシュ推定を得る。
BMPはまた、隠された人物のインスタンスに対するモデルロバスト性を高めるために、新しいキーポイント対応拡張を導入した。
Panoptic, MuPoTS-3D, 3DPW のベンチマークに関する総合的な実験により,BMP の多人体メッシュ推定における最先端の効率と精度が明らかに示された。
コードは、https://github.com/jfzhang95/BMPで参照できる。
関連論文リスト
- Triple Point Masking [49.39218611030084]
既存の3Dマスク学習手法は、限られたデータの下でパフォーマンスボトルネックに遭遇する。
我々は、マスク付きオートエンコーダの事前学習のためのスケーラブルなフレームワークとして、TPMと呼ばれるトリプルポイントマスキング方式を導入する。
大規模な実験により,提案したTPMを組み込んだ4つのベースラインが,下流タスクの総合的な性能向上を実現することが示された。
論文 参考訳(メタデータ) (2024-09-26T05:33:30Z) - AdaptivePose++: A Powerful Single-Stage Network for Multi-Person Pose
Regression [66.39539141222524]
そこで本研究では,ヒトの部位を適応点として表現し,微細な身体表現法を提案する。
提案するボディ表現では,AdaptivePoseと呼ばれる,コンパクトなシングルステージ多人数ポーズ回帰ネットワークを提供する。
本稿では,AdaptivePoseの有効性を検証するために,2D/3D多人数ポーズ推定タスクにAdaptivePoseを用いる。
論文 参考訳(メタデータ) (2022-10-08T12:54:20Z) - KTN: Knowledge Transfer Network for Learning Multi-person 2D-3D
Correspondences [77.56222946832237]
画像中の複数の人物の密着度を検出するための新しい枠組みを提案する。
提案手法は知識伝達ネットワーク(KTN)の2つの問題に対処する。
特徴解像度を同時に維持し、背景画素を抑圧し、この戦略は精度を大幅に向上させる。
論文 参考訳(メタデータ) (2022-06-21T03:11:37Z) - Multi-initialization Optimization Network for Accurate 3D Human Pose and
Shape Estimation [75.44912541912252]
我々はMulti-Initialization Optimization Network(MION)という3段階のフレームワークを提案する。
第1段階では,入力サンプルの2次元キーポイントに適合する粗い3次元再構成候補を戦略的に選択する。
第2段階では, メッシュ改質トランス (MRT) を設計し, 自己保持機構を用いて粗い再構成結果をそれぞれ洗練する。
最後に,RGB画像の視覚的証拠が与えられた3次元再構成と一致するかどうかを評価することで,複数の候補から最高の結果を得るために,一貫性推定ネットワーク(CEN)を提案する。
論文 参考訳(メタデータ) (2021-12-24T02:43:58Z) - Monocular, One-stage, Regression of Multiple 3D People [105.3143785498094]
我々は、複数の3D人物(ROMP)のための1段階方式で全てのメッシュを回帰することを提案する。
本手法は,体温マップとメッシュマップを同時に予測し,画素レベルの3Dボディメッシュを共同で記述する。
最先端の手法と比較して、ROMPは挑戦的なマルチパーソンベンチマークよりも優れた性能を示した。
論文 参考訳(メタデータ) (2020-08-27T17:21:47Z) - PointINS: Point-based Instance Segmentation [117.38579097923052]
POI(Point-of-Interest)機能によるインスタンスセグメンテーションにおけるマスク表現は、各インスタンスの高次元マスク機能を学ぶには、計算負荷が重いため、難しい。
本稿では、このマスク表現学習タスクを2つの抽出可能なモジュールに分解するインスタンス認識畳み込みを提案する。
インスタンス認識の畳み込みとともに、単純で実用的なインスタンスセグメンテーションアプローチであるPointINSを提案する。
論文 参考訳(メタデータ) (2020-03-13T08:24:58Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。