Fugu-MT 論文翻訳(概要): Structure-Aware Flow Generation for Human Body Reshaping

論文の概要: Structure-Aware Flow Generation for Human Body Reshaping

arxiv url: http://arxiv.org/abs/2203.04670v2
Date: Fri, 11 Mar 2022 03:38:21 GMT
ステータス: 翻訳完了
システム内更新日: 2022-03-14 11:32:31.080726
Title: Structure-Aware Flow Generation for Human Body Reshaping
Title（参考訳）: 人体再構成のための構造認識フロー生成
Authors: Jianqiang Ren, Yuan Yao, Biwen Lei, Miaomiao Cui, Xuansong Xie
Abstract要約: 我々は,任意のポーズや服装で前例のない制御可能な性能を実現するために,エンドツーエンドのフロー生成アーキテクチャを開発した。包括的評価のために, BR-5Kという, 初めての大規模ボディーリフォーミングデータセットを構築した。提案手法は, 視覚性能, 制御性, 効率の面で, 既存の最先端手法を著しく上回っている。
参考スコア（独自算出の注目度）: 15.365236395118982
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Body reshaping is an important procedure in portrait photo retouching. Due to the complicated structure and multifarious appearance of human bodies, existing methods either fall back on the 3D domain via body morphable model or resort to keypoint-based image deformation, leading to inefficiency and unsatisfied visual quality. In this paper, we address these limitations by formulating an end-to-end flow generation architecture under the guidance of body structural priors, including skeletons and Part Affinity Fields, and achieve unprecedentedly controllable performance under arbitrary poses and garments. A compositional attention mechanism is introduced for capturing both visual perceptual correlations and structural associations of the human body to reinforce the manipulation consistency among related parts. For a comprehensive evaluation, we construct the first large-scale body reshaping dataset, namely BR-5K, which contains 5,000 portrait photos as well as professionally retouched targets. Extensive experiments demonstrate that our approach significantly outperforms existing state-of-the-art methods in terms of visual performance, controllability, and efficiency. The dataset is available at our website: https://github.com/JianqiangRen/FlowBasedBodyReshaping.
Abstract（参考訳）: ボディリシェーピングは、ポートレート写真のリタッチにおいて重要な手順である。人体の複雑な構造と多彩な外観のため、既存の手法はボディーモルファブルモデルを介して3dドメインにフォールバックするか、キーポイントベースの画像変形に頼り、非効率と不満足な視覚品質をもたらす。本稿では,骨格や部品親和性フィールドなどの体の構造的事前の指導の下で,エンドツーエンドのフロー生成アーキテクチャを定式化し,任意のポーズや衣服による前例のない制御性能を実現することにより,これらの制約に対処する。視覚の知覚相関と人体の構造相関の両方を捉えて、関連部位間の操作一貫性を強化する構成的注意機構を導入する。包括的評価のために,5000枚の肖像画と専門的な修正対象を含むBR-5Kという,最初の大規模ボディーリフォームデータセットを構築した。広範な実験により,我々のアプローチは,視覚性能,制御性,効率の点で,既存の最先端手法を大きく上回っていることが示された。データセットは当社のwebサイトで利用可能です。 https://github.com/jianqiangren/flowbasedbodyreshaping。

関連論文リスト

Reconstructing People, Places, and Cameras [57.81696692335401]
Humans and Structure from Motion (HSfM) は、メカニカルワールド座標系において、複数の人メッシュ、シーンポイント雲、カメラパラメータを共同で再構築する手法である。以上の結果から,SfMパイプラインに人体データを組み込むことで,カメラのポーズ推定が改善された。
論文参考訳（メタデータ） (2024-12-23T18:58:34Z)
BodyMetric: Evaluating the Realism of Human Bodies in Text-to-Image Generation [9.85749440360125]
BodyMetricは、画像の身体リアリズムを予測する学習可能なメトリックである。 BodyMetricは、これまで大規模に利用できなかったアプリケーションを通じてデモします。
論文参考訳（メタデータ） (2024-12-05T11:48:54Z)
EasyHOI: Unleashing the Power of Large Models for Reconstructing Hand-Object Interactions in the Wild [79.71523320368388]
本研究の目的は,手動物体のインタラクションを単一視点画像から再構築することである。まず、手ポーズとオブジェクト形状を推定する新しいパイプラインを設計する。最初の再構築では、事前に誘導された最適化方式を採用する。
論文参考訳（メタデータ） (2024-11-21T16:33:35Z)
SSP-IR: Semantic and Structure Priors for Diffusion-based Realistic Image Restoration [20.873676111265656]
SSP-IRは、低画質の画像からセマンティックと構造をフル活用することを目的としている。提案手法は,合成および実世界のデータセットにおいて,他の最先端手法よりも優れる。
論文参考訳（メタデータ） (2024-07-04T04:55:14Z)
3D WholeBody Pose Estimation based on Semantic Graph Attention Network and Distance Information [2.457872341625575]
新たなセマンティックグラフアテンションネットワークは、グローバルコンテキストをキャプチャする自己アテンションの能力の恩恵を受けることができる。本体部分デコーダは、身体の特定のセグメントに関連する情報を抽出し、精製するのを支援する。幾何学的損失(Geometry Loss)は身体の構造的骨格に批判的な制約を与え、モデルの予測が人間の姿勢の自然な限界に合致することを確実にする。
論文参考訳（メタデータ） (2024-06-03T10:59:00Z)
Structure-Aware Human Body Reshaping with Adaptive Affinity-Graph Network [14.361677329761672]
本稿では, 適応親和性グラフネットワーク(Adaptive Affinity-Graph Network, AAGN)を提案する。高周波の詳細については、高周波数領域と空間領域の両方から情報を抽出するために、Body Shape Discriminator (BSD) が設計されている。われわれのフレームワークは写真の美的魅力を著しく向上させ、すべての評価指標において最先端を達成するために、これまでのすべての作業よりはるかに上回っている。
論文参考訳（メタデータ） (2024-04-22T08:44:10Z)
DiffBody: Diffusion-based Pose and Shape Editing of Human Images [1.7188280334580193]
本稿では,アイデンティティを保存した大規模な編集を可能にするワンショットアプローチを提案する。大きな編集を可能にするため、3Dボディモデルに適合し、入力画像を3Dモデルに投影し、身体のポーズと形状を変更する。我々は、自己教師付き学習によるテキスト埋め込みを微調整することで、現実主義をさらに強化する。
論文参考訳（メタデータ） (2024-01-05T13:36:19Z)
Towards Robust and Expressive Whole-body Human Pose and Shape Estimation [51.457517178632756]
全体のポーズと形状の推定は、単眼画像から人体全体の異なる振る舞いを共同で予測することを目的としている。既存の手法では、既存のシナリオの複雑さの下で、しばしば劣化したパフォーマンスを示す。全身のポーズと形状推定の堅牢性を高める新しい枠組みを提案する。
論文参考訳（メタデータ） (2023-12-14T08:17:42Z)
Human as Points: Explicit Point-based 3D Human Reconstruction from Single-view RGB Images [78.56114271538061]
我々はHaPと呼ばれる明示的なポイントベース人間再構築フレームワークを導入する。提案手法は,3次元幾何学空間における完全明示的な点雲推定,操作,生成,洗練が特徴である。我々の結果は、完全に明示的で幾何学中心のアルゴリズム設計へのパラダイムのロールバックを示すかもしれない。
論文参考訳（メタデータ） (2023-11-06T05:52:29Z)
Pose Guided Human Image Synthesis with Partially Decoupled GAN [25.800174118151638]
Pose Guided Human Image Synthesis (PGHIS) は、人間のイメージを基準ポーズから目標ポーズへ変換する難しいタスクである。本研究では,人体を複数の部分に分解し,現実的な人物像の合成を誘導する手法を提案する。さらに,PGHISのためのマルチヘッドアテンションベースモジュールを設計する。
論文参考訳（メタデータ） (2022-10-07T15:31:37Z)
Generalizable Neural Performer: Learning Robust Radiance Fields for Human Novel View Synthesis [52.720314035084215]
この研究は、一般のディープラーニングフレームワークを使用して、任意の人間の演奏者の自由視点画像を合成することを目的としている。我々は、汎用的で堅牢な神経体表現を学習するシンプルな、かつ強力なフレームワーク、Generalizable Neural Performer(GNR)を提案する。 GeneBody-1.0とZJU-Mocapの実験は、最近の最先端の一般化可能な手法よりも、我々の手法の堅牢性を示している。
論文参考訳（メタデータ） (2022-04-25T17:14:22Z)
LatentHuman: Shape-and-Pose Disentangled Latent Representation for Human Bodies [78.17425779503047]
本稿では,人体に対する新しい暗黙の表現法を提案する。完全に微分可能で、非交叉形状で最適化可能であり、潜在空間を映し出す。我々のモデルは、よく設計された損失を伴う、水密でない生データを直接訓練し、微調整することができる。
論文参考訳（メタデータ） (2021-11-30T04:10:57Z)
Structure-aware Person Image Generation with Pose Decomposition and Semantic Correlation [29.727033198797518]
高品質な人物画像生成のための構造認識フローベース手法を提案する。人体を異なる意味部分に分解し、異なるネットワークを適用してこれらの部分のフロー場を別々に予測する。提案手法は,ポーズの相違が大きい場合に高品質な結果を生成することができ,定性比較と定量的比較の両方において最先端の手法より優れる。
論文参考訳（メタデータ） (2021-02-05T03:07:57Z)
Kinematic-Structure-Preserved Representation for Unsupervised 3D Human Pose Estimation [58.72192168935338]
大規模インスタディオデータセットの監視を用いて開発された人間のポーズ推定モデルの一般化可能性については疑問が残る。本稿では,2対あるいは2対の弱い監督者によって抑制されない,新しいキネマティック構造保存型非教師付き3次元ポーズ推定フレームワークを提案する。提案モデルでは,前方運動学,カメラ投影,空間マップ変換という3つの連続的な微分可能変換を用いる。
論文参考訳（メタデータ） (2020-06-24T23:56:33Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。