論文の概要: Structure-Aware Human Body Reshaping with Adaptive Affinity-Graph Network
- arxiv url: http://arxiv.org/abs/2404.13983v1
- Date: Mon, 22 Apr 2024 08:44:10 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-23 14:45:41.414776
- Title: Structure-Aware Human Body Reshaping with Adaptive Affinity-Graph Network
- Title(参考訳): 適応親和性グラフネットワークを用いた構造認識型人体再構成
- Authors: Qiwen Deng, Yangcen Liu, Wen Li, Guoqing Wang,
- Abstract要約: 本稿では, 適応親和性グラフネットワーク(Adaptive Affinity-Graph Network, AAGN)を提案する。
高周波の詳細については、高周波数領域と空間領域の両方から情報を抽出するために、Body Shape Discriminator (BSD) が設計されている。
われわれのフレームワークは写真の美的魅力を著しく向上させ、すべての評価指標において最先端を達成するために、これまでのすべての作業よりはるかに上回っている。
- 参考スコア(独自算出の注目度): 14.361677329761672
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Given a source portrait, the automatic human body reshaping task aims at editing it to an aesthetic body shape. As the technology has been widely used in media, several methods have been proposed mainly focusing on generating optical flow to warp the body shape. However, those previous works only consider the local transformation of different body parts (arms, torso, and legs), ignoring the global affinity, and limiting the capacity to ensure consistency and quality across the entire body. In this paper, we propose a novel Adaptive Affinity-Graph Network (AAGN), which extracts the global affinity between different body parts to enhance the quality of the generated optical flow. Specifically, our AAGN primarily introduces the following designs: (1) we propose an Adaptive Affinity-Graph (AAG) Block that leverages the characteristic of a fully connected graph. AAG represents different body parts as nodes in an adaptive fully connected graph and captures all the affinities between nodes to obtain a global affinity map. The design could better improve the consistency between body parts. (2) Besides, for high-frequency details are crucial for photo aesthetics, a Body Shape Discriminator (BSD) is designed to extract information from both high-frequency and spatial domain. Particularly, an SRM filter is utilized to extract high-frequency details, which are combined with spatial features as input to the BSD. With this design, BSD guides the Flow Generator (FG) to pay attention to various fine details rather than rigid pixel-level fitting. Extensive experiments conducted on the BR-5K dataset demonstrate that our framework significantly enhances the aesthetic appeal of reshaped photos, marginally surpassing all previous work to achieve state-of-the-art in all evaluation metrics.
- Abstract(参考訳): 人体自動整形作業は、人体を美的体型に編集することを目的としている。
この技術はメディアで広く使われてきたため、主に体形を歪めるための光学フローの生成に焦点を当てたいくつかの手法が提案されている。
しかし、これらの以前の研究は、異なる身体部分(腕、胴体、脚)の局所的な変換のみを考慮し、世界的親和性を無視し、身体全体の一貫性と品質を確保する能力を制限するだけであった。
本稿では,各部位間の大域的親和性を抽出し,生成した光フローの品質を向上させる適応親和性グラフネットワーク(AAGN)を提案する。
具体的には,(1)完全連結グラフの特性を利用する適応親和性グラフブロック(AAG)を提案する。
AAGは、適応的な完全連結グラフのノードとして異なる身体の部分を表し、ノード間のすべての親和性をキャプチャして、グローバル親和性マップを得る。
この設計により、ボディ部品間の一貫性が向上する可能性がある。
2) 写真美学において高周波の詳細は不可欠であり, 身体形状識別器 (BSD) は高周波領域と空間領域の両方から情報を抽出するように設計されている。
特に、SRMフィルタを用いて高周波の詳細を抽出し、BSDへの入力として空間的特徴と組み合わせる。
この設計により、BSDはフロージェネレータ (FG) をガイドし、より厳密なピクセルレベルのフィッティングではなく、様々な細部に注意を払っている。
BR-5Kデータセットを用いて行った広範囲な実験により、我々のフレームワークは画像の美的魅力を著しく向上させ、すべての評価指標において最先端を達成するために、過去の全ての研究をわずかに上回る結果となった。
関連論文リスト
- GASA-UNet: Global Axial Self-Attention U-Net for 3D Medical Image Segmentation [8.939740171704388]
本稿では,GTA(Global Axial Self-Attention)ブロックを特徴とする改良されたU-Net型モデルを提案する。
このブロックは、異なる解剖学的断面を表す各2次元平面で、画像データを3次元実体として処理する。
我々のモデルは,特に小解剖学的構造に対して,セグメンテーション性能の有望な改善を証明した。
論文 参考訳(メタデータ) (2024-09-20T01:23:53Z) - BEFUnet: A Hybrid CNN-Transformer Architecture for Precise Medical Image
Segmentation [0.0]
本稿では,医療画像の正確な分割のために,身体情報とエッジ情報の融合を強化するBEFUnetという,革新的なU字型ネットワークを提案する。
BEFUnetは、新しいローカル・クロス・アテンション・フィーチャー(LCAF)融合モジュール、新しいダブル・レベル・フュージョン(DLF)モジュール、デュアルブランチ・エンコーダの3つの主要モジュールから構成されている。
LCAFモジュールは、2つのモダリティの間に空間的に近接する特徴に対して、局所的な相互注意を選択的に行うことにより、エッジとボディの特徴を効率よく融合させる。
論文 参考訳(メタデータ) (2024-02-13T21:03:36Z) - Guided Image Restoration via Simultaneous Feature and Image Guided
Fusion [67.30078778732998]
本稿では,SFIGFネットワークを提案する。
GF ( guided filter) のメカニズムに従って, 特徴量と画像レベルの誘導核融合を考察する。
特徴領域と画像領域の両方で誘導融合が実装されているため,提案したSFIGFは文脈情報とテキスト情報の両方を忠実に再構築することが期待される。
論文 参考訳(メタデータ) (2023-12-14T12:15:45Z) - Distance Weighted Trans Network for Image Completion [52.318730994423106]
本稿では,DWT(Distance-based Weighted Transformer)を利用した画像コンポーネント間の関係をよりよく理解するためのアーキテクチャを提案する。
CNNは、粗い事前の局所的なテクスチャ情報を強化するために使用される。
DWTブロックは、特定の粗いテクスチャやコヒーレントな視覚構造を復元するために使用される。
論文 参考訳(メタデータ) (2023-10-11T12:46:11Z) - Affinity Feature Strengthening for Accurate, Complete and Robust Vessel
Segmentation [48.638327652506284]
血管セグメンテーションは、冠動脈狭窄、網膜血管疾患、脳動脈瘤などの多くの医学的応用において重要である。
コントラストに敏感なマルチスケールアフィニティアプローチを用いて,幾何学的手法と画素単位のセグメンテーション特徴を連成的にモデル化する新しいアプローチであるAFNを提案する。
論文 参考訳(メタデータ) (2022-11-12T05:39:17Z) - SIAN: Style-Guided Instance-Adaptive Normalization for Multi-Organ
Histopathology Image Synthesis [63.845552349914186]
本研究では,異なる臓器に対して,現実的な色分布とテクスチャを合成するためのスタイル誘導型インスタンス適応正規化(SIAN)を提案する。
4つのフェーズは一緒に動作し、生成ネットワークに統合され、イメージセマンティクス、スタイル、インスタンスレベルのバウンダリを埋め込む。
論文 参考訳(メタデータ) (2022-09-02T16:45:46Z) - Skeleton-Parted Graph Scattering Networks for 3D Human Motion Prediction [120.08257447708503]
体-関節関係をモデル化するグラフ畳み込みネットワークに基づく手法は,最近3次元骨格に基づく人間の動作予測において大きな可能性を示唆している。
骨格分割グラフ散乱ネットワーク(SPGSN)を提案する。
SPGSNは、Human3.6M、CMU Mocap、および3DPWデータセット上で、関節位置誤差(MPJPE)当たりの3D平均の13.8%、9.3%、および2.7%の差で最先端の手法を上回っている。
論文 参考訳(メタデータ) (2022-07-31T05:51:39Z) - Structure-Aware Flow Generation for Human Body Reshaping [15.365236395118982]
我々は,任意のポーズや服装で前例のない制御可能な性能を実現するために,エンドツーエンドのフロー生成アーキテクチャを開発した。
包括的評価のために, BR-5Kという, 初めての大規模ボディーリフォーミングデータセットを構築した。
提案手法は, 視覚性能, 制御性, 効率の面で, 既存の最先端手法を著しく上回っている。
論文 参考訳(メタデータ) (2022-03-09T12:22:38Z) - Cross-Domain Facial Expression Recognition: A Unified Evaluation
Benchmark and Adversarial Graph Learning [85.6386289476598]
我々は,クロスドメイン全体的特徴共適応のための新しい逆グラフ表現適応(AGRA)フレームワークを開発した。
我々は,いくつかの一般的なベンチマークで広範囲かつ公平な評価を行い,提案したAGRAフレームワークが従来の最先端手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-08-03T15:00:31Z) - Feedback Graph Attention Convolutional Network for Medical Image
Enhancement [32.95483574100177]
フィードバックグラフ注意畳み込みネットワーク(FB-GACN)という新しいバイオメディカル画像強調ネットワークを提案する。
重要なイノベーションとして、画像サブリージョンからグラフネットワークを構築することにより、画像のグローバルな構造を考える。
実験の結果,提案アルゴリズムは最先端手法よりも優れていた。
論文 参考訳(メタデータ) (2020-06-24T16:46:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。