Fugu-MT 論文翻訳(概要): HandCraft: Anatomically Correct Restoration of Malformed Hands in Diffusion Generated Images

論文の概要: HandCraft: Anatomically Correct Restoration of Malformed Hands in Diffusion Generated Images

arxiv url: http://arxiv.org/abs/2411.04332v1
Date: Thu, 07 Nov 2024 00:14:39 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:45.178113
Title: HandCraft: Anatomically Correct Restoration of Malformed Hands in Diffusion Generated Images
Title（参考訳）: 手工芸品:拡散画像における奇形ハンドの解剖学的復元
Authors: Zhenyue Qin, Yiqun Zhang, Yang Liu, Dylan Campbell,
Abstract要約: このような不正な手を取り戻すためのHandCraftを提案する。これは、手のためのマスクと奥行き画像を自動的にコンディショニング信号として構築することで実現される。我々のプラグアンドプレイハンド修復ソリューションは、既存の事前訓練拡散モデルと互換性がある。
参考スコア（独自算出の注目度）: 20.81706200561224
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Generative text-to-image models, such as Stable Diffusion, have demonstrated a remarkable ability to generate diverse, high-quality images. However, they are surprisingly inept when it comes to rendering human hands, which are often anatomically incorrect or reside in the "uncanny valley". In this paper, we propose a method HandCraft for restoring such malformed hands. This is achieved by automatically constructing masks and depth images for hands as conditioning signals using a parametric model, allowing a diffusion-based image editor to fix the hand's anatomy and adjust its pose while seamlessly integrating the changes into the original image, preserving pose, color, and style. Our plug-and-play hand restoration solution is compatible with existing pretrained diffusion models, and the restoration process facilitates adoption by eschewing any fine-tuning or training requirements for the diffusion models. We also contribute MalHand datasets that contain generated images with a wide variety of malformed hands in several styles for hand detector training and hand restoration benchmarking, and demonstrate through qualitative and quantitative evaluation that HandCraft not only restores anatomical correctness but also maintains the integrity of the overall image.
Abstract（参考訳）: 安定拡散(Stable Diffusion)のような生成的テキスト・画像モデルでは、多様な高品質な画像を生成できることが顕著に示されている。しかし、人間の手は解剖学的に間違っているか、「不気味な谷」に住んでいる。本論文では,このような不整形手を復元するためのHandCraftを提案する。これは、パラメトリックモデルを用いて、手のためのマスクと奥行き画像を自動的に条件付け信号として構成し、拡散ベースの画像エディタが手の解剖を修正し、元の画像にシームレスに統合し、ポーズ、色、スタイルを保存することで達成される。我々のプラグアンドプレイハンド修復ソリューションは、既存の事前訓練された拡散モデルと互換性があり、この復元プロセスは、拡散モデルに対する微調整や訓練の要求を緩和することによって、導入を促進する。また、手指検出訓練や手指復元ベンチマークのための様々なスタイルで、多種多様な不整形画像を含むMalHandデータセットを寄贈し、HandCraftが解剖学的正確性を回復するだけでなく、全体像の整合性も維持していることを示す定性的かつ定量的評価を行った。

関連論文リスト

3D Hand Mesh-Guided AI-Generated Malformed Hand Refinement with Hand Pose Transformation via Diffusion Model [40.20849519857311]
本稿では,拡散パイプラインを用いた3次元メッシュ誘導精製フレームワークを提案する。トレーニングのために、RGB画像と3Dハンドメッシュからなるデータセットを収集し、再注釈する。次に,3次元ハンドメッシュで導かれる洗練された出力を生成する拡散塗装モデルを設計する。
論文参考訳（メタデータ） (2025-06-15T01:30:22Z)
Hand-Shadow Poser [119.01376087903874]
手影芸術は、創造的に手影を使って、壁の表現的な形を再現する、魅惑的な芸術形式である。本研究では,対象の形状が与えられた場合,入力に類似した影を生成する左右の手のポーズを求める。これらの課題に対処するために、3段階のパイプラインであるHand-Shadow Poserを設計し、(手で)解剖学的制約と(シャドー形状で)意味論的制約を分離します。
論文参考訳（メタデータ） (2025-05-11T15:15:35Z)
MGHanD: Multi-modal Guidance for authentic Hand Diffusion [25.887930576638293]
MGHanDは、現実的な人間の手を生成する際の永続的な課題に対処する。実画像と生成された画像とキャプションのペアからなるデータセット上で訓練された識別器を用いる。また,手からより詳細な指示への方向学習を行うLoRAアダプタによるテキストガイダンスも採用している。
論文参考訳（メタデータ） (2025-03-11T07:51:47Z)
FoundHand: Large-Scale Domain-Specific Learning for Controllable Hand Image Generation [11.843140646170458]
単手画像と双手画像のための大規模ドメイン固有拡散モデルFoundHandを提案する。 2Dキーポイントとセグメンテーションマスクアノテーションを備えた大規模ハンドデータセットであるFoundHand-10Mを使用している。本モデルでは,手の動きを再現したり,手の動きを伝達したり,新しいビューを合成したりといった,中核的な機能を示す。
論文参考訳（メタデータ） (2024-12-03T18:58:19Z)
Overcoming False Illusions in Real-World Face Restoration with Multi-Modal Guided Diffusion Model [55.46927355649013]
本稿では,新しいマルチモーダル・リアル・ワールド・フェイス・リカバリ技術を紹介する。 MGFRは偽の顔の特徴とアイデンティティの生成を緩和することができる。 5000のアイデンティティにまたがる23,000以上の高解像度の顔画像からなるReface-HQデータセットを提案する。
論文参考訳（メタデータ） (2024-10-05T13:46:56Z)
RHanDS: Refining Malformed Hands for Generated Images with Decoupled Structure and Style Guidance [41.213241942526935]
拡散モデルは高品質な人間の画像を生成することができるが、それらの応用は正しい構造を持つ手を生成する不安定性によって制限される。共役構造とスタイルガイダンスの助けを借りて手領域を洗練するための条件付き拡散型フレームワーク RHanDS を提案する。実験の結果,RHanDSは従来の手法と比較して手の構造とスタイルを効果的に洗練できることがわかった。
論文参考訳（メタデータ） (2024-04-22T08:44:34Z)
Giving a Hand to Diffusion Models: a Two-Stage Approach to Improving Conditional Human Image Generation [29.79050316749927]
ポーズ条件付き人体画像生成に新たなアプローチを導入し,その過程を2段階に分けた。両ステージの結果をコヒーレントな方法で組み合わせた第2段階のハンドディテールを維持するために, 新規なブレンディング技術が導入された。提案手法は生成した手の品質を向上するだけでなく、ポーズ条件付き人体画像生成の能力を向上させるとともに、手ポーズの制御も改善する。
論文参考訳（メタデータ） (2024-03-15T23:31:41Z)
HanDiffuser: Text-to-Image Generation With Realistic Hand Appearances [34.50137847908887]
テキスト・ツー・イメージ生成モデルは高品質な人間を生み出すことができるが、現実主義は手を生成する際に失われる。一般的なアーティファクトには、不規則な手ポーズ、形、不正確な指の数、物理的に不明瞭な指の向きなどがある。そこで我々はHanDiffuserという新しい拡散型アーキテクチャを提案する。
論文参考訳（メタデータ） (2024-03-04T03:00:22Z)
HandRefiner: Refining Malformed Hands in Generated Images by Diffusion-based Conditional Inpainting [72.95232302438207]
拡散モデルは現実的な画像の生成において顕著な成功を収めた。しかし、不正確な指数や不規則な形など、正確な人間の手を生成することに苦しむ。本稿では,HandRefinerという軽量な後処理ソリューションを提案する。
論文参考訳（メタデータ） (2023-11-29T08:52:08Z)
Towards Safe Self-Distillation of Internet-Scale Text-to-Image Diffusion Models [63.20512617502273]
テキストから画像への拡散モデルにおいて,問題のあるコンテンツ生成を防止するため,SDDと呼ばれる手法を提案する。本手法は,画像の全体的な品質を劣化させることなく,生成した画像から有害なコンテンツをはるかに多く除去する。
論文参考訳（メタデータ） (2023-07-12T07:48:29Z)
ReGeneration Learning of Diffusion Models with Rich Prompts for Zero-Shot Image Translation [8.803251014279502]
大規模なテキスト・ツー・イメージモデルは、多彩で高忠実な画像を合成する素晴らしい能力を示した。現在のモデルでは、編集プロセス中に元の画像の内容に大きな変更を加えることができる。画像と画像の拡散モデル(ReDiffuser)における再生学習を提案する。
論文参考訳（メタデータ） (2023-05-08T12:08:12Z)
HandNeRF: Neural Radiance Fields for Animatable Interacting Hands [122.32855646927013]
神経放射場(NeRF)を用いて手の動きを正確に再現する新しい枠組みを提案する。我々は,提案するHandNeRFのメリットを検証するための広範囲な実験を行い,その成果を報告する。
論文参考訳（メタデータ） (2023-03-24T06:19:19Z)
Deformer: Dynamic Fusion Transformer for Robust Hand Pose Estimation [59.3035531612715]
既存の方法では、手のこもりが強かったり、ぼやけたりすると、手のポーズが難しい場合が多い。ビデオでは、手の動きによって、片方のフレームに隠されたり、ぼやけたりして、手のさまざまな部分を観察することができる。画像内の手の部分間の関係を暗黙的に推論するフレームワークであるDeformerを提案する。
論文参考訳（メタデータ） (2023-03-09T02:24:30Z)
Embodied Hands: Modeling and Capturing Hands and Bodies Together [61.32931890166915]
人間は、コミュニケーションとタスクの解決のために、手と体を一緒に移動します。ほとんどの方法は、体と手の3Dモデリングと追跡を別々に扱う。我々は、手と体の相互作用をモデルとして定式化し、それをフルボディの4Dシーケンスに適合させる。
論文参考訳（メタデータ） (2022-01-07T18:59:32Z)
Leveraging Photometric Consistency over Time for Sparsely Supervised Hand-Object Reconstruction [118.21363599332493]
本稿では,ビデオ中のフレームの粗いサブセットに対してのみアノテーションが利用できる場合に,時間とともに光度整合性を活用する手法を提案する。本モデルでは,ポーズを推定することにより,手や物体を3Dで共同で再構成するカラーイメージをエンドツーエンドに訓練する。提案手法は,3次元手動画像再構成の精度向上に有効であることを示す。
論文参考訳（メタデータ） (2020-04-28T12:03:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。