論文の概要: Wukong's 72 Transformations: High-fidelity Textured 3D Morphing via Flow Models
- arxiv url: http://arxiv.org/abs/2511.22425v1
- Date: Thu, 27 Nov 2025 13:03:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.57187
- Title: Wukong's 72 Transformations: High-fidelity Textured 3D Morphing via Flow Models
- Title(参考訳): Wukong氏の72の変換:フローモデルによる高忠実なテクスチャ型3Dモーフィング
- Authors: Minghao Yin, Yukang Cao, Kai Han,
- Abstract要約: WUKONGは、高忠実なテクスチャ3Dモーフィングのためのトレーニングフリーフレームワークである。
フローベース生成プロセスの本質的連続性を利用する。
類似性誘導型セマンティック一貫性機構を提案する。
- 参考スコア(独自算出の注目度): 33.80986417412425
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present WUKONG, a novel training-free framework for high-fidelity textured 3D morphing that takes a pair of source and target prompts (image or text) as input. Unlike conventional methods -- which rely on manual correspondence matching and deformation trajectory estimation (limiting generalization and requiring costly preprocessing) -- WUKONG leverages the generative prior of flow-based transformers to produce high-fidelity 3D transitions with rich texture details. To ensure smooth shape transitions, we exploit the inherent continuity of flow-based generative processes and formulate morphing as an optimal transport barycenter problem. We further introduce a sequential initialization strategy to prevent abrupt geometric distortions and preserve identity coherence. For faithful texture preservation, we propose a similarity-guided semantic consistency mechanism that selectively retains high-frequency details and enables precise control over blending dynamics. This avoids common artifacts like oversmoothing while maintaining semantic fidelity. Extensive quantitative and qualitative evaluations demonstrate that WUKONG significantly outperforms state-of-the-art methods, achieving superior results across diverse geometry and texture variations.
- Abstract(参考訳): We present WUKONG, a novel training-free framework for high-fidelity textured 3Dmorphing that take a pair of source and target prompts (image or text) as input。
WUKONGは、手動の対応マッチングと変形軌道推定(一般化の制限とコストのかかる前処理)に依存する従来の手法とは異なり、フローベースのトランスフォーマーの生成前の手法を活用して、リッチテクスチャの詳細を持った高忠実な3Dトランジションを生成する。
円滑な形状遷移を保証するため,フローベース生成過程の固有連続性と定式化を最適な輸送バリセンタ問題として活用する。
さらに、急激な幾何学的歪みを防止し、アイデンティティの一貫性を維持するために、逐次初期化戦略を導入する。
忠実なテクスチャ保存のために,高頻度の詳細を選択的に保持し,ブレンディングダイナミクスを正確に制御できる類似性誘導型セマンティック一貫性機構を提案する。
これにより、セマンティックな忠実さを維持しながら、オーバースムーシングのような一般的なアーティファクトを避けることができる。
広汎な定量的および定性的評価は、WUKONGが最先端の手法を著しく上回り、様々な幾何学やテクスチャのバリエーションで優れた結果が得られることを示した。
関連論文リスト
- Edit2Perceive: Image Editing Diffusion Models Are Strong Dense Perceivers [55.15722080205737]
Edit2Perceiveは、深度、正規度、マッティングの編集モデルを適応させる統合拡散フレームワークである。
私たちの単一ステップの決定論的推論は、比較的小さなデータセットでトレーニングしながら、より高速なランタイムをもたらす。
論文 参考訳(メタデータ) (2025-11-24T01:13:51Z) - AnchorDS: Anchoring Dynamic Sources for Semantically Consistent Text-to-3D Generation [56.399153019429605]
この研究は、源動力学を無視すると、意味的手がかりを抑えるまたはマージする矛盾した軌跡が得られることを示している。
我々は、動的に変化するソース分布を固定されたターゲット分布にマッピングするものとして、テキストから3Dまでの最適化を再構成する。
AnchorDS(AnchorDS)は、画像の条件に応じた状態適応型ガイダンスを提供する、改良されたスコア蒸留機構である。
論文 参考訳(メタデータ) (2025-11-12T09:51:23Z) - FLOWING: Implicit Neural Flows for Structure-Preserving Morphing [5.498230316788923]
FLOWing (FLOW morphing) は、微分ベクトルフローの構成としてワープをリキャストするフレームワークである。
FLOWINGは, より高速な収束により, 最先端の変形品質が得られることを示す。
論文 参考訳(メタデータ) (2025-10-10T16:50:23Z) - Solving Inverse Problems with FLAIR [68.87167940623318]
本稿では,フローベース生成モデルを逆問題に先立って活用する学習自由変分フレームワークFLAIRを提案する。
標準画像ベンチマークの結果、FLAIRは再現性やサンプルの多様性の観点から、既存の拡散法や流れ法よりも一貫して優れていることが示された。
論文 参考訳(メタデータ) (2025-06-03T09:29:47Z) - Textured 3D Regenerative Morphing with 3D Diffusion Prior [29.7508625572437]
テクスチャ化された3Dモーフィングは、2つの3Dオブジェクト間の滑らかで可塑性なシーケンスを生成する。
従来は点対点対応の確立と滑らかな変形軌跡の決定に頼っていた。
本稿では,3次元拡散を用いた3次元再生型モーフィング法を提案する。
論文 参考訳(メタデータ) (2025-02-20T07:02:22Z) - TFS-NeRF: Template-Free NeRF for Semantic 3D Reconstruction of Dynamic Scene [25.164085646259856]
本稿では,スパースやシングルビューRGBビデオから撮影したダイナミックシーンのためのテンプレートレス3DセマンティックNeRFを提案する。
相互作用する物体の動きを遠ざけ, 濃度ごとのスキン厚みを最適化することにより, 高精度でセマンティックに分離可能なジオメトリを効率的に生成する。
論文 参考訳(メタデータ) (2024-09-26T01:34:42Z) - Training and Tuning Generative Neural Radiance Fields for Attribute-Conditional 3D-Aware Face Generation [66.21121745446345]
本稿では,特定の属性ラベルを入力として統合した条件付きGNeRFモデルを提案する。
提案手法は, 事前学習した3次元顔モデルに基づいており, 条件付き正規化フローモジュールをトレーニングするためのTraining as Init and fidelity for Tuning (TRIOT) 方式を提案する。
本実験は,ビューの整合性を高めた高品質な編集を行う能力を示すとともに,本モデルの有効性を実証するものである。
論文 参考訳(メタデータ) (2022-08-26T10:05:39Z) - High-resolution Face Swapping via Latent Semantics Disentanglement [50.23624681222619]
本稿では,事前学習したGANモデルの事前知識を用いた,新しい高分解能幻覚顔交換法を提案する。
我々は、ジェネレータの進行的な性質を利用して、潜在意味論を明示的に解き放つ。
我々は,2時間制約を潜時空間と画像空間に課すことにより,映像面スワップに拡張する。
論文 参考訳(メタデータ) (2022-03-30T00:33:08Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。