論文の概要: FantasyStyle: Controllable Stylized Distillation for 3D Gaussian Splatting
- arxiv url: http://arxiv.org/abs/2508.08136v1
- Date: Mon, 11 Aug 2025 16:11:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 21:23:29.198209
- Title: FantasyStyle: Controllable Stylized Distillation for 3D Gaussian Splatting
- Title(参考訳): FantasyStyle:3次元ガウスめっきのための制御可能なスチル化蒸留
- Authors: Yitong Yang, Yinglin Wang, Changshuo Wang, Huajie Wang, Shuting He,
- Abstract要約: 3DGSベースのスタイル転送フレームワークである textbfFantasyStyle を導入する。
我々は,多視点雑音遅延に3Dフィルタを適用し,低周波成分を選択的に低減し,先行競合を緩和することで,クロスビューの整合性を向上させる。
提案手法は最先端の手法を一貫して上回り,様々な場面やスタイルで高いスタイリゼーション品質と視覚的リアリズムを実現する。
- 参考スコア(独自算出の注目度): 7.778588010132252
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The success of 3DGS in generative and editing applications has sparked growing interest in 3DGS-based style transfer. However, current methods still face two major challenges: (1) multi-view inconsistency often leads to style conflicts, resulting in appearance smoothing and distortion; and (2) heavy reliance on VGG features, which struggle to disentangle style and content from style images, often causing content leakage and excessive stylization. To tackle these issues, we introduce \textbf{FantasyStyle}, a 3DGS-based style transfer framework, and the first to rely entirely on diffusion model distillation. It comprises two key components: (1) \textbf{Multi-View Frequency Consistency}. We enhance cross-view consistency by applying a 3D filter to multi-view noisy latent, selectively reducing low-frequency components to mitigate stylized prior conflicts. (2) \textbf{Controllable Stylized Distillation}. To suppress content leakage from style images, we introduce negative guidance to exclude undesired content. In addition, we identify the limitations of Score Distillation Sampling and Delta Denoising Score in 3D style transfer and remove the reconstruction term accordingly. Building on these insights, we propose a controllable stylized distillation that leverages negative guidance to more effectively optimize the 3D Gaussians. Extensive experiments demonstrate that our method consistently outperforms state-of-the-art approaches, achieving higher stylization quality and visual realism across various scenes and styles.
- Abstract(参考訳): 生成および編集アプリケーションにおける3DGSの成功により、3DGSベースのスタイル転送への関心が高まっている。
しかし、現状の手法では、(1)多視点不整合はしばしばスタイルの矛盾を招き、外観の平滑化や歪みを招き、(2)スタイルイメージからスタイルやコンテンツを切り離すのに苦労するVGG機能に大きく依存し、コンテンツ漏洩や過度なスタイリゼーションを招きかねない、という2つの大きな課題に直面している。
これらの問題に対処するため、3DGSベースのスタイル転送フレームワークであるtextbf{FantasyStyle}を導入し、拡散モデル蒸留に完全に依存した最初の例を示す。
1) \textbf{Multi-View Frequency Consistency}。
我々は,多視点雑音遅延に3Dフィルタを適用し,低周波成分を選択的に減らし,事前競合を緩和することで,クロスビューの整合性を向上させる。
(2) \textbf{Controllable Stylized Distillation}
スタイル画像からのコンテンツ漏洩を抑制するため,望ましくないコンテンツを除外するためのネガティブガイダンスを導入する。
さらに, スコア蒸留サンプリングとデルタデノイングスコアの3次元トランスファーにおける限界を同定し, 再構成項を除去する。
これらの知見に基づいて, 負の誘導を生かし, より効果的に3次元ガウスを最適化する制御可能なスタイリング蒸留法を提案する。
広汎な実験により,本手法は最先端の手法を一貫して上回り,様々な場面やスタイルで高いスタイリゼーション品質と視覚的リアリズムを実現していることが示された。
関連論文リスト
- StyleMe3D: Stylization with Disentangled Priors by Multiple Encoders on 3D Gaussians [23.1385740508835]
StyleMe3Dは3D GSスタイルの転送のための総合的なフレームワークである。
マルチモーダルスタイルのコンディショニング、マルチレベルセマンティックアライメント、知覚的品質向上を統合している。
この作品は、フォトリアリスティックな3D GSと芸術的なスタイリング、ゲーム、バーチャルワールド、デジタルアートのアンロックを橋渡しする。
論文 参考訳(メタデータ) (2025-04-21T17:59:55Z) - ConsDreamer: Advancing Multi-View Consistency for Zero-Shot Text-to-3D Generation [46.64928459085584]
本研究では, スコア蒸留プロセスにおける条件項と条件項の両方を精製することにより, ビューバイアスを緩和する新しいフレームワークであるConsDreamerを提案する。
ConsDreamerはテキストから3D生成におけるマルチフェイスのJanus問題を効果的に軽減し、視覚的品質と一貫性の両方において既存の手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-04-03T06:43:23Z) - WaSt-3D: Wasserstein-2 Distance for Scene-to-Scene Stylization on 3D Gaussians [37.139479729087896]
We developed a new style transfer method for 3D scene called WaSt-3D。
トレーニングを必要とせずに、スタイルシーンからコンテンツシーンに詳細を忠実に転送する。
WaSt-3Dは、トレーニングを必要とせずに、さまざまなコンテンツやスタイルシーンに一貫して結果を提供する。
論文 参考訳(メタデータ) (2024-09-26T15:02:50Z) - ZePo: Zero-Shot Portrait Stylization with Faster Sampling [61.14140480095604]
本稿では,4つのサンプリングステップでコンテンツとスタイルの融合を実現する拡散モデルに基づく,インバージョンフリーなポートレートスタイリングフレームワークを提案する。
本稿では,一貫性機能における冗長な特徴をマージする機能統合戦略を提案し,注意制御の計算負荷を低減させる。
論文 参考訳(メタデータ) (2024-08-10T08:53:41Z) - StylizedGS: Controllable Stylization for 3D Gaussian Splatting [53.0225128090909]
StylizedGSは知覚因子を適応的に制御する効率的な3Dニューラルスタイル転送フレームワークである。
本手法は,忠実なブラシストロークとフレキシブル制御による幾何整合性を特徴とする高品質なスタイリゼーションを実現する。
論文 参考訳(メタデータ) (2024-04-08T06:32:11Z) - GaussianStyle: Gaussian Head Avatar via StyleGAN [64.85782838199427]
本稿では,3DGSのボリューム強度とStyleGANの強力な暗黙表現を統合する新しいフレームワークを提案する。
提案手法は, 再現性, 新規なビュー合成, アニメーションにおける最先端性能を実現する。
論文 参考訳(メタデータ) (2024-02-01T18:14:42Z) - StyleNeRF: A Style-based 3D-Aware Generator for High-resolution Image
Synthesis [92.25145204543904]
StyleNeRFは高解像度画像合成のための3次元認識型生成モデルである。
ニューラル放射場(NeRF)をスタイルベースジェネレータに統合する。
高品質な3D一貫性を維持しながら、対話的な速度で高解像度画像を合成することができる。
論文 参考訳(メタデータ) (2021-10-18T02:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。