論文の概要: Walking the Schrödinger Bridge: A Direct Trajectory for Text-to-3D Generation
- arxiv url: http://arxiv.org/abs/2511.05609v1
- Date: Thu, 06 Nov 2025 09:21:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:44.492063
- Title: Walking the Schrödinger Bridge: A Direct Trajectory for Text-to-3D Generation
- Title(参考訳): シュレーディンガー橋の歩行:3次元テキスト生成のための直接軌道
- Authors: Ziying Li, Xuequan Lu, Xinkui Zhao, Guanjie Cheng, Shuiguang Deng, Jianwei Yin,
- Abstract要約: 本稿では,新しいテキストから3D生成フレームワークであるTray-Centric Distillation (TraCe)を紹介する。
TraCeは、最先端技術よりも優れた品質と忠実性を実現している。
- 参考スコア(独自算出の注目度): 51.337622918786074
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recent advancements in optimization-based text-to-3D generation heavily rely on distilling knowledge from pre-trained text-to-image diffusion models using techniques like Score Distillation Sampling (SDS), which often introduce artifacts such as over-saturation and over-smoothing into the generated 3D assets. In this paper, we address this essential problem by formulating the generation process as learning an optimal, direct transport trajectory between the distribution of the current rendering and the desired target distribution, thereby enabling high-quality generation with smaller Classifier-free Guidance (CFG) values. At first, we theoretically establish SDS as a simplified instance of the Schr\"odinger Bridge framework. We prove that SDS employs the reverse process of an Schr\"odinger Bridge, which, under specific conditions (e.g., a Gaussian noise as one end), collapses to SDS's score function of the pre-trained diffusion model. Based upon this, we introduce Trajectory-Centric Distillation (TraCe), a novel text-to-3D generation framework, which reformulates the mathematically trackable framework of Schr\"odinger Bridge to explicitly construct a diffusion bridge from the current rendering to its text-conditioned, denoised target, and trains a LoRA-adapted model on this trajectory's score dynamics for robust 3D optimization. Comprehensive experiments demonstrate that TraCe consistently achieves superior quality and fidelity to state-of-the-art techniques.
- Abstract(参考訳): SDS(Score Distillation Sampling)のような技術を用いて、事前に訓練されたテキストから画像への拡散モデルから知識を抽出し、過飽和や過平滑化などのアーティファクトを生成された3D資産に導入することも多い。
本稿では、生成過程を、現在のレンダリングの分布と所望のターゲット分布との間の最適かつ直接的な輸送経路の学習として定式化し、より小さな分類自由誘導(CFG)値で高品質な生成を可能にすることにより、この本質的な問題に対処する。
まず,SDS を Schr\"odinger Bridge フレームワークの簡易な例として理論的に確立する。
我々はSDSがシュリンガーブリッジの逆過程を用いており、特定の条件(例えばガウスノイズを一端とする)の下では、事前訓練された拡散モデルのSDSのスコア関数に崩壊することを示す。
そこで本研究では,Shr\"odinger Bridgeの数学的に追跡可能なフレームワークを再構成し,現行のレンダリングからテキスト条件で記述されたターゲットへの拡散ブリッジを明示的に構築し,ロラ適応モデルを用いて3次元の高調な最適化を行う,新しいテキスト・ツー・3D生成フレームワークであるトラジェクトリ・セントリック蒸留(TraCe)を導入する。
総合的な実験により、TraCeは最先端技術よりも優れた品質と忠実性を一貫して達成している。
関連論文リスト
- Score Distillation of Flow Matching Models [67.86066177182046]
我々は、Score Identity Distillation (SiD) を事前訓練されたテキスト対画像フローマッチングモデルに拡張する。
SiDは、データフリーとデータアシストの両方の設定で、これらのモデルですぐに使える。
これは、スコア蒸留がテキストと画像のフローマッチングモデルに広く適用されるという最初の体系的な証拠を提供する。
論文 参考訳(メタデータ) (2025-09-29T17:45:48Z) - A Lesson in Splats: Teacher-Guided Diffusion for 3D Gaussian Splats Generation with 2D Supervision [65.33043028101471]
本稿では,2次元監視のみを用いた3次元画像調和拡散モデルの学習フレームワークを提案する。
既存の3D生成モデルは、大規模な3Dデータセットが不足しているため、完全に3Dの監視に依存している。
論文 参考訳(メタデータ) (2024-12-01T00:29:57Z) - DreamMapping: High-Fidelity Text-to-3D Generation via Variational Distribution Mapping [20.7584503748821]
SDS (Score Distillation Sampling) はテキストから3D生成の一般的な技術として登場し、テキストから2Dのガイダンスからビュー依存情報を蒸留することで3Dコンテンツ作成を可能にする。
我々は、SDSの徹底的な解析を行い、その定式化を洗練し、中心となる設計はレンダリングされた画像の分布をモデル化することである。
本稿では,分散に基づく生成の劣化事例として,画像の描画を考慮し,分散モデリングプロセスの迅速化を図る,変分分布マッピング (VDM) という新しい手法を提案する。
論文 参考訳(メタデータ) (2024-09-08T14:04:48Z) - FlowDreamer: Exploring High Fidelity Text-to-3D Generation via Rectified Flow [17.919092916953183]
本研究では,フロードレーマーという新しいフレームワークを提案し,よりリッチなテキストの詳細とより高速なコンバージェンスで高忠実度な結果を得る。
鍵となる洞察は、修正流れモデルの結合性と可逆性を利用して、対応する雑音を探索することである。
我々は,同じ軌道に沿って3次元モデルを最適化するために,新しい一様マッチング結合(UCM)損失を導入する。
論文 参考訳(メタデータ) (2024-08-09T11:40:20Z) - Learn to Optimize Denoising Scores for 3D Generation: A Unified and
Improved Diffusion Prior on NeRF and 3D Gaussian Splatting [60.393072253444934]
本稿では,3次元生成タスクの拡散先行性向上を目的とした統合フレームワークを提案する。
拡散先行と拡散モデルの訓練手順の相違を同定し、3次元生成の質を著しく損なう。
論文 参考訳(メタデータ) (2023-12-08T03:55:34Z) - Diffusion-based 3D Object Detection with Random Boxes [58.43022365393569]
既存のアンカーベースの3D検出方法は、アンカーの実証的な設定に依存しており、アルゴリズムはエレガンスを欠いている。
提案するDiff3Detは,検出ボックスを生成対象として考慮し,拡散モデルから3次元オブジェクト検出のための提案生成へ移行する。
推論段階では、モデルは予測結果にランダムボックスのセットを徐々に洗練する。
論文 参考訳(メタデータ) (2023-09-05T08:49:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。