論文の概要: Few-step Flow for 3D Generation via Marginal-Data Transport Distillation
- arxiv url: http://arxiv.org/abs/2509.04406v1
- Date: Thu, 04 Sep 2025 17:24:31 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-05 20:21:10.23334
- Title: Few-step Flow for 3D Generation via Marginal-Data Transport Distillation
- Title(参考訳): マルジナル・データ・トランスポート蒸留による3次元生成のための数ステップフロー
- Authors: Zanwei Zhou, Taoran Yi, Jiemin Fang, Chen Yang, Lingxi Xie, Xinggang Wang, Wei Shen, Qi Tian,
- Abstract要約: 数段階の3次元流体蒸留のための新しいフレームワーク MDT-dist を提案する。
我々のアプローチは、事前訓練されたモデルを蒸留して、Marginal-Data Transportを学習する、という第一の目的に基づいて構築されている。
提案手法は,A800におけるA800の9.0倍,6.5倍の速度で0.68s (1 Step x2) と0.94s (2 Step x2) のレイテンシを実現するため,各流れトランスのサンプリングステップを25から2に短縮する。
- 参考スコア(独自算出の注目度): 104.76254102015794
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Flow-based 3D generation models typically require dozens of sampling steps during inference. Though few-step distillation methods, particularly Consistency Models (CMs), have achieved substantial advancements in accelerating 2D diffusion models, they remain under-explored for more complex 3D generation tasks. In this study, we propose a novel framework, MDT-dist, for few-step 3D flow distillation. Our approach is built upon a primary objective: distilling the pretrained model to learn the Marginal-Data Transport. Directly learning this objective needs to integrate the velocity fields, while this integral is intractable to be implemented. Therefore, we propose two optimizable objectives, Velocity Matching (VM) and Velocity Distillation (VD), to equivalently convert the optimization target from the transport level to the velocity and the distribution level respectively. Velocity Matching (VM) learns to stably match the velocity fields between the student and the teacher, but inevitably provides biased gradient estimates. Velocity Distillation (VD) further enhances the optimization process by leveraging the learned velocity fields to perform probability density distillation. When evaluated on the pioneer 3D generation framework TRELLIS, our method reduces sampling steps of each flow transformer from 25 to 1 or 2, achieving 0.68s (1 step x 2) and 0.94s (2 steps x 2) latency with 9.0x and 6.5x speedup on A800, while preserving high visual and geometric fidelity. Extensive experiments demonstrate that our method significantly outperforms existing CM distillation methods, and enables TRELLIS to achieve superior performance in few-step 3D generation.
- Abstract(参考訳): フローベースの3D生成モデルは通常、推論中に数十のサンプリングステップを必要とする。
特にCM(Consistency Models, Consistency Models)は2次元拡散モデルの加速において大きな進歩を遂げているが、より複雑な3次元生成タスクでは未探索のままである。
本研究では, MDT-dist という新しいフレームワークを, 数段階の3次元流体蒸留のためのフレームワークとして提案する。
我々のアプローチは、事前訓練されたモデルを蒸留して、Marginal-Data Transportを学習する、という第一の目的に基づいて構築されている。
この目的を直接学習するには速度場を統合する必要があるが、この積分の実装は困難である。
そこで我々は,速度マッチング (VM) と速度蒸留 (VD) という2つの最適化可能な目標を提案する。
速度マッチング(VM)は、生徒と教師の間の速度場を安定的に一致させることを学ぶが、必然的にバイアスのある勾配推定を提供する。
速度蒸留(VD)は、学習した速度場を利用して確率密度蒸留を行うことにより、最適化プロセスをさらに強化する。
先駆的な3D 生成フレームワーク TRELLIS で評価すると,A800 上での 9.0x と 6.5x のレイテンシで,各フロートランスフォーマーのサンプリングステップを 25 から 2 に削減し,0.68s (1 ステップ x2) と 0.94s (2 ステップ x2) を実現した。
大規模実験により,本手法は既存のCM蒸留法を著しく上回り,TRELLISが数段3D生成において優れた性能を発揮することが示された。
関連論文リスト
- Mean Flows for One-step Generative Modeling [64.4997821467102]
本稿では,一段階生成モデリングのための原理的かつ効果的なフレームワークを提案する。
ニューラルネットワークトレーニングのガイドには,平均速度と瞬時速度を適切に定義したアイデンティティが導出され,使用される。
提案手法はMeanFlowモデルと呼ばれ,自己完結型であり,事前学習,蒸留,カリキュラム学習は不要である。
論文 参考訳(メタデータ) (2025-05-19T17:59:42Z) - Distilling Multi-view Diffusion Models into 3D Generators [4.3238419212557115]
本稿では,多視点拡散モデル(MV-DM)をガウススプラッティングを用いた3次元ジェネレータに拡散させる定式化であるDD3Gを紹介する。
DD3GはMV-DMから広範囲の視覚的および空間的知識を圧縮し統合する。
本稿では,パターン抽出とプログレッシブデコーディングのフェーズからなるジェネレータPEPDを提案する。
論文 参考訳(メタデータ) (2025-04-01T06:32:48Z) - ProReflow: Progressive Reflow with Decomposed Velocity [52.249464542399636]
フローマッチングは、拡散モデルの拡散過程を数ステップまたは1ステップ生成のために直線に再フローすることを目的としている。
局所的な時間ステップで拡散モデルを段階的に再フローし,拡散全体を進行させるプログレッシブ・リフローを導入する。
また,フローマッチングにおける方向整合の重要性を強調し,位置整合性を考慮したV-Predictionを導入する。
論文 参考訳(メタデータ) (2025-03-05T04:50:53Z) - TraFlow: Trajectory Distillation on Pre-Trained Rectified Flow [31.56008127287467]
本稿では, 両者の利点を享受し, 数段階の発電を可能にする, トラジェクトリー蒸留法, モデル名を提案する。
TraFlowは一貫性トラジェクトリモデルの設定を採用し、トラジェクトリ全体を通して自己整合性と直線性の特性をさらに強化する。
論文 参考訳(メタデータ) (2025-02-24T08:57:19Z) - Self-Refining Diffusion Samplers: Enabling Parallelization via Parareal Iterations [53.180374639531145]
自己精製拡散サンプリング(SRDS)は、サンプル品質を維持し、追加の並列計算コストでレイテンシを向上させることができる。
微分方程式の並列時間積分法であるPararealアルゴリズムから着想を得た。
論文 参考訳(メタデータ) (2024-12-11T11:08:09Z) - Hyper-SD: Trajectory Segmented Consistency Model for Efficient Image Synthesis [20.2271205957037]
Hyper-SDはODEトラジェクトリ保存と改革の利点を活かす新しいフレームワークである。
本稿では, 予め定義された時間ステップセグメント内で一貫した蒸留を行うために, トラジェクティブ・セグメンテッド・コンシスタンス蒸留を導入する。
人間のフィードバック学習を取り入れ、低段階のモデルの性能を高めるとともに、蒸留プロセスによって生じる性能損失を軽減する。
論文 参考訳(メタデータ) (2024-04-21T15:16:05Z) - Fast Sampling of Diffusion Models via Operator Learning [74.37531458470086]
我々は,拡散モデルのサンプリング過程を高速化するために,確率フロー微分方程式の効率的な解法であるニューラル演算子を用いる。
シーケンシャルな性質を持つ他の高速サンプリング手法と比較して、並列復号法を最初に提案する。
本稿では,CIFAR-10では3.78、ImageNet-64では7.83の最先端FIDを1モデル評価環境で達成することを示す。
論文 参考訳(メタデータ) (2022-11-24T07:30:27Z) - Towards Fast, Accurate and Stable 3D Dense Face Alignment [73.01620081047336]
本稿では,速度,精度,安定性のバランスをとる3DDFA-V2という新しい回帰フレームワークを提案する。
本研究では,静止画を平面内と面外の動きを取り入れた映像に変換する仮想合成法を提案する。
論文 参考訳(メタデータ) (2020-09-21T15:37:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。