論文の概要: Uni-Classifier: Leveraging Video Diffusion Priors for Universal Guidance Classifier
- arxiv url: http://arxiv.org/abs/2603.20382v1
- Date: Fri, 20 Mar 2026 18:00:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:38.876271
- Title: Uni-Classifier: Leveraging Video Diffusion Priors for Universal Guidance Classifier
- Title(参考訳): Uni-Classifier:Universal Guidance Classifierにおけるビデオ拡散プリミティブの活用
- Authors: Yujie Zhou, Pengyang Ling, Jiazi Bu, Bingjie Gao, Li Niu,
- Abstract要約: 現実的なAIでは、複雑なタスクは、2D画像生成器の後のビデオや3D生成モデルなど、複数の生成モデルをチェーンすることが多い。
我々は,先行モデルのデノナイズプロセスを導くために,ビデオ拡散先行処理を利用するプラグイン・アンド・プレイモジュールであるUni-Classifier (Uni-C)を提案する。
ビデオと3D生成タスクによる実験は、UniCがワークフローベースとスタンドアロンの両方で生成品質を一貫して改善していることを示している。
- 参考スコア(独自算出の注目度): 28.559212478914105
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In practical AI workflows, complex tasks often involve chaining multiple generative models, such as using a video or 3D generation model after a 2D image generator. However, distributional mismatches between the output of upstream models and the expected input of downstream models frequently degrade overall generation quality. To address this issue, we propose Uni-Classifier (Uni-C), a simple yet effective plug-and-play module that leverages video diffusion priors to guide the denoising process of preceding models, thereby aligning their outputs with downstream requirements. Uni-C can also be applied independently to enhance the output quality of individual generative models. Extensive experiments across video and 3D generation tasks demonstrate that Uni-C consistently improves generation quality in both workflow-based and standalone settings, highlighting its versatility and strong generalization capability.
- Abstract(参考訳): 現実的なAIワークフローでは、複雑なタスクは、2Dイメージジェネレータの後にビデオや3D生成モデルを使用するなど、複数の生成モデルをチェーンすることが多い。
しかし、上流モデルの出力と下流モデルの期待される入力との分布ミスマッチは、全体の生成品質を劣化させることが多い。
この問題に対処するため,Uni-Classifier (Uni-C) を提案する。Uni-Cは,ビデオ拡散先行処理を利用して先行モデルの復調過程を導出し,出力を下流要求と整合させる,シンプルで効果的なプラグイン・アンド・プレイモジュールである。
Uni-Cは個々の生成モデルの出力品質を高めるために独立して適用することもできる。
ビデオおよび3D生成タスクにわたる大規模な実験により、Uni-Cはワークフローベースとスタンドアロンの両方で生成品質を一貫して改善し、その汎用性と強力な一般化能力を強調している。
関連論文リスト
- DT-UFC: Universal Large Model Feature Coding via Peaky-to-Balanced Distribution Transformation [50.32808229665005]
本稿では,大規模モデルの普遍的特徴符号化に関する最初の体系的研究について述べる。
主な課題は、異なるモデルから抽出された特徴の本質的に多様性があり、分布的に互換性のない性質にある。
本稿では,高度に歪んだ特徴分布を共通目標空間に再帰させる学習ピーク対均衡分布変換を提案する。
論文 参考訳(メタデータ) (2025-06-19T17:43:32Z) - Improving Video Generation with Human Feedback [105.81833319891537]
我々は,人間のフィードバックを利用して映像生成問題を緩和するシステムパイプラインを開発した。
我々は,多次元ビデオ報酬モデルであるVideoRewardを紹介し,アノテーションと様々なデザイン選択が報奨効果に与える影響について検討する。
論文 参考訳(メタデータ) (2025-01-23T18:55:41Z) - Jet: A Modern Transformer-Based Normalizing Flow [62.2573739835562]
本稿では,結合型正規化フローモデルの設計を再考する。
よりシンプルなアーキテクチャで、最先端の定量的、質的なパフォーマンスを実現しています。
論文 参考訳(メタデータ) (2024-12-19T18:09:42Z) - Spatiotemporal Skip Guidance for Enhanced Video Diffusion Sampling [32.2474423833013]
本稿では、トランスフォーマーに基づくビデオ拡散モデルを改善するための時空間スキップガイダンス(TG)を提案する。
TGは自己摂動を通じて暗黙の弱いモデルを採用し、外部モデルや追加のトレーニングを必要としない。
TGは、多様性や動的度合いを損なうことなく、サンプルの品質を高めるために、オリジナルのモデルの整列した、劣化したバージョンを生成する。
論文 参考訳(メタデータ) (2024-11-27T15:59:48Z) - Guided Flows for Generative Modeling and Decision Making [55.42634941614435]
その結果,ガイドフローは条件付き画像生成やゼロショット音声合成におけるサンプル品質を著しく向上させることがわかった。
特に、我々は、拡散モデルと比較して、オフライン強化学習設定axスピードアップにおいて、まず、計画生成にフローモデルを適用する。
論文 参考訳(メタデータ) (2023-11-22T15:07:59Z) - Global Context with Discrete Diffusion in Vector Quantised Modelling for
Image Generation [19.156223720614186]
ベクトル量子変分オートエンコーダと自己回帰モデルとを生成部として統合することにより、画像生成における高品質な結果が得られる。
本稿では,VQ-VAEからのコンテンツリッチな離散視覚コードブックの助けを借りて,この離散拡散モデルにより,グローバルな文脈で高忠実度画像を生成することができることを示す。
論文 参考訳(メタデータ) (2021-12-03T09:09:34Z) - Normalizing Flows with Multi-Scale Autoregressive Priors [131.895570212956]
マルチスケール自己回帰前処理(mAR)を通した遅延空間におけるチャネルワイド依存性を導入する。
我々のmARは、分割結合フロー層(mAR-SCF)を持つモデルに先立って、複雑なマルチモーダルデータの依存関係をよりよく捉えます。
我々は,mAR-SCFにより画像生成品質が向上し,FIDとインセプションのスコアは最先端のフローベースモデルと比較して向上したことを示す。
論文 参考訳(メタデータ) (2020-04-08T09:07:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。