論文の概要: On-Policy Adversarial Flow Distillation for Autoregressive Video Generation
- arxiv url: http://arxiv.org/abs/2605.26105v1
- Date: Mon, 25 May 2026 17:58:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:20.654459
- Title: On-Policy Adversarial Flow Distillation for Autoregressive Video Generation
- Title(参考訳): 自己回帰ビデオ生成のためのオンライン逆流蒸留
- Authors: Yang Luo, Shengju Qian, Xiaohang Tang, Zirui Zhu, Yong Liu, Xin Wang, Yang You,
- Abstract要約: 逆流蒸留(英: Adversarial Flow Distillation、AFD)は、異種ブラックボックスビデオ蒸留のためのオンラインフレームワークである。
AFDは教師に問い合わせ、同じプロンプトで現在の生徒をロールアウトする。
AFDは、教師のスコア、潜伏者、軌道の騒音、ステップアライメント、逆鎖強化学習を必要とせず、高密度な速度場監視を提供する。
- 参考スコア(独自算出の注目度): 34.70887671905755
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Autoregressive video generators are attractive for streaming, long-horizon, and interactive applications, but distilling strong black-box teachers into causal students remains difficult. The student must learn under its own rollout distribution, whereas practical teachers may expose only prompt-conditioned completed videos and may differ in architecture, capacity, temporal design, and sampling schedule. This interface makes supervised fine-tuning off-policy, score-based distillation inapplicable, and direct adversarial imitation too sparse for denoising-time credit assignment. We propose Adversarial Flow Distillation (AFD), an on-policy framework for heterogeneous black-box video distillation. AFD queries the teacher and rolls out the current student on the same prompts, trains a prompt-paired Bradley-Terry discriminator to estimate clean-sample teacher-student discrepancy, and converts the resulting on-policy advantage into forward-process flow-matching updates on the student's own noised states. Thus, AFD provides dense velocity-field supervision while requiring no teacher scores, latents, denoising trajectories, step alignment, or reverse-chain reinforcement learning. Experiments across two causal AR student families show that AFD consistently improves motion- and physics-sensitive generation while preserving general video quality, and ablations validate the importance of adaptive on-policy feedback and forward-process credit assignment. The method requires only clean teacher videos and student rollouts, providing a practical route for distilling proprietary or heterogeneous video generators into efficient autoregressive students.
- Abstract(参考訳): 自動回帰ビデオジェネレータは、ストリーミング、ロングホライゾン、インタラクティブなアプリケーションには魅力的なものだが、強力なブラックボックス教師を因果学生に蒸留することは依然として困難である。
実践的な教師は、即席で完成したビデオのみを公開することができ、建築、能力、時間的デザイン、サンプリングスケジュールが異なる可能性がある。
このインターフェースは、監督された微調整のオフポリシー、スコアベースの蒸留の適用不可能、直接の敵の模倣を、デノナイジングタイムのクレジット代入には小さすぎる。
不均一なブラックボックスビデオ蒸留のためのオンラインフレームワークであるAdversarial Flow Distillation (AFD)を提案する。
AFDは教師に問い合わせて、現在の生徒を同じプロンプトでロールアウトさせ、即興のBradley-Terry判別器を訓練し、クリーンサンプルの教師/学生間の不一致を推定し、その結果得られる政治上の優位性を、生徒自身のノイズのある状態における前処理のフローマッチング更新に変換する。
このように、AFDは教師のスコア、潜伏者、軌道の騒音、ステップアライメント、逆鎖強化学習を必要とせず、高密度な速度場監視を提供する。
2つの因果的AR学生を対象とした実験では、AFDは一般的なビデオ品質を維持しながら、動きや物理に敏感な生成を一貫して改善し、アブリケーションは、適応的なオン・ポリティクスフィードバックとフォワード・プロセス・クレジット・アサインの重要性を検証している。
この方法は、クリーンな教師のビデオと学生のロールアウトだけを必要とし、プロプライエタリまたは異種のビデオジェネレータを効率よく自己回帰的な学生に蒸留する実用的な方法を提供する。
関連論文リスト
- Backtracking When It Strays: Mitigating Dual Exposure Biases in LLM Reasoning Distillation [43.020181623750865]
本稿では,MOTABにおけるモニタリングトラジェクトリとバックトラッキングを提案する。
MOTABは、適応的な安全境界に対して学生の政治世代を監視する。
LIMO-v2とAceReasonデータセットの実験により、MOTABは二重露光バイアスを効果的に緩和することが示された。
論文 参考訳(メタデータ) (2026-05-19T06:42:52Z) - Reward-Aware Trajectory Shaping for Few-step Visual Generation [48.211558783057086]
textbfReward-Aware Trajectory Shaping (RATS) を提案する。
RATSは、追加のテスト時間計算オーバーヘッドを発生させることなく、優先関連知識を高ステップジェネレータから効果的に転送する。
実験により、RATSは数ステップの視覚生成において効率-品質トレードオフを大幅に改善することが示された。
論文 参考訳(メタデータ) (2026-04-16T11:52:11Z) - OVD: On-policy Verbal Distillation [47.727229201069555]
On-policy Verbal Distillation (OVD) は、トークンレベルの確率マッチングを軌道マッチングに置き換えるメモリ効率の高いフレームワークである。
OVDは、言語フィードバックを持つ教師モデルからのオンライン蒸留を可能にしながら、メモリ消費を劇的に削減する。
論文 参考訳(メタデータ) (2026-01-29T16:48:14Z) - BAgger: Backwards Aggregation for Mitigating Drift in Autoregressive Video Diffusion Models [50.986189632485285]
モデル自身のロールアウトから補正軌道を構築する自己教師型スキームであるバックワードアグリゲーション(BAgger)を導入する。
数段階の蒸留と分配整合損失に依存する従来のアプローチとは異なり、BAggerは標準的なスコアやフローマッチングの目的を持つ列車である。
因果拡散変換器でBAggerをインスタンス化し、テキスト・ツー・ビデオ、ビデオ・エクステンション、マルチプロンプト・ジェネレーションで評価する。
論文 参考訳(メタデータ) (2025-12-12T23:02:02Z) - Training-Free Motion Customization for Distilled Video Generators with Adaptive Test-Time Distillation [53.877572078307935]
蒸留ビデオ生成モデルは、高速で効率的なが、参照ビデオによってガイドされるときの動きのカスタマイズに苦労する。
拡散教師の強制力を活用して運動のカスタマイズを可能にする訓練不要な試験時間蒸留フレームワークであるMotionEchoを提案する。
論文 参考訳(メタデータ) (2025-06-24T06:20:15Z) - Seeing in the Dark: A Teacher-Student Framework for Dark Video Action Recognition via Knowledge Distillation and Contrastive Learning [2.772895608190934]
ActLumosは、マルチストリームレベルの正確性を保ちながら、シングルストリーム推論を実現する教師向けフレームワークである。
単流推論では、ARID V1.0では96.92%(Top-1)、ARID V1.5では88.27%、Dark48では48.96%である。
論文 参考訳(メタデータ) (2025-02-06T02:26:47Z) - Object-Centric Diffusion for Efficient Video Editing [64.71639719352636]
拡散ベースのビデオ編集は素晴らしい品質に達している。
このようなソリューションは通常、時間的に整合性のあるフレームを生成するために重いメモリと計算コストを発生させる。
品質を維持しつつ、大幅なスピードアップを可能にする修正を提案する。
論文 参考訳(メタデータ) (2024-01-11T08:36:15Z) - Delta Distillation for Efficient Video Processing [68.81730245303591]
デルタ蒸留と呼ばれる新しい知識蒸留方式を提案する。
ビデオフレーム内の時間的冗長性により,これらの時間的変動を効果的に蒸留できることを実証した。
副産物として、デルタ蒸留は教師モデルの時間的一貫性を向上させる。
論文 参考訳(メタデータ) (2022-03-17T20:13:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。