論文の概要: StageVAR: Stage-Aware Acceleration for Visual Autoregressive Models
- arxiv url: http://arxiv.org/abs/2512.16483v1
- Date: Thu, 18 Dec 2025 12:51:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-19 18:10:32.057641
- Title: StageVAR: Stage-Aware Acceleration for Visual Autoregressive Models
- Title(参考訳): StageVAR: 視覚的自己回帰モデルのためのステージアウェア・アクセラレーション
- Authors: Senmao Li, Kai Wang, Salman Khan, Fahad Shahbaz Khan, Jian Yang, Yaxing Wang,
- Abstract要約: Visual Autoregressive(VAR)モデリングは、従来のAutoregressive(AR)モデルの次世代予測パラダイムから切り離されている。
既存のアクセラレーション手法は、大規模なステップのランタイムを減らすが、手動のステップ選択に依存し、生成プロセスにおける異なるステージの重要性を軽視する。
本稿では、VARモデルのためのシステム研究および段階認識加速度フレームワークであるStage VARを紹介する。
- 参考スコア(独自算出の注目度): 69.07782637329315
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visual Autoregressive (VAR) modeling departs from the next-token prediction paradigm of traditional Autoregressive (AR) models through next-scale prediction, enabling high-quality image generation. However, the VAR paradigm suffers from sharply increased computational complexity and running time at large-scale steps. Although existing acceleration methods reduce runtime for large-scale steps, but rely on manual step selection and overlook the varying importance of different stages in the generation process. To address this challenge, we present StageVAR, a systematic study and stage-aware acceleration framework for VAR models. Our analysis shows that early steps are critical for preserving semantic and structural consistency and should remain intact, while later steps mainly refine details and can be pruned or approximated for acceleration. Building on these insights, StageVAR introduces a plug-and-play acceleration strategy that exploits semantic irrelevance and low-rank properties in late-stage computations, without requiring additional training. Our proposed StageVAR achieves up to 3.4x speedup with only a 0.01 drop on GenEval and a 0.26 decrease on DPG, consistently outperforming existing acceleration baselines. These results highlight stage-aware design as a powerful principle for efficient visual autoregressive image generation.
- Abstract(参考訳): Visual Autoregressive(VAR)モデリングは、従来のAutoregressive(AR)モデルの次世代予測パラダイムから切り離され、高品質な画像生成を可能にする。
しかしながら、VARパラダイムは計算複雑性が急激に増加し、大規模なステップで実行時間が短縮される。
既存のアクセラレーション手法は大規模なステップのランタイムを減少させるが、手動のステップ選択に依存し、生成プロセスにおける異なるステージの重要性を軽視する。
この課題に対処するために、VARモデルのための体系的な研究および段階認識加速度フレームワークであるStageVARを提案する。
分析の結果,初期段階は意味的・構造的整合性の維持に不可欠であり,その後段階は細部を洗練させ,加速に近似することができることがわかった。
これらの洞察に基づいて、StageVARは、追加のトレーニングを必要とせずに、後期の計算における意味的無関係性と低ランク性を活用するプラグイン・アンド・プレイ・アクセラレーション戦略を導入した。
提案したStageVARは、GenEvalで最大3.4倍のスピードアップを実現し、GenEvalでは0.01滴、DPGでは0.26滴、既存の加速度ベースラインでは一貫して上回っている。
これらの結果は、効率的な視覚的自己回帰画像生成のための強力な原理として、ステージアウェアデザインを強調している。
関連論文リスト
- VVS: Accelerating Speculative Decoding for Visual Autoregressive Generation via Partial Verification Skipping [52.58270801983525]
投機的復号法(SD)は視覚ARモデルの高速化に有効であることが証明されている。
部分的検証スキップによる視覚AR生成を高速化する新しいフレームワークVVSを提案する。
論文 参考訳(メタデータ) (2025-11-17T16:50:58Z) - OmniSAT: Compact Action Token, Faster Auto Regression [70.70037017501357]
我々は、コンパクトで転送可能なアクション表現を学ぶOmni Swift Action Tokenizerを紹介する。
その結果、離散トークン化はトレーニングシーケンスを6.8$times$に短縮し、ターゲットエントロピーを低下させる。
論文 参考訳(メタデータ) (2025-10-08T03:55:24Z) - SkipVAR: Accelerating Visual Autoregressive Modeling via Adaptive Frequency-Aware Skipping [30.85025293160079]
生成プロセスにおける高周波コンポーネント、または後続のステップは、推論遅延に不均等に寄与する。
ステップ冗長性と非条件分岐冗長性の2つの主要な非効率性の原因を同定する。
本稿では、不要な生成ステップを選択的に省略して効率を向上させる自動ステップスキッピング戦略を提案する。
論文 参考訳(メタデータ) (2025-06-10T15:35:29Z) - RestoreVAR: Visual Autoregressive Generation for All-in-One Image Restoration [51.77917733024544]
潜時拡散モデル(LDM)はオールインワン画像復元法(AiOR)の知覚的品質を改善した。
LDMは反復的なデノゲーションプロセスによって推論が遅くなり、時間に敏感なアプリケーションでは実用的でない。
VAR(Visual Autoregressive Modeling)は、スケールスペースの自己回帰を行い、最先端の拡散変換器に匹敵する性能を実現する。
論文 参考訳(メタデータ) (2025-05-23T15:52:26Z) - Fast Autoregressive Models for Continuous Latent Generation [49.079819389916764]
自己回帰モデルは、特にNLPにおいて、シーケンシャルなデータ生成において顕著な成功を収めている。
最近の研究で、マスク付き自己回帰モデル(MAR)は拡散ヘッドを用いて連続空間内のトーケン分布をモデル化することによって量子化をバイパスする。
本稿では,MARの拡散ヘッドを軽量ショートカットヘッドに置き換える新しいフレームワークであるFast AutoRegressive Model (FAR)を提案する。
論文 参考訳(メタデータ) (2025-04-24T13:57:08Z) - Model-Agnostic AI Framework with Explicit Time Integration for Long-Term Fluid Dynamics Prediction [7.740582267221137]
本稿では,データ駆動AR予測に適した2段階微分Adams-Bashforth法の最初の実装について紹介する。
我々は、異なる将来のステップの重要性を動的に調整する3つの新しい適応重み付け戦略を開発した。
本フレームワークは,平均二乗誤差を0.125から0.002に削減する350のステップを正確に予測する。
論文 参考訳(メタデータ) (2024-12-07T14:02:57Z) - A-SDM: Accelerating Stable Diffusion through Redundancy Removal and
Performance Optimization [54.113083217869516]
本研究ではまず,ネットワークの計算冗長性について検討する。
次に、モデルの冗長性ブロックをプルークし、ネットワーク性能を維持する。
第3に,計算集約型注意部を高速化するグローバル地域対話型注意(GRI)を提案する。
論文 参考訳(メタデータ) (2023-12-24T15:37:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。