論文の概要: Progressive Checkerboards for Autoregressive Multiscale Image Generation
- arxiv url: http://arxiv.org/abs/2602.03811v1
- Date: Tue, 03 Feb 2026 18:15:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.63262
- Title: Progressive Checkerboards for Autoregressive Multiscale Image Generation
- Title(参考訳): 自動回帰型マルチスケール画像生成のためのプログレッシブチェッカーボード
- Authors: David Eigen,
- Abstract要約: 自己回帰画像生成における重要な課題は、独立位置を効率的に並列にサンプリングすることである。
本研究では,マルチスケール自動回帰画像生成のためのプログレッシブチェッカーボードに基づくフレキシブルで固定的な順序付けについて検討する。
バランスの取れた環境では、シリアルステップの総数が一定である限り、幅広いスケールアップ要因が同様の結果をもたらすという証拠が得られます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A key challenge in autoregressive image generation is to efficiently sample independent locations in parallel, while still modeling mutual dependencies with serial conditioning. Some recent works have addressed this by conditioning between scales in a multiscale pyramid. Others have looked at parallelizing samples in a single image using regular partitions or randomized orders. In this work we examine a flexible, fixed ordering based on progressive checkerboards for multiscale autoregressive image generation. Our ordering draws samples in parallel from evenly spaced regions at each scale, maintaining full balance in all levels of a quadtree subdivision at each step. This enables effective conditioning both between and within scales. Intriguingly, we find evidence that in our balanced setting, a wide range of scale-up factors lead to similar results, so long as the total number of serial steps is constant. On class-conditional ImageNet, our method achieves competitive performance compared to recent state-of-the-art autoregressive systems with like model capacity, using fewer sampling steps.
- Abstract(参考訳): 自己回帰画像生成における重要な課題は、シリアル条件付きで相互依存関係をモデル化しながら、独立位置を効率的に並列にサンプリングすることである。
いくつかの最近の研究は、マルチスケールピラミッドにおけるスケール間の条件付けによって、この問題に対処している。
通常のパーティションやランダム化順序を使って、サンプルを単一のイメージで並列化する方法も検討されている。
本研究では,マルチスケール自動回帰画像生成のためのプログレッシブチェッカーボードに基づくフレキシブルで固定的な順序付けについて検討する。
我々の順序付けでは、各スケールで等間隔領域からサンプルを並列に描画し、各ステップでクワッドツリーのすべてのレベルにおいて完全なバランスを維持する。
これにより、スケール内とスケール内の両方を効果的に条件付けできる。
興味深いことに、我々のバランスの取れた環境では、シリアルステップの総数が一定である限り、幅広いスケールアップ要因が同様の結果をもたらすことが示されている。
クラス条件のImageNetでは、サンプリングステップを減らし、モデルキャパシティのような最近の最先端の自己回帰システムと比較して、競合性能が向上する。
関連論文リスト
- Stable Virtual Camera: Generative View Synthesis with Diffusion Models [51.71244310522393]
本稿では,シーンの新たなビューを生成する汎用拡散モデルであるスタブルバーチャルカメラ(Seva)を紹介する。
このアプローチは、シンプルなモデル設計、最適化されたトレーニングレシピ、柔軟なサンプリング戦略によってこれらの制限を克服する。
提案手法では,シームレスなループ閉鎖により,最大半分間の高品質なビデオを生成することができる。
論文 参考訳(メタデータ) (2025-03-18T17:57:22Z) - One Diffusion to Generate Them All [54.82732533013014]
OneDiffusionは双方向画像合成と理解をサポートする汎用的で大規模な拡散モデルである。
テキスト、深さ、ポーズ、レイアウト、セマンティックマップなどの入力から条件生成を可能にする。
OneDiffusionは、シーケンシャルな画像入力を使用して、マルチビュー生成、カメラポーズ推定、即時パーソナライズを可能にする。
論文 参考訳(メタデータ) (2024-11-25T12:11:05Z) - Implicit Grid Convolution for Multi-Scale Image Super-Resolution [6.8410780175245165]
我々は,Implicit Grid Convolution(IGConv)と連携して,単一エンコーダを用いたマルチスケールフレームワークを提案する。
本フレームワークは,既存の固定スケール手法に匹敵する性能を達成しつつ,トレーニング予算を削減し,パラメータを3倍に抑える。
論文 参考訳(メタデータ) (2024-08-19T03:30:15Z) - Learning Images Across Scales Using Adversarial Training [64.59447233902735]
本研究では,通常の画像の非構造的コレクションからマグニチュード・オブ・マグニチュード・スケールを捉える表現を学習するための新しいパラダイムを考案する。
筆者らのジェネレータは,マルチスケール生成モデルとして利用でき,非構造化パッチからのスケール空間の再構成にも利用できることを示す。
論文 参考訳(メタデータ) (2024-06-13T08:44:12Z) - Auto-regressive Image Synthesis with Integrated Quantization [55.51231796778219]
本稿では,条件付き画像生成のための多目的フレームワークを提案する。
CNNの帰納バイアスと自己回帰の強力なシーケンスモデリングが組み込まれている。
提案手法は,最先端技術と比較して,優れた多彩な画像生成性能を実現する。
論文 参考訳(メタデータ) (2022-07-21T22:19:17Z) - Arbitrary-Scale Image Synthesis [149.0290830305808]
位置エンコーディングにより、1つの敵ネットワークをトレーニングし、異なるスケールの画像を生成することができる。
生成器の変換層に不変なスケール一貫性のある位置符号化の設計を提案する。
画像合成のための様々な一般的なデータセットに対して,連続したスケールの競合結果を示す。
論文 参考訳(メタデータ) (2022-04-05T15:10:43Z) - Diverse Semantic Image Synthesis via Probability Distribution Modeling [103.88931623488088]
新規な多様な意味的画像合成フレームワークを提案する。
本手法は最先端手法と比較して優れた多様性と同等の品質を実現することができる。
論文 参考訳(メタデータ) (2021-03-11T18:59:25Z) - Nested Scale Editing for Conditional Image Synthesis [19.245119912119947]
本稿では,潜在コード空間における階層化ナビゲーションを実現する画像合成手法を提案する。
ごく少数の部分的あるいは低解像度の画像で、我々のアプローチは一貫して最先端の画像よりも優れています。
論文 参考訳(メタデータ) (2020-06-03T04:29:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。