論文の概要: An Efficient Test-Time Scaling Approach for Image Generation
- arxiv url: http://arxiv.org/abs/2512.08985v2
- Date: Thu, 11 Dec 2025 19:35:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-15 13:50:29.088989
- Title: An Efficient Test-Time Scaling Approach for Image Generation
- Title(参考訳): 画像生成のための効率的なテスト時間スケーリング手法
- Authors: Vignesh Sundaresha, Akash Haridas, Vikram Appia, Lav R. Varshney,
- Abstract要約: 特に拡散・流れモデルのためのノイズサンプルの探索は,テスト時間計算とよく一致している。
テスト時間計算を自動的に再配置するVerifier-Threshold法を提案する。
GenEvalベンチマークでも同様の性能を示すため、最先端手法よりも計算時間を2~4倍削減する。
- 参考スコア(独自算出の注目度): 11.45090928536667
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Image generation has emerged as a mainstream application of large generative AI models. Just as test-time compute and reasoning have helped language models improve their capabilities, similar benefits have also been observed with image generation models. In particular, searching over noise samples for diffusion and flow models has shown to scale well with test-time compute. While recent works have explored allocating non-uniform inference-compute budgets across different denoising steps, they rely on greedy algorithms and allocate the compute budget ineffectively. In this work, we study this problem and propose solutions to fix it. We propose the Verifier-Threshold method which automatically reallocates test-time compute and delivers substantial efficiency improvements. For the same performance on the GenEval benchmark, we achieve a 2-4x reduction in computational time over the state-of-the-art method.
- Abstract(参考訳): 画像生成は、大規模な生成AIモデルのメインストリームアプリケーションとして登場した。
テスト時間計算と推論が言語モデルの性能向上に役立っているのと同じように、画像生成モデルでも同様の利点が観察されている。
特に拡散・流れモデルのためのノイズサンプルの探索は,テスト時間計算とよく一致している。
近年の研究では、様々なデノナイジングステップにまたがる不均一な推論計算予算の割り当てについて検討されているが、それらは欲張りアルゴリズムに頼り、計算予算を効果的に割り当てている。
本研究では,この問題を考察し,その解決法を提案する。
本稿では,テスト時間計算を自動的に再配置し,大幅な効率向上を実現するVerifier-Threshold法を提案する。
GenEvalベンチマークでも同様の性能を示すため、最先端手法よりも計算時間を2~4倍削減する。
関連論文リスト
- TTSnap: Test-Time Scaling of Diffusion Models via Noise-Aware Pruning [53.52543819839442]
テキスト・画像拡散モデルのテスト時間スケーリングに対する顕著なアプローチは、複数のノイズシードの探索として問題を定式化する。
ノイズ対応プルーニング(TTSnap)を用いたテスト時間スケーリングを提案する。
論文 参考訳(メタデータ) (2025-11-27T09:14:26Z) - Noise Hypernetworks: Amortizing Test-Time Compute in Diffusion Models [57.49136894315871]
テストタイムスケーリングの新しいパラダイムは、推論モデルと生成視覚モデルにおいて驚くべきブレークスルーをもたらした。
本稿では,テスト時間スケーリングの知識をモデルに組み込むことの課題に対する1つの解決策を提案する。
拡散モデルにおいて、初期入力ノイズを変調するノイズハイパーネットワークにより、報酬誘導試験時間雑音の最適化を行う。
論文 参考訳(メタデータ) (2025-08-13T17:33:37Z) - Performance Plateaus in Inference-Time Scaling for Text-to-Image Diffusion Without External Models [31.873727540047156]
テキストから画像への拡散モデルの初期ノイズを最適化するアルゴリズムにベスト・オブ・Nの推論時間スケーリングを適用する。
本研究では,テキストから画像への拡散モデルに対する推論時間スケーリングが急速に性能高原に達することを実証する。
論文 参考訳(メタデータ) (2025-06-14T21:25:08Z) - Mixed geometry information regularization for image multiplicative denoising [12.43943610396014]
本稿では,変分モデルによる乗法的ガンマ分解問題の解法に焦点をあてる。
本稿では,これらの問題を克服するために,領域幾何学用語と曲率項を先行知識として取り入れた混合情報モデルを提案する。
論文 参考訳(メタデータ) (2024-12-21T02:24:42Z) - Fast constrained sampling in pre-trained diffusion models [80.99262780028015]
任意の制約下で高速で高品質な生成を可能にするアルゴリズムを提案する。
我々の手法は、最先端のトレーニングフリー推論手法に匹敵するか、超越した結果をもたらす。
論文 参考訳(メタデータ) (2024-10-24T14:52:38Z) - Active Generation for Image Classification [45.93535669217115]
本稿では,モデルのニーズと特徴に着目し,画像生成の効率性に対処することを提案する。
能動学習の中心的傾向として,ActGenという手法が,画像生成のトレーニング・アウェア・アプローチを取り入れている。
論文 参考訳(メタデータ) (2024-03-11T08:45:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。