論文の概要: SAGE: Semantic-Aware Shared Sampling for Efficient Diffusion
- arxiv url: http://arxiv.org/abs/2509.15865v1
- Date: Fri, 19 Sep 2025 11:06:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-22 18:18:11.13564
- Title: SAGE: Semantic-Aware Shared Sampling for Efficient Diffusion
- Title(参考訳): SAGE: 効率的な拡散のための意味認識共有サンプリング
- Authors: Haoran Zhao, Tong Bai, Lei Huang, Xiaoyu Liang,
- Abstract要約: 拡散モデルは様々な領域で明らかな利点を示すが、高いサンプリングコストは依然として大きな限界である。
SAGEは,効率的な共有サンプリングスキームと品質保全のための調整されたトレーニング戦略を統合した,セマンティック・アウェアな共有サンプリングフレームワークである。
大規模な実験により、SAGEはサンプリングコストを25.5%削減し、生成品質は5.0%低下し、CLIPは5.4%上昇し、ベースラインよりも160%高い。
- 参考スコア(独自算出の注目度): 13.58475957953045
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diffusion models manifest evident benefits across diverse domains, yet their high sampling cost, requiring dozens of sequential model evaluations, remains a major limitation. Prior efforts mainly accelerate sampling via optimized solvers or distillation, which treat each query independently. In contrast, we reduce total number of steps by sharing early-stage sampling across semantically similar queries. To enable such efficiency gains without sacrificing quality, we propose SAGE, a semantic-aware shared sampling framework that integrates a shared sampling scheme for efficiency and a tailored training strategy for quality preservation. Extensive experiments show that SAGE reduces sampling cost by 25.5%, while improving generation quality with 5.0% lower FID, 5.4% higher CLIP, and 160% higher diversity over baselines.
- Abstract(参考訳): 拡散モデルは、様々な領域で明らかな利点を示すが、その高いサンプリングコストは、何十もの連続したモデル評価を必要とするが、依然として大きな制限である。
従来の取り組みは主に、最適化されたソルバや蒸留を通じてサンプリングを加速し、それぞれのクエリを独立して扱う。
対照的に、セマンティックに類似したクエリでアーリーステージサンプリングを共有することで、ステップの総数を削減します。
品質を犠牲にすることなく,このような効率向上を実現するために,効率的な共有サンプリング手法と品質保全のための調整されたトレーニング戦略を統合したセマンティック・アウェア・シェアリング・サンプリング・フレームワークであるSAGEを提案する。
大規模な実験により、SAGEはサンプリングコストを25.5%削減し、生成品質は5.0%低下し、CLIPは5.4%上昇し、ベースラインよりも160%高い。
関連論文リスト
- Diffusion Sampling Path Tells More: An Efficient Plug-and-Play Strategy for Sample Filtering [18.543769006014383]
拡散モデルはしばしば、サンプリング軌跡に固有の変化のために、一貫性のないサンプル品質を示す。
CFG-リジェクション(CFG-Rejection)は,デノナイジングプロセスの初期段階において,低品質なサンプルをフィルタリングする効率的なプラグアンドプレイ戦略である。
画像生成におけるCFG-Rejectionの有効性を広範囲な実験により検証する。
論文 参考訳(メタデータ) (2025-05-29T11:08:24Z) - ESANS: Effective and Semantic-Aware Negative Sampling for Large-Scale Retrieval Systems [7.897183317096681]
検索段階において、古典的な埋め込みに基づく検索手法は、性能と効率を両立させる効果的な負のサンプリング手法に依存している。
我々は,エフェクト・センス補間戦略 (EDIS) とマルチモーダル・セマンティック・アウェア・クラスタリング (MSAC) の2つの重要なコンポーネントを統合した,エフェクト・セマンティック・ネガティブ・サンプリング (ESANS) を提案する。
論文 参考訳(メタデータ) (2025-02-22T04:43:20Z) - Integrate the Essence and Eliminate the Dross: Fine-Grained Self-Consistency for Free-Form Language Generation [20.138831477848615]
本研究では,複数のサンプルから得られた詳細なコンセンサス知識を効果的に活用することにより,出力品質を最適化するFSCを提案する。
FSCの有効性は、要約、コード生成、数学的推論など、様々なタスクに関する広範な実験を通じて実証される。
論文 参考訳(メタデータ) (2024-07-02T08:38:31Z) - SCott: Accelerating Diffusion Models with Stochastic Consistency Distillation [74.32186107058382]
本稿では,テキスト・画像の高速生成を実現するために,SCott(Consistency Distillation)を提案する。
SCottは、訓練済みの教師モデルの通常の微分方程式解法に基づくサンプリングプロセスを学生に蒸留する。
安定拡散V1.5教師によるMSCOCO-2017 5Kデータセットでは、SCottは2ステップのサンプリングステップを持つ21.9のFIDを達成し、1ステップのInstaFlow (23.4)と4ステップのUFOGen (22.1)を上回ります。
論文 参考訳(メタデータ) (2024-03-03T13:08:32Z) - Learning Energy-Based Models by Cooperative Diffusion Recovery Likelihood [64.95663299945171]
高次元データに基づくエネルギーベースモデル(EBM)の訓練は、困難かつ時間を要する可能性がある。
EBMと、GANや拡散モデルのような他の生成フレームワークとの間には、サンプル品質に顕著なギャップがある。
本研究では,協調拡散回復可能性 (CDRL) を提案する。
論文 参考訳(メタデータ) (2023-09-10T22:05:24Z) - Let's Sample Step by Step: Adaptive-Consistency for Efficient Reasoning
and Coding with LLMs [60.58434523646137]
大規模言語モデル(LLM)からの出力の正確性を改善するための一般的なアプローチは、自己整合性である。
コスト効率のよいモデルに依存しない手法であるAdaptive-Consistencyを導入し,各質問のサンプル数を動的に調整する。
実験の結果,Adaptive-Consistencyはサンプル予算を最大7.9倍に削減し,平均精度は0.1%以下であった。
論文 参考訳(メタデータ) (2023-05-19T17:49:25Z) - PCB-RandNet: Rethinking Random Sampling for LIDAR Semantic Segmentation
in Autonomous Driving Scene [15.516687293651795]
大規模LiDAR点雲のセマンティックセグメンテーションのための新しいポーラシリンダバランスランダムサンプリング法を提案する。
さらに,セグメント化性能を向上し,異なるサンプリング法下でのモデルのばらつきを低減するため,サンプリング一貫性損失が導入された。
提案手法は,SemanticKITTIベンチマークとSemanticPOSSベンチマークの両方で優れた性能を示し,それぞれ2.8%と4.0%の改善を実現している。
論文 参考訳(メタデータ) (2022-09-28T02:59:36Z) - Rethinking Sampling Strategies for Unsupervised Person Re-identification [59.47536050785886]
我々は,同じフレームワーク下での各種サンプリング戦略と損失関数のパフォーマンス差の理由を解析した。
グループサンプリングを提案し、同じクラスのサンプルをグループに集める。
Market-1501、DukeMTMC-reID、MSMT17の実験は、グループサンプリングが最先端の手法に匹敵する性能を達成することを示した。
論文 参考訳(メタデータ) (2021-07-07T05:39:58Z) - Reparameterized Sampling for Generative Adversarial Networks [71.30132908130581]
本稿では,マルコフ連鎖をジェネレータの潜在空間に再配置することで,一般依存型提案を可能にする新しいサンプリング手法REP-GANを提案する。
実験的な実験により、我々のREP-GANはサンプル効率を大幅に改善し、同時により良いサンプル品質を得ることを示した。
論文 参考訳(メタデータ) (2021-07-01T10:34:55Z) - IQDet: Instance-wise Quality Distribution Sampling for Object Detection [25.31113751275204]
IQDet と呼ばれるインスタンス型サンプリング戦略を備えた高密度オブジェクト検出器を提案する。
私たちの最高のモデルは51.6 APを達成し、既存のすべての最先端のワンステージディテクタを上回り、推論時間で完全にコストフリーです。
論文 参考訳(メタデータ) (2021-04-14T15:57:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。