論文の概要: FGM-HD: Boosting Generation Diversity of Fractal Generative Models through Hausdorff Dimension Induction
- arxiv url: http://arxiv.org/abs/2511.08945v2
- Date: Tue, 18 Nov 2025 01:33:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-19 13:59:16.494853
- Title: FGM-HD: Boosting Generation Diversity of Fractal Generative Models through Hausdorff Dimension Induction
- Title(参考訳): FGM-HD:ハウスドルフ次元誘導によるフラクタル生成モデルの多様性向上
- Authors: Haowei Zhang, Yuanpei Zhao, Ji-Zhe Zhou, Mao Li,
- Abstract要約: フラクタル生成モデル(FGM)は高品質な画像を生成するのに効率的であるが、その固有の自己相似性は出力画像の多様性を制限する。
本稿では,構造的複雑性の定量化に使用されるフラクタル幾何の概念であるハウスドルフ次元(HD)に基づく新しいアプローチを提案する。
ImageNetデータセットの実験では、私たちのFGM-HDフレームワークは、バニラFGMと比較して出力の多様性が39%向上することを示した。
- 参考スコア(独自算出の注目度): 9.446232705010916
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Improving the diversity of generated results while maintaining high visual quality remains a significant challenge in image generation tasks. Fractal Generative Models (FGMs) are efficient in generating high-quality images, but their inherent self-similarity limits the diversity of output images. To address this issue, we propose a novel approach based on the Hausdorff Dimension (HD), a widely recognized concept in fractal geometry used to quantify structural complexity, which aids in enhancing the diversity of generated outputs. To incorporate HD into FGM, we propose a learnable HD estimation method that predicts HD directly from image embeddings, addressing computational cost concerns. However, simply introducing HD into a hybrid loss is insufficient to enhance diversity in FGMs due to: 1) degradation of image quality, and 2) limited improvement in generation diversity. To this end, during training, we adopt an HD-based loss with a monotonic momentum-driven scheduling strategy to progressively optimize the hyperparameters, obtaining optimal diversity without sacrificing visual quality. Moreover, during inference, we employ HD-guided rejection sampling to select geometrically richer outputs. Extensive experiments on the ImageNet dataset demonstrate that our FGM-HD framework yields a 39\% improvement in output diversity compared to vanilla FGMs, while preserving comparable image quality. To our knowledge, this is the very first work introducing HD into FGM. Our method effectively enhances the diversity of generated outputs while offering a principled theoretical contribution to FGM development.
- Abstract(参考訳): 視覚的品質を維持しながら生成結果の多様性を向上させることは、画像生成タスクにおいて重要な課題である。
フラクタル生成モデル(FGM)は高品質な画像を生成するのに効率的であるが、その固有の自己相似性は出力画像の多様性を制限する。
本稿では, 構造的複雑性の定量化に使用されるフラクタル幾何の概念として, ハウスドルフ次元(HD)に基づく新しい手法を提案する。
FGMにHDを組み込むために,画像埋め込みから直接HDを予測し,計算コストの懸念に対処する学習可能なHD推定法を提案する。
しかし、ハイブリッド損失にHDを導入するだけでは、FGMの多様性を高めるには不十分である。
1)画質の劣化、及び
2) 世代多様性の制限された改善。
この目的のために、トレーニング中に単調運動量駆動型スケジューリング戦略によるHDベースの損失を採用し、過パラメータを漸進的に最適化し、視覚的品質を犠牲にすることなく最適な多様性を得る。
さらに、推測中に、幾何的にリッチな出力を選択するためにHD誘導型リジェクションサンプリングを用いる。
ImageNetデータセットの大規模な実験により、当社のFGM-HDフレームワークは、バニラFGMに比べて出力の多様性が39倍向上し、画像品質は同等であることがわかった。
私たちの知る限り、これがFGMにHDを導入した最初の作品です。
提案手法は,FGM開発への理論的貢献を原則として提案しながら,出力の多様性を効果的に向上させる。
関連論文リスト
- Detecting Generated Images by Fitting Natural Image Distributions [75.31113784234877]
本稿では,自然画像と生成画像のデータ多様体間の幾何学的差異を利用した新しいフレームワークを提案する。
自然画像に対して一貫した出力を出力するために設計された関数対を用いるが、生成した関数に対しては発散出力を用いる。
データ多様体に沿った変換が、自然画像上で事前訓練された自己教師付きモデルの損失値に有意な変化をもたらす場合、画像は生成されたものとして識別される。
論文 参考訳(メタデータ) (2025-11-03T07:20:38Z) - Meissonic: Revitalizing Masked Generative Transformers for Efficient High-Resolution Text-to-Image Synthesis [62.57727062920458]
本稿では,非自己回帰型マスク画像モデリング(MIM)をSDXLのような最先端拡散モデルに匹敵するレベルまで高めるMeissonicを提案する。
高品質なトレーニングデータを活用し、人間の嗜好スコアから得られるマイクロ条件を統合し、特徴圧縮層を用いる。
我々のモデルは、高画質の高精細画像を生成する際に、SDXLのような既存のモデルに適合するだけでなく、しばしば性能を上回ります。
論文 参考訳(メタデータ) (2024-10-10T17:59:17Z) - Elucidating Optimal Reward-Diversity Tradeoffs in Text-to-Image Diffusion Models [20.70550870149442]
Annealed Importance Guidance(AIG)は、Annealed Importance Smplingにインスパイアされた推論時正規化である。
安定拡散モデルに対するAIGの利点を実証し、報酬最適化と画像の多様性の最適なバランスを図った。
論文 参考訳(メタデータ) (2024-09-09T16:27:26Z) - A Bayesian Non-parametric Approach to Generative Models: Integrating Variational Autoencoder and Generative Adversarial Networks using Wasserstein and Maximum Mean Discrepancy [2.5109359014278954]
本稿では,GAN(generative adversarial network)とVAE(variantal autoencoder)において,いくつかの顕著な障害モードに対処する,ベイズ非パラメトリック学習(BNPL)フレームワークの新たな生成モデルを提案する。
我々は、BNPLフレームワークがトレーニングの安定性を高め、WMMD(Wsserstein distance and maximum mean discrepancy measure)をモデルの損失関数に組み込む際に、堅牢性と精度の保証を提供することを示す。
論文 参考訳(メタデータ) (2023-08-27T08:58:31Z) - Generative Diffusion Prior for Unified Image Restoration and Enhancement [62.76390152617949]
既存の画像復元法は、主に自然画像の後方分布を利用する。
教師なしサンプリング方式で後部分布を効果的にモデル化するための生成拡散優先(GDP)を提案する。
GDPは、線形逆問題、非線形問題、ブラインド問題を解くために、プレトレインデノナイジング拡散生成モデル(DDPM)を利用する。
論文 参考訳(メタデータ) (2023-04-03T16:52:43Z) - VIDM: Video Implicit Diffusion Models [75.90225524502759]
拡散モデルは、高品質で多様な画像の集合を合成するための強力な生成方法として登場した。
本研究では,移動の効果を暗黙の条件でモデル化する拡散モデルに基づく映像生成手法を提案する。
我々は,空間トランケーションのサンプリング,ロバストネスペナルティ,位置群正規化などの複数の戦略を提案することにより,生成されたビデオの品質を向上させる。
論文 参考訳(メタデータ) (2022-12-01T02:58:46Z) - Auto-regressive Image Synthesis with Integrated Quantization [55.51231796778219]
本稿では,条件付き画像生成のための多目的フレームワークを提案する。
CNNの帰納バイアスと自己回帰の強力なシーケンスモデリングが組み込まれている。
提案手法は,最先端技術と比較して,優れた多彩な画像生成性能を実現する。
論文 参考訳(メタデータ) (2022-07-21T22:19:17Z) - A Closer Look at Few-shot Image Generation [38.83570296616384]
訓練済みのGANを小さなターゲットデータで転送する場合、ジェネレータはトレーニングサンプルを複製する傾向がある。
この数ショットの画像生成に対処するいくつかの方法が提案されているが、それらを統一されたフレームワークで分析する努力が不足している。
適応中に既存の手法を解析するためのフレームワークを提案する。
第2のコントリビューションは、ソースドメインのリッチなマルチレベル多様性情報をターゲットドメインジェネレータに保持するために、相互情報(MI)を適用することを提案する。
論文 参考訳(メタデータ) (2022-05-08T07:46:26Z) - DVG-Face: Dual Variational Generation for Heterogeneous Face Recognition [85.94331736287765]
我々は、HFRを二重生成問題として定式化し、新しいDual Variational Generation(DVG-Face)フレームワークを用いてそれに取り組む。
大規模可視データの豊富なアイデンティティ情報を結合分布に統合する。
同一の同一性を持つ多種多様な多種多様な画像は、ノイズから生成することができる。
論文 参考訳(メタデータ) (2020-09-20T09:48:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。