論文の概要: Diffusion Fuzzy System: Fuzzy Rule Guided Latent Multi-Path Diffusion Modeling
- arxiv url: http://arxiv.org/abs/2512.01533v1
- Date: Mon, 01 Dec 2025 11:01:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-02 19:46:34.813579
- Title: Diffusion Fuzzy System: Fuzzy Rule Guided Latent Multi-Path Diffusion Modeling
- Title(参考訳): 拡散ファジィシステム:ファジィ規則を導出した遅延マルチパス拡散モデル
- Authors: Hailong Yang, Te Zhang, Kup-sze Choi, Zhaohong Deng,
- Abstract要約: Diffusion Fuzzy System (DFS) はファジィ規則で導かれる遅延空間多経路拡散モデルである。
DFSは,既存の単一経路拡散モデルや複数経路拡散モデルよりも,より安定したトレーニングと高速収束を実現する。
- 参考スコア(独自算出の注目度): 21.695787474679324
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Diffusion models have emerged as a leading technique for generating images due to their ability to create high-resolution and realistic images. Despite their strong performance, diffusion models still struggle in managing image collections with significant feature differences. They often fail to capture complex features and produce conflicting results. Research has attempted to address this issue by learning different regions of an image through multiple diffusion paths and then combining them. However, this approach leads to inefficient coordination among multiple paths and high computational costs. To tackle these issues, this paper presents a Diffusion Fuzzy System (DFS), a latent-space multi-path diffusion model guided by fuzzy rules. DFS offers several advantages. First, unlike traditional multi-path diffusion methods, DFS uses multiple diffusion paths, each dedicated to learning a specific class of image features. By assigning each path to a different feature type, DFS overcomes the limitations of multi-path models in capturing heterogeneous image features. Second, DFS employs rule-chain-based reasoning to dynamically steer the diffusion process and enable efficient coordination among multiple paths. Finally, DFS introduces a fuzzy membership-based latent-space compression mechanism to reduce the computational costs of multi-path diffusion effectively. We tested our method on three public datasets: LSUN Bedroom, LSUN Church, and MS COCO. The results show that DFS achieves more stable training and faster convergence than existing single-path and multi-path diffusion models. Additionally, DFS surpasses baseline models in both image quality and alignment between text and images, and also shows improved accuracy when comparing generated images to target references.
- Abstract(参考訳): 拡散モデルは、高解像度でリアルな画像を作成する能力のために、画像を生成するための主要な技術として登場した。
強力なパフォーマンスにもかかわらず、拡散モデルは大きな特徴を持つイメージコレクションの管理に苦戦している。
複雑な特徴を捉えたり、矛盾する結果を出すのに失敗することが多い。
研究は、複数の拡散経路を通して画像の異なる領域を学習し、それらを組み合わせることでこの問題に対処しようとしている。
しかし、このアプローチは複数の経路間の非効率な調整と高い計算コストをもたらす。
これらの問題に対処するために,ファジィ規則で導かれる遅延空間多経路拡散モデルである拡散ファジィシステム(DFS)を提案する。
DFSにはいくつかの利点がある。
まず、従来のマルチパス拡散法とは異なり、DFSは複数の拡散経路を使用し、それぞれが特定の画像特徴のクラスを学習する。
各パスを異なる機能タイプに割り当てることで、DFSは異種画像の特徴をキャプチャするマルチパスモデルの制限を克服する。
第二に、DFSは拡散過程を動的に操り、複数の経路間の効率的な調整を可能にするためにルールチェーンに基づく推論を用いる。
最後に、DFSはファジィメンバシップに基づく遅延空間圧縮機構を導入し、マルチパス拡散の計算コストを効果的に削減する。
LSUN Bedroom, LSUN Church, MS COCOの3つの公開データセットを用いて実験を行った。
その結果、DFSは既存の単一経路拡散モデルや複数経路拡散モデルよりも、より安定なトレーニングと高速収束を実現することがわかった。
さらに、DFSは、画像の品質とテキストと画像のアライメントの両方においてベースラインモデルを超え、生成した画像とターゲット参照を比較する際の精度も向上した。
関連論文リスト
- Unified Multimodal Discrete Diffusion [78.48930545306654]
複数のモードをまたいだ理解と生成が可能なマルチモーダル生成モデルは、自己回帰(AR)アプローチによって支配される。
共同テキストと画像領域の統一的な生成形式としての離散拡散モデルについて検討する。
テキストと画像の共同理解・生成が可能なUnified Multimodal Discrete Diffusion (UniDisc) モデルを提案する。
論文 参考訳(メタデータ) (2025-03-26T17:59:51Z) - Merging and Splitting Diffusion Paths for Semantically Coherent Panoramas [33.334956022229846]
本稿では,Merge-Attend-Diffuse演算子を提案する。
具体的には、拡散経路をマージし、自己および横断的意図をプログラムし、集約された潜在空間で操作する。
提案手法は,生成した画像の入力プロンプトと視覚的品質との整合性を維持しつつ,セマンティック・コヒーレンスを増大させる。
論文 参考訳(メタデータ) (2024-08-28T09:22:32Z) - DiffDis: Empowering Generative Diffusion Model with Cross-Modal
Discrimination Capability [75.9781362556431]
本稿では,拡散過程下での1つのフレームワークに,モダクティブと差別的事前学習を統一するDiffDisを提案する。
DiffDisは画像生成タスクと画像テキスト識別タスクの両方において単一タスクモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-08-18T05:03:48Z) - DifFSS: Diffusion Model for Few-Shot Semantic Segmentation [24.497112957831195]
本稿では,DifFSSと呼ばれるFSSタスクの拡散モデルを活用するための最初の研究について述べる。
新たなFSSパラダイムであるDifFSSは、ネットワーク構造を変更することなく、最先端のFSSモデルの性能をさらに向上させることができる。
論文 参考訳(メタデータ) (2023-07-03T06:33:49Z) - SDM: Spatial Diffusion Model for Large Hole Image Inpainting [106.90795513361498]
本稿では,空間拡散モデル(SDM)を提案する。
また,提案手法は非結合確率モデルと空間拡散スキームにより,高品質な大穴工法を実現する。
論文 参考訳(メタデータ) (2022-12-06T13:30:18Z) - SinDiffusion: Learning a Diffusion Model from a Single Natural Image [159.4285444680301]
SinDiffusionは1つの自然な画像からパッチの内部分布を捉えるためにデノナイズ拡散モデルを利用する。
SinDiffusionは、2つのコア設計に基づいている。まず、SinDiffusionは、段階的にスケールが成長する複数のモデルではなく、1つのスケールで1つのモデルで訓練されている。
第2に,拡散ネットワークのパッチレベルの受容領域は,画像のパッチ統計を捉える上で重要かつ効果的であることを示す。
論文 参考訳(メタデータ) (2022-11-22T18:00:03Z) - Versatile Diffusion: Text, Images and Variations All in One Diffusion
Model [76.89932822375208]
Versatile Diffusionは、テキスト・ツー・イメージ、画像・ツー・テキスト、バリエーションの複数のフローを1つの統一モデルで処理する。
私たちのコードとモデルはhttps://github.com/SHI-Labs/Versatile-Diffusion.comでオープンソース化されています。
論文 参考訳(メタデータ) (2022-11-15T17:44:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。