論文の概要: Generative Phomosaic with Structure-Aligned and Personalized Diffusion
- arxiv url: http://arxiv.org/abs/2604.06989v1
- Date: Wed, 08 Apr 2026 12:06:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.506907
- Title: Generative Phomosaic with Structure-Aligned and Personalized Diffusion
- Title(参考訳): 構造的・パーソナライズされた拡散を伴う生成的フォモザイク
- Authors: Jaeyoung Chung, Hyunjin Son, Kyoung Mu Lee,
- Abstract要約: 光モザイク生成への最初の生成的アプローチを示す。
本フレームワークは,参照画像上での拡散に基づく生成条件を用いてタイル画像の合成を行う。
- 参考スコア(独自算出の注目度): 47.8410741289531
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present the first generative approach to photomosaic creation. Traditional photomosaic methods rely on a large number of tile images and color-based matching, which limits both diversity and structural consistency. Our generative photomosaic framework synthesizes tile images using diffusion-based generation conditioned on reference images. A low-frequency conditioned diffusion mechanism aligns global structure while preserving prompt-driven details. This generative formulation enables photomosaic composition that is both semantically expressive and structurally coherent, effectively overcoming the fundamental limitations of matching-based approaches. By leveraging few-shot personalized diffusion, our model is able to produce user-specific or stylistically consistent tiles without requiring an extensive collection of images.
- Abstract(参考訳): 光モザイク生成への最初の生成的アプローチを示す。
伝統的なフォトモザイク法は多数のタイル画像と色に基づくマッチングに依存しており、多様性と構造的整合性の両方を制限している。
我々の生成フォトモザイクフレームワークは,参照画像上での拡散に基づく生成条件を用いてタイル画像を合成する。
低周波条件拡散機構は、プロンプト駆動の詳細を保存しながら大域構造を整列させる。
この生成的定式化は、意味的に表現的かつ構造的に整合的な光モザイク合成を可能にし、マッチングベースのアプローチの基本的限界を効果的に克服する。
パーソナライズされた拡散の少ないモデルを利用することで,画像の大規模な収集を必要とせずに,ユーザ固有のタイルやスタイル的に整合したタイルを生成できる。
関連論文リスト
- Edit2Perceive: Image Editing Diffusion Models Are Strong Dense Perceivers [55.15722080205737]
Edit2Perceiveは、深度、正規度、マッティングの編集モデルを適応させる統合拡散フレームワークである。
私たちの単一ステップの決定論的推論は、比較的小さなデータセットでトレーニングしながら、より高速なランタイムをもたらす。
論文 参考訳(メタデータ) (2025-11-24T01:13:51Z) - Merging and Splitting Diffusion Paths for Semantically Coherent Panoramas [33.334956022229846]
本稿では,Merge-Attend-Diffuse演算子を提案する。
具体的には、拡散経路をマージし、自己および横断的意図をプログラムし、集約された潜在空間で操作する。
提案手法は,生成した画像の入力プロンプトと視覚的品質との整合性を維持しつつ,セマンティック・コヒーレンスを増大させる。
論文 参考訳(メタデータ) (2024-08-28T09:22:32Z) - FreeCompose: Generic Zero-Shot Image Composition with Diffusion Prior [50.0535198082903]
我々は,複数の入力イメージを単一のコヒーレントなイメージに統合する,新しい画像合成手法を提案する。
本稿では, 大規模事前学習拡散モデルに内在する強力な生成的前駆体を利用して, 汎用画像合成を実現する可能性を示す。
論文 参考訳(メタデータ) (2024-07-06T03:35:43Z) - Steered Diffusion: A Generalized Framework for Plug-and-Play Conditional
Image Synthesis [62.07413805483241]
Steered Diffusionは、無条件生成のために訓練された拡散モデルを用いたゼロショット条件画像生成のためのフレームワークである。
塗装,着色,テキスト誘導セマンティック編集,画像超解像などのタスクに対して,ステアリング拡散を用いた実験を行った。
論文 参考訳(メタデータ) (2023-09-30T02:03:22Z) - Mixture of Diffusers for scene composition and high resolution image
generation [0.0]
拡散器の混合は、既存の拡散モデルの上に構築され、より詳細な合成制御を提供するアルゴリズムである。
キャンバスの異なる領域に作用する複数の拡散過程を調和させることで、個々の物体の位置とスタイルが別々の拡散過程によって制御される大きな画像を生成することができる。
論文 参考訳(メタデータ) (2023-02-05T15:49:26Z) - SinDiffusion: Learning a Diffusion Model from a Single Natural Image [159.4285444680301]
SinDiffusionは1つの自然な画像からパッチの内部分布を捉えるためにデノナイズ拡散モデルを利用する。
SinDiffusionは、2つのコア設計に基づいている。まず、SinDiffusionは、段階的にスケールが成長する複数のモデルではなく、1つのスケールで1つのモデルで訓練されている。
第2に,拡散ネットワークのパッチレベルの受容領域は,画像のパッチ統計を捉える上で重要かつ効果的であることを示す。
論文 参考訳(メタデータ) (2022-11-22T18:00:03Z) - Compositional Visual Generation with Composable Diffusion Models [80.75258849913574]
拡散モデルを用いた構成生成のための代替的な構造的アプローチを提案する。
画像は拡散モデルの集合を構成することで生成され、それぞれが画像の特定のコンポーネントをモデル化する。
提案手法は, トレーニングで見られるものよりもはるかに複雑なシーンを, テスト時に生成することができる。
論文 参考訳(メタデータ) (2022-06-03T17:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。