論文の概要: Tiled Diffusion
- arxiv url: http://arxiv.org/abs/2412.15185v1
- Date: Thu, 19 Dec 2024 18:55:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-20 13:31:05.320112
- Title: Tiled Diffusion
- Title(参考訳): Tiled Diffusion
- Authors: Or Madar, Ohad Fried,
- Abstract要約: Tiled Diffusionは、凝集性タイリングパターンの生成に対応するために拡散モデルの能力を拡張する新しいアプローチである。
提案手法は, セルフタイリングから複雑な多対多接続に至るまで, 幅広いタイリングシナリオをサポートする。
- 参考スコア(独自算出の注目度): 8.777277201807351
- License:
- Abstract: Image tiling -- the seamless connection of disparate images to create a coherent visual field -- is crucial for applications such as texture creation, video game asset development, and digital art. Traditionally, tiles have been constructed manually, a method that poses significant limitations in scalability and flexibility. Recent research has attempted to automate this process using generative models. However, current approaches primarily focus on tiling textures and manipulating models for single-image generation, without inherently supporting the creation of multiple interconnected tiles across diverse domains. This paper presents Tiled Diffusion, a novel approach that extends the capabilities of diffusion models to accommodate the generation of cohesive tiling patterns across various domains of image synthesis that require tiling. Our method supports a wide range of tiling scenarios, from self-tiling to complex many-to-many connections, enabling seamless integration of multiple images. Tiled Diffusion automates the tiling process, eliminating the need for manual intervention and enhancing creative possibilities in various applications, such as seamlessly tiling of existing images, tiled texture creation, and 360{\deg} synthesis.
- Abstract(参考訳): 異なる画像をシームレスに接続してコヒーレントな視野を作り出すイメージタイリングは、テクスチャ生成、ビデオゲームアセット開発、デジタルアートなどのアプリケーションに不可欠である。
従来、タイルは手動で構築され、スケーラビリティと柔軟性に大きな制限を課す方法であった。
近年の研究では、生成モデルを用いてこのプロセスを自動化しようと試みている。
しかし、現在のアプローチは主に、様々な領域にまたがる複数の相互接続タイルの作成を本質的にサポートすることなく、単一画像生成のためのタイルテクスチャや操作モデルに重点を置いている。
本稿では,タイリングを必要とする画像合成の領域にまたがる凝集性タイリングパターンの生成に対応するために,拡散モデルの能力を拡張する新しい手法であるTiled Diffusionを提案する。
提案手法は,複数画像のシームレスな統合を実現するため,セルフタイリングから複雑な多対多接続に至るまで,幅広いタイリングシナリオをサポートする。
Tiled Diffusionはタイリングプロセスを自動化し、手作業による介入の必要性を排除し、既存のイメージのシームレスなタイリング、タイル付きテクスチャ生成、360{\deg}合成など、さまざまなアプリケーションにおける創造可能性を高める。
関連論文リスト
- DreamPolish: Domain Score Distillation With Progressive Geometry Generation [66.94803919328815]
本稿では,高精細な幾何学と高品質なテクスチャの創出に優れたテキスト・ツー・3D生成モデルであるDreamPolishを紹介する。
幾何構成フェーズでは, 合成過程の安定性を高めるために, 複数のニューラル表現を利用する。
テクスチャ生成フェーズでは、そのような領域に向けて神経表現を導くために、新しいスコア蒸留、すなわちドメインスコア蒸留(DSD)を導入する。
論文 参考訳(メタデータ) (2024-11-03T15:15:01Z) - Content-aware Tile Generation using Exterior Boundary Inpainting [3.3090362820994526]
本稿では,タイル状画像集合を生成するための新しいフレキシブルな学習手法を提案する。
画像からパッチを明示的にコピーすることで、コンテンツから構造を分離する。
異なるタイリング方式におけるコンテンツ認識タイル生成手法の柔軟性と有効性を示す。
論文 参考訳(メタデータ) (2024-09-21T16:04:13Z) - Many-to-many Image Generation with Auto-regressive Diffusion Models [59.5041405824704]
本稿では,与えられた画像集合から関連画像系列を生成可能な多対多画像生成のためのドメイン汎用フレームワークを提案する。
我々は,25個の相互接続された画像を含む12Mの合成マルチイメージサンプルを含む,新しい大規模マルチイメージデータセットMISを提案する。
我々はM2Mを学習し、M2Mは多対多生成のための自己回帰モデルであり、各画像は拡散フレームワーク内でモデル化される。
論文 参考訳(メタデータ) (2024-04-03T23:20:40Z) - Generative Powers of Ten [60.6740997942711]
本稿では,複数の画像スケールにまたがる一貫したコンテンツを生成するために,テキスト・ツー・イメージ・モデルを用いる手法を提案する。
マルチスケール拡散サンプリングを共同で行うことで実現した。
本手法は従来の超解像法よりも深いズームレベルを実現する。
論文 参考訳(メタデータ) (2023-12-04T18:59:25Z) - Image Inpainting via Tractable Steering of Diffusion Models [48.16994134964729]
本稿では,トラクタブル確率モデル(TPM)の制約後部を正確に,かつ効率的に計算する能力を活用することを提案する。
具体的には、確率回路(PC)と呼ばれる表現型TPMのクラスを採用する。
論文 参考訳(メタデータ) (2023-11-28T21:14:02Z) - Improving Few-shot Image Generation by Structural Discrimination and
Textural Modulation [10.389698647141296]
画像生成の目的は、このカテゴリからいくつかの画像が与えられた場合、あるカテゴリに対して可塑性で多様な画像を生成することである。
既存のアプローチでは、異なる画像をグローバルに補間するか、事前に定義された係数で局所表現を融合する。
本稿では,内部局所表現に外部意味信号を注入する新しいメカニズムを提案する。
論文 参考訳(メタデータ) (2023-08-30T16:10:21Z) - Real-World Image Variation by Aligning Diffusion Inversion Chain [53.772004619296794]
生成した画像と実世界の画像の間にはドメインギャップがあり、これは実世界の画像の高品質なバリエーションを生成する上での課題である。
実世界画像のアライメントによる変化(RIVAL)と呼ばれる新しい推論パイプラインを提案する。
我々のパイプラインは、画像生成プロセスとソース画像の反転チェーンを整列させることにより、画像の変動の生成品質を向上させる。
論文 参考訳(メタデータ) (2023-05-30T04:09:47Z) - MultiDiffusion: Fusing Diffusion Paths for Controlled Image Generation [34.61940502872307]
MultiDiffusionは、汎用的で制御可能な画像生成を可能にする統一されたフレームワークである。
高品質で多様な画像を生成するために,MultiDiffusionが容易に適用可能であることを示す。
論文 参考訳(メタデータ) (2023-02-16T06:28:29Z) - BlendGAN: Learning and Blending the Internal Distributions of Single
Images by Spatial Image-Identity Conditioning [37.21764919074815]
単一画像生成法は、複数のスケールで単一の自然な画像の内部パッチ分布を学習するために設計されている。
複数の画像の内部分布を同時に学習できる拡張フレームワークを提案する。
私たちのBlendGANは、シングルイメージモデルでサポートされていないアプリケーションへの扉を開きます。
論文 参考訳(メタデータ) (2022-12-03T10:38:27Z) - Controllable Person Image Synthesis with Spatially-Adaptive Warped
Normalization [72.65828901909708]
制御可能な人物画像生成は、望ましい属性を持つ現実的な人間の画像を作成することを目的としている。
本稿では,学習フロー場とワープ変調パラメータを統合した空間適応型ワープ正規化(SAWN)を提案する。
本稿では,テクスチャ・トランスファータスクの事前学習モデルを洗練するための,新たな自己学習部分置換戦略を提案する。
論文 参考訳(メタデータ) (2021-05-31T07:07:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。