論文の概要: Latent Diffusion : Multi-Dimension Stable Diffusion Latent Space Explorer
- arxiv url: http://arxiv.org/abs/2509.22038v1
- Date: Fri, 26 Sep 2025 08:15:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-29 20:57:54.292763
- Title: Latent Diffusion : Multi-Dimension Stable Diffusion Latent Space Explorer
- Title(参考訳): 潜時拡散 : 多次元安定拡散潜時宇宙探査機
- Authors: Zhihua Zhong, Xuanyang Huang,
- Abstract要約: 本稿では、カスタマイズ可能な潜在空間演算を拡散プロセスに統合するフレームワークであるWorknameを紹介する。
概念的および空間的表現の直接操作を可能にすることにより、この手法は生成芸術における創造可能性を広げる。
- 参考スコア(独自算出の注目度): 6.6933005224319695
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Latent space is one of the key concepts in generative AI, offering powerful means for creative exploration through vector manipulation. However, diffusion models like Stable Diffusion lack the intuitive latent vector control found in GANs, limiting their flexibility for artistic expression. This paper introduces \workname, a framework for integrating customizable latent space operations into the diffusion process. By enabling direct manipulation of conceptual and spatial representations, this approach expands creative possibilities in generative art. We demonstrate the potential of this framework through two artworks, \textit{Infinitepedia} and \textit{Latent Motion}, highlighting its use in conceptual blending and dynamic motion generation. Our findings reveal latent space structures with semantic and meaningless regions, offering insights into the geometry of diffusion models and paving the way for further explorations of latent space.
- Abstract(参考訳): 潜在空間は生成AIにおける重要な概念の1つであり、ベクトル操作による創造的な探索に強力な手段を提供する。
しかし、安定拡散のような拡散モデルは、GANに見られる直感的な潜在ベクトル制御を欠き、芸術的表現の柔軟性を制限している。
本稿では,カスタマイズ可能な潜在空間演算を拡散プロセスに統合するフレームワークである‘workname’を紹介する。
概念的および空間的表現の直接操作を可能にすることにより、この手法は生成芸術における創造可能性を広げる。
本稿では,このフレームワークのポテンシャルを,概念ブレンディングと動的モーション生成に応用した2つのアートワーク, \textit{Infinitepedia} と \textit{Latent Motion} で実証する。
この結果から,意味的かつ無意味な領域を持つ潜在空間構造が明らかとなり,拡散モデルの幾何学的知見が得られ,潜在空間のさらなる探索への道が拓かれた。
関連論文リスト
- Exploring the latent space of diffusion models directly through singular value decomposition [31.900933527692846]
拡散モデルにおけるテキストプロンプトによって決定される1組の潜在符号から任意の属性を学習できる新しい画像編集フレームワークを提案する。
この分野のさらなる研究と応用を促進するため、まもなくコードをリリースします。
論文 参考訳(メタデータ) (2025-02-04T11:04:36Z) - SliderSpace: Decomposing the Visual Capabilities of Diffusion Models [50.82362500995365]
SliderSpaceは拡散モデルの視覚的能力を自動分解するフレームワークである。
単一のテキストプロンプトから複数の解釈可能かつ多様な方向を同時に検出する。
本手法は,ベースラインに比べて多様性があり,有用である。
論文 参考訳(メタデータ) (2025-02-03T18:59:55Z) - Unsupervised Region-Based Image Editing of Denoising Diffusion Models [50.005612464340246]
本研究では,事前学習した拡散モデルの潜在空間における意味的属性を,それ以上の訓練を伴わずに同定する手法を提案する。
提案手法により,局所的なマスキング領域の正確な意味発見と制御が容易になり,アノテーションの必要がなくなる。
論文 参考訳(メタデータ) (2024-12-17T13:46:12Z) - Decoding Diffusion: A Scalable Framework for Unsupervised Analysis of Latent Space Biases and Representations Using Natural Language Prompts [68.48103545146127]
本稿では拡散潜在空間の教師なし探索のための新しい枠組みを提案する。
我々は、自然言語のプロンプトと画像キャプションを直接利用して、遅延方向をマップする。
本手法は,拡散モデルに符号化された意味的知識をよりスケーラブルで解釈可能な理解を提供する。
論文 参考訳(メタデータ) (2024-10-25T21:44:51Z) - How to Blend Concepts in Diffusion Models [48.68800153838679]
近年の手法は複数の潜在表現とその関連性を利用しており、この研究はさらに絡み合っている。
我々のゴールは、潜在空間における操作が根底にある概念にどのように影響するかを理解することです。
我々の結論は、宇宙操作によるブレンドの概念は可能であるが、最良の戦略はブレンドの文脈に依存する。
論文 参考訳(メタデータ) (2024-07-19T13:05:57Z) - Isometric Representation Learning for Disentangled Latent Space of Diffusion Models [17.64488229224982]
等方的拡散(Isometric Diffusion)を提案し、幾何正則化器を備えた拡散モデルを用いてモデルを誘導し、トレーニングデータ多様体の幾何学的音響潜在空間を学習する。
このアプローチにより拡散モデルはより不整合な潜在空間を学習することができ、より滑らかで正確に逆転し、潜在空間に直接属性を制御できるようになる。
論文 参考訳(メタデータ) (2024-07-16T07:36:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。