論文の概要: MythraGen: Two-Stage Retrieval Augmented Art Generation Framework
- arxiv url: http://arxiv.org/abs/2606.22924v1
- Date: Mon, 22 Jun 2026 07:02:33 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-25 03:35:07.532989
- Title: MythraGen: Two-Stage Retrieval Augmented Art Generation Framework
- Title(参考訳): MythraGen: 2段階検索によるアート生成フレームワーク
- Authors: Quang-Khai Le, Cong-Long Nguyen, Minh-Triet Tran, Trung-Nghia Le,
- Abstract要約: 本手法は,アーティスト固有のスタイルとコンテンツを組み合わせることで,大規模アートデータセットから特徴を抽出し,生成プロセスを最適化する。
提案手法は,ユーザの入力と密に一致したアートワークを生成できる。
- 参考スコア(独自算出の注目度): 11.27056623462154
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Text-to-image generation has seen rapid advancements, especially with the development of generative models. However, challenges remain in achieving high-quality, contextually accurate image outputs that faithfully match the provided textual descriptions, especially in artistic generation. In this paper, we present a simple yet efficient retrieval augmented generation framework, namely MythraGen, for text-to-artistic image generation by integrating an art retrieval mechanism with LoRA-based model fine-tuning. Our method extracts features from a large-scale art dataset, optimizing the generation process by combining artist-specific styles and content. Particularly, retrieved images from an external art database that have the highest similarity to the query prompt are used to finetune Stable Diffusion using LoRA for desired art generation. Experimental results and user studies on the WikiArt dataset show that our proposed method can generate artworks that closely match the user's input, significantly outperforming existing solutions.
- Abstract(参考訳): テキスト・ツー・イメージ・ジェネレーションは、特に生成モデルの開発で急速に進歩した。
しかし、高品質で文脈的に正確な画像出力の実現には課題が残っており、特に芸術的生成において、提供されたテキスト記述に忠実に一致する。
本稿では,芸術検索機構とLoRAモデルファインチューニングを統合することで,テキストから芸術的画像生成のための簡易かつ効率的な検索拡張フレームワークMythraGenを提案する。
本手法は,アーティスト固有のスタイルとコンテンツを組み合わせることで,大規模アートデータセットから特徴を抽出し,生成プロセスを最適化する。
特に、クエリプロンプトに最も類似した外部アートデータベースから取得した画像を使用して、所望のアート生成にLoRAを用いて安定拡散を微調整する。
WikiArtデータセットを用いた実験結果とユーザスタディにより,提案手法はユーザの入力と密に一致したアートワークを生成することができ,既存のソリューションよりもはるかに優れていた。
関連論文リスト
- AnyArtisticGlyph: Multilingual Controllable Artistic Glyph Generation [19.2293398270178]
アートグリフ画像生成(AGIG)は、そのコンテンツを保存しながら、参照画像のスタイルをソースに転送する。
拡散型多言語制御可能な芸術的グリフ生成モデルであるAnyArtisticGlyphを紹介する。
論文 参考訳(メタデータ) (2025-04-07T05:37:39Z) - Artistic Intelligence: A Diffusion-Based Framework for High-Fidelity Landscape Painting Synthesis [2.205829309604458]
LPGenはランドスケープ・ペインティング・ジェネレーションに特化して設計された新しい拡散モデルである。
LPGenは、構造的およびスタイリスティックな特徴を独立して処理する分離されたクロスアテンションメカニズムを導入している。
モデルは高解像度のランドスケープ画像のキュレートされたデータセットに事前トレーニングされ、異なる芸術様式で分類され、詳細で一貫した出力を確保するために微調整される。
論文 参考訳(メタデータ) (2024-07-24T12:32:24Z) - TIGeR: Unifying Text-to-Image Generation and Retrieval with Large Multimodal Models [96.72318842152148]
1つのLMM(Large Multimodal Model)を用いたテキスト・画像生成と検索のための統合フレームワークを提案する。
具体的には,LMMの本質的な識別能力について検討し,テキスト・画像検索のための効率的な生成的検索手法を提案する。
次に、テキストプロンプトに対する応答として、生成画像と検索画像の間で最適なマッチング画像を選択するための自律決定機構を提案する。
論文 参考訳(メタデータ) (2024-06-09T15:00:28Z) - Prompt Expansion for Adaptive Text-to-Image Generation [51.67811570987088]
本稿では,より少ない労力で高品質で多様な画像を生成するためのPrompt Expansionフレームワークを提案する。
Prompt Expansionモデルはテキストクエリを入力として取り、拡張されたテキストプロンプトのセットを出力する。
本研究では,Prompt Expansionにより生成された画像が,ベースライン法により生成された画像よりも美的かつ多様であることを示す人体評価研究を行う。
論文 参考訳(メタデータ) (2023-12-27T21:12:21Z) - RenAIssance: A Survey into AI Text-to-Image Generation in the Era of
Large Model [93.8067369210696]
テキスト・ツー・イメージ生成(テキスト・トゥ・イメージ・ジェネレーション、英: Text-to-image Generation、TTI)とは、テキスト入力を処理し、テキスト記述に基づいて高忠実度画像を生成するモデルである。
拡散モデル (diffusion model) は、繰り返しステップによるノイズの体系的導入を通じて画像の生成に使用される顕著な生成モデルである。
大規模モデルの時代、モデルサイズを拡大し、大規模言語モデルとの統合により、TTIモデルの性能がさらに向上した。
論文 参考訳(メタデータ) (2023-09-02T03:27:20Z) - Diffusion idea exploration for art generation [0.10152838128195467]
拡散モデルは最近、クロスモーダルデータを用いた画像生成タスクにおいて、他の生成モデルよりも優れています。
このタスクの新たな画像生成の初期実験は、有望な質的結果を示した。
論文 参考訳(メタデータ) (2023-07-11T02:35:26Z) - Re-Imagen: Retrieval-Augmented Text-to-Image Generator [58.60472701831404]
検索用テキスト・ツー・イメージ・ジェネレータ(再画像)
検索用テキスト・ツー・イメージ・ジェネレータ(再画像)
論文 参考訳(メタデータ) (2022-09-29T00:57:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。