論文の概要: CraftGraffiti: Exploring Human Identity with Custom Graffiti Art via Facial-Preserving Diffusion Models
- arxiv url: http://arxiv.org/abs/2508.20640v1
- Date: Thu, 28 Aug 2025 10:38:13 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-29 18:12:02.338735
- Title: CraftGraffiti: Exploring Human Identity with Custom Graffiti Art via Facial-Preserving Diffusion Models
- Title(参考訳): CraftGraffiti: 顔保存拡散モデルによるカスタムグラフィティアートによるヒューマンアイデンティティの探索
- Authors: Ayan Banerjee, Fernando Vilariño, Josep Lladós,
- Abstract要約: 極端なスタイリスティック・トランスフォーメーションの下で顔のアイデンティティを保持することは、生成芸術において大きな課題である。
本稿では,顔の特徴保存を主目的としたエンドツーエンドのテキストガイドグラフィティ生成フレームワークCraftGraffitiを紹介する。
CraftGraffitiはまず、LoRAで調整された事前訓練された拡散トランスフォーマーを介してグラフィティスタイルのトランスファーを適用し、その後、顔に一貫性のある自己認識機構を通じてアイデンティティの忠実さを強制する。
- 参考スコア(独自算出の注目度): 43.96017763034248
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Preserving facial identity under extreme stylistic transformation remains a major challenge in generative art. In graffiti, a high-contrast, abstract medium, subtle distortions to the eyes, nose, or mouth can erase the subject's recognizability, undermining both personal and cultural authenticity. We present CraftGraffiti, an end-to-end text-guided graffiti generation framework designed with facial feature preservation as a primary objective. Given an input image and a style and pose descriptive prompt, CraftGraffiti first applies graffiti style transfer via LoRA-fine-tuned pretrained diffusion transformer, then enforces identity fidelity through a face-consistent self-attention mechanism that augments attention layers with explicit identity embeddings. Pose customization is achieved without keypoints, using CLIP-guided prompt extension to enable dynamic re-posing while retaining facial coherence. We formally justify and empirically validate the "style-first, identity-after" paradigm, showing it reduces attribute drift compared to the reverse order. Quantitative results demonstrate competitive facial feature consistency and state-of-the-art aesthetic and human preference scores, while qualitative analyses and a live deployment at the Cruilla Festival highlight the system's real-world creative impact. CraftGraffiti advances the goal of identity-respectful AI-assisted artistry, offering a principled approach for blending stylistic freedom with recognizability in creative AI applications.
- Abstract(参考訳): 極端なスタイリスティック・トランスフォーメーションの下で顔のアイデンティティを保持することは、生成芸術において大きな課題である。
落書きでは、高コントラストで抽象的な媒体であり、目、鼻、口への微妙な歪みは、被験者の認識性を消し、個人的および文化的信頼を損なう。
本稿では,顔の特徴保存を主目的としたエンドツーエンドのテキストガイドグラフィティ生成フレームワークCraftGraffitiを紹介する。
入力画像とスタイルと説明的なプロンプトを与えられたCraftGraffitiは、まずLoRAで調整された事前訓練された拡散トランスフォーマーを介してグラフィティスタイルのトランスファーを適用し、次に、明示的なアイデンティティ埋め込みで注意層を拡大する顔一貫性の自己保持機構を通じてアイデンティティの忠実度を強制する。
ポースカスタマイズはキーポイントなしで実現され、CLIP誘導プロンプト拡張を使用して、顔のコヒーレンスを維持しながら動的再考を可能にする。
我々は「スタイルファースト、アイデンティティ・アフター」パラダイムを正式に正当化し、実証的に検証し、逆順に比べて属性のドリフトを減少させることを示す。
定量的な結果は、競合する顔の特徴の一貫性と最先端の美観と人間の嗜好のスコアを示し、質的な分析とCruilla Festivalでのライブデプロイメントは、システムの現実的な創造的影響を強調している。
CraftGraffitiは、創造的なAIアプリケーションにおいて、スタイリスティックな自由と認識可能性とをブレンドするための原則化されたアプローチを提供する、アイデンティティを尊重するAI支援アーティストの目標を推進している。
関連論文リスト
- SIDeR: Semantic Identity Decoupling for Unrestricted Face Privacy [53.75084833636302]
本稿では,非制限顔プライバシー保護のためのセマンティックデカップリング駆動フレームワークSIDeRを提案する。
SIDeRは、顔画像をマシン認識可能な識別特徴ベクトルと視覚的に知覚可能なセマンティックな外観成分に分解する。
認証されたアクセスのために、SIDeRは正しいパスワードが提供されるときに元の形式に復元できる。
論文 参考訳(メタデータ) (2026-02-04T19:30:48Z) - Advancing Facial Stylization through Semantic Preservation Constraint and Pseudo-Paired Supervision [3.4228848885035092]
これらの問題は、スタイリゼーション中にジェネレータのセマンティックシフトを無視することに起因すると我々は主張する。
意味的保存制約と擬似ペア付き監視を統合した顔のスタイリング手法を提案する。
顔のスタイリゼーションを基盤として,より柔軟なマルチモーダルおよび参照誘導型スタイリゼーションを実現する。
論文 参考訳(メタデータ) (2025-06-27T08:44:31Z) - Training-Free Diffusion Framework for Stylized Image Generation with Identity Preservation [0.31498833540989407]
『モザイク復元コンテンツイメージ』技術は複雑なシーンにおけるアイデンティティ保持を著しく向上させる。
『モザイク復元コンテンツ画像』技術は、スタイリゼーション中にオリジナル画像に注意を向けることで、細かな細部を保存しやすくする。
論文 参考訳(メタデータ) (2025-06-07T13:54:02Z) - InstaFace: Identity-Preserving Facial Editing with Single Image Inference [13.067402877443902]
本稿では,単一の画像のみを用いてアイデンティティを保存しながら,現実的な画像を生成するための,新しい拡散ベースのフレームワークInstaFaceを紹介する。
InstaFaceは、トレーニング可能なパラメータを追加することなく、複数の3DMMベースの条件を統合することで、3Dの視点を活用する。
本手法は, 身元保存, 光リアリズム, ポーズ, 表情, 照明の効果的な制御において, 最先端のアプローチよりも優れている。
論文 参考訳(メタデータ) (2025-02-27T22:37:09Z) - Foundation Cures Personalization: Improving Personalized Models' Prompt Consistency via Hidden Foundation Knowledge [33.35678923549471]
textbfFreeCureはパーソナライゼーションモデルの迅速な一貫性を改善するフレームワークである。
本稿では, 個人化プロセスに適切な属性情報をもたらすための, インバージョンベースのプロセスと合わせて, ファンデーションを意識した新たな自己意識モジュールを提案する。
FreeCureは、さまざまな最先端の顔のパーソナライゼーションモデルに対して、迅速な一貫性を顕著に向上させた。
論文 参考訳(メタデータ) (2024-11-22T15:21:38Z) - Content and Salient Semantics Collaboration for Cloth-Changing Person Re-Identification [74.10897798660314]
衣服を交換する人物の再識別は、重複しないカメラで同じ人物の衣服の変化を認識することを目的としている。
衣服の外観からの干渉を効果的に軽減し、堅牢なアイデンティティ関連コンテンツと有能なセマンティックス・セマンティックス・マイニング・リファインメント(SMR)を抽出する統合されたセマンティックス・マイニング・アンド・リファインメント(SMR)モジュールを提案する。
提案手法は,3種類の布質変化ベンチマーク上での最先端性能を実現し,先進的な競合相手に対する優位性を実証する。
論文 参考訳(メタデータ) (2024-05-26T15:17:28Z) - DiffFAE: Advancing High-fidelity One-shot Facial Appearance Editing with Space-sensitive Customization and Semantic Preservation [84.0586749616249]
本稿では,高忠実度顔画像編集に適した1段階かつ高効率な拡散ベースフレームワークDiffFAEを提案する。
高忠実度クエリ属性転送には、空間感性物理カスタマイズ(SPC)を採用し、忠実度と一般化能力を保証している。
ソース属性を保存するために、Regional-responsive Semantic Composition (RSC)を導入する。
このモジュールは、切り離されたソースを無視する特徴を学習するためにガイドされ、髪、服、背景などの非顔的属性からアーティファクトを保存し緩和する。
論文 参考訳(メタデータ) (2024-03-26T12:53:10Z) - DemoCaricature: Democratising Caricature Generation with a Rough Sketch [80.90808879991182]
我々は、個々人が写真と概念スケッチだけで個人化された似顔絵を作れるように、似顔絵生成を民主化します。
私たちの目標は、スケッチに固有の創造性と主観性を保ちながら、抽象化とアイデンティティの微妙なバランスを取ることです。
論文 参考訳(メタデータ) (2023-12-07T15:35:42Z) - Personalized Face Inpainting with Diffusion Models by Parallel Visual
Attention [55.33017432880408]
本稿では,パラレル視覚注意(PVA, Parallel Visual Attention, PVA)と拡散モデルとの併用による塗装結果の改善を提案する。
我々はCelebAHQ-IDIで注目モジュールとIDエンコーダをトレーニングする。
実験により, PVAは顔の塗り絵と顔の塗り絵の両面において, 言語指導タスクと相容れない同一性を持つことが示された。
論文 参考訳(メタデータ) (2023-12-06T15:39:03Z) - When StyleGAN Meets Stable Diffusion: a $\mathscr{W}_+$ Adapter for
Personalized Image Generation [60.305112612629465]
テキストと画像の拡散モデルは、多種多様で高品質でフォトリアリスティックな画像を生成するのに優れている。
本稿では,拡散モデルのための拡張されたアイデンティティ保存とアンタングル化を実現するために,StyleGAN 埋め込み空間 $mathcalW_+$ の新たな利用法を提案する。
提案手法は,即時記述に適合するだけでなく,一般的なスタイルGAN編集方向に対応可能なパーソナライズされたテキスト・ツー・イメージ出力を生成する。
論文 参考訳(メタデータ) (2023-11-29T09:05:14Z) - Few-shots Portrait Generation with Style Enhancement and Identity
Preservation [3.6937810031393123]
StyleIdentityGANモデルは、生成された肖像画のアイデンティティと芸術性を同時に確保することができる。
スタイル強化モジュールは、生成した仮想顔画像の芸術性を改善するために、デカップリングと転送の芸術的スタイルの特徴に焦点を当てている。
アートやアイデンティティ効果の最先端手法よりもStyleIdentityGANの方が優れていることを示す実験を行った。
論文 参考訳(メタデータ) (2023-03-01T10:02:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。