論文の概要: PaintFlow: A Unified Framework for Interactive Oil Paintings Editing and Generation
- arxiv url: http://arxiv.org/abs/2512.08534v1
- Date: Tue, 09 Dec 2025 12:31:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-10 22:28:07.949092
- Title: PaintFlow: A Unified Framework for Interactive Oil Paintings Editing and Generation
- Title(参考訳): PaintFlow: インタラクティブな油絵編集と生成のための統一フレームワーク
- Authors: Zhangli Hu, Ye Chen, Jiajun Yao, Bingbing Ni,
- Abstract要約: 油彩画は、人間の抽象的思考と芸術的表現を融合させる高水準の媒体である。
既存の生成および編集技術は、トレーニングデータの分散によって制約されることが多い。
油絵作成と編集のための統合型マルチモーダルフレームワークを提案する。
- 参考スコア(独自算出の注目度): 47.72342715926692
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Oil painting, as a high-level medium that blends human abstract thinking with artistic expression, poses substantial challenges for digital generation and editing due to its intricate brushstroke dynamics and stylized characteristics. Existing generation and editing techniques are often constrained by the distribution of training data and primarily focus on modifying real photographs. In this work, we introduce a unified multimodal framework for oil painting generation and editing. The proposed system allows users to incorporate reference images for precise semantic control, hand-drawn sketches for spatial structure alignment, and natural language prompts for high-level semantic guidance, while consistently maintaining a unified painting style across all outputs. Our method achieves interactive oil painting creation through three crucial technical advancements. First, we enhance the training stage with spatial alignment and semantic enhancement conditioning strategy, which map masks and sketches into spatial constraints, and encode contextual embedding from reference images and text into feature constraints, enabling object-level semantic alignment. Second, to overcome data scarcity, we propose a self-supervised style transfer pipeline based on Stroke-Based Rendering (SBR), which simulates the inpainting dynamics of oil painting restoration, converting real images into stylized oil paintings with preserved brushstroke textures to construct a large-scale paired training dataset. Finally, during inference, we integrate features using the AdaIN operator to ensure stylistic consistency. Extensive experiments demonstrate that our interactive system enables fine-grained editing while preserving the artistic qualities of oil paintings, achieving an unprecedented level of imagination realization in stylized oil paintings generation and editing.
- Abstract(参考訳): 油絵は、人間の抽象的思考と芸術的表現を融合した高レベルの媒体であり、複雑なブラシストローク力学とスタイル化された特徴により、デジタル生成と編集に重大な課題を提起する。
既存の生成・編集技術は、トレーニングデータの分布に制約されることが多く、主に実際の写真の修正に重点を置いている。
本研究では,油絵作成と編集のための統合型マルチモーダルフレームワークを提案する。
提案システムでは,高精度な意味制御のための参照画像,空間構造アライメントのための手書きスケッチ,高レベルの意味指導のための自然言語プロンプトを,すべての出力に対して一貫した絵画スタイルを維持しながら組み込むことができる。
本手法は,3つの重要な技術進歩を通じて,インタラクティブな油絵作成を実現する。
まず、マスクやスケッチを空間制約にマッピングし、参照画像やテキストからのコンテキスト埋め込みを特徴制約にエンコードすることで、オブジェクトレベルのセマンティックアライメントを可能にする。
次に,データ不足を克服するため,SBR(Stroke-Based Rendering)に基づく自己教師型トランスファーパイプラインを提案する。
最後に、推論中にAdaIN演算子を使用して機能を統合して、スタイリスティックな一貫性を保証する。
油絵の芸術的品質を保ちながら細粒度編集が可能であり, 油絵のスタイル化・編集において, 先例のない想像力の実現を実現している。
関連論文リスト
- Loomis Painter: Reconstructing the Painting Process [56.713812157283805]
ステップバイステップの絵画チュートリアルは芸術的技法を学ぶのに不可欠であるが、既存のビデオリソースには対話性とパーソナライゼーションが欠如している。
セマンティクス駆動型スタイル制御機構を用いたマルチメディア描画プロセス生成のための統一的なフレームワークを提案する。
また、実際の絵画プロセスの大規模データセットを構築し、メディア間の整合性、時間的コヒーレンス、最終的なイメージの忠実性を評価する。
論文 参考訳(メタデータ) (2025-11-21T16:06:32Z) - Birth of a Painting: Differentiable Brushstroke Reconstruction [25.61763988336406]
絵画は視覚的なストーリーテリングのユニークな形態を具現化しており、創造過程は最終作品と同じくらい重要である。
我々のアプローチはリアルでスタイリッシュな外観を生み出し、デジタル絵画の統一モデルを提供する。
論文 参考訳(メタデータ) (2025-11-17T09:55:53Z) - Every Painting Awakened: A Training-free Framework for Painting-to-Animation Generation [25.834500552609136]
I2V(Image-to-Video)合成により,実世界の静的絵画を生かしたトレーニングフリーフレームワークを提案する。
既存のI2V手法は、主に自然なビデオデータセットに基づいて訓練されており、静的な絵画から動的出力を生成するのに苦労することが多い。
我々のフレームワークは既存のI2V手法とプラグイン・アンド・プレイの統合を可能にし、現実世界の絵画をアニメーション化するのに理想的なソリューションとなる。
論文 参考訳(メタデータ) (2025-03-31T05:25:49Z) - Neural-Polyptych: Content Controllable Painting Recreation for Diverse Genres [30.83874057768352]
我々は,広汎で高解像度な絵画の作成を容易にするために,ニューラル・ポリプチッチという統一的な枠組みを提案する。
我々は、生成プロセスを2つの部分に分割する、マルチスケールのGANベースのアーキテクチャを設計した。
我々は東洋絵画と西洋絵画の両方の多様なジャンルへのアプローチを検証する。
論文 参考訳(メタデータ) (2024-09-29T12:46:00Z) - BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed
Dual-Branch Diffusion [61.90969199199739]
BrushNetは、ピクセルレベルのマスク付きイメージ機能を事前訓練されたDMに埋め込むために設計された、新しいプラグアンドプレイデュアルブランチモデルである。
BrushNetは、画像品質、マスク領域保存、テキストコヒーレンスを含む7つの主要な指標で、既存のモデルよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-03-11T17:59:31Z) - Text-Guided Synthesis of Eulerian Cinemagraphs [81.20353774053768]
テキスト記述からシネマグラフを作成する完全自動化された方法であるText2Cinemagraphを紹介する。
連続した動きと反復的なテクスチャを示す流れの川や漂流する雲などの流体要素のシネマグラフに焦点を当てる。
論文 参考訳(メタデータ) (2023-07-06T17:59:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。