論文の概要: Look, Compare and Draw: Differential Query Transformer for Automatic Oil Painting
- arxiv url: http://arxiv.org/abs/2603.27720v1
- Date: Sun, 29 Mar 2026 14:52:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:45.084164
- Title: Look, Compare and Draw: Differential Query Transformer for Automatic Oil Painting
- Title(参考訳): Look, Compare and Draw: 自動オイル塗装のための差分クエリ変換器
- Authors: Lingyu Liu, Yaxiong Wang, Li Zhu, Lizi Liao, Zhedong Zheng,
- Abstract要約: 本研究は, 動的で表現力豊かなブラシストロークの創出を強調する, 自動油絵への新たなアプローチを導入する。
ディファレンシャル画像解析をニューラルオイル塗装モデルに組み込み、連続したブラシストロークのインクリメンタルな影響に集中できるようにする。
- 参考スコア(独自算出の注目度): 40.70919374645325
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This work introduces a new approach to automatic oil painting that emphasizes the creation of dynamic and expressive brushstrokes. A pivotal challenge lies in mitigating the duplicate and common-place strokes, which often lead to less aesthetic outcomes. Inspired by the human painting process, \ie, observing, comparing, and drawing, we incorporate differential image analysis into a neural oil painting model, allowing the model to effectively concentrate on the incremental impact of successive brushstrokes. To operationalize this concept, we propose the Differential Query Transformer (DQ-Transformer), a new architecture that leverages differentially derived image representations enriched with positional encoding to guide the stroke prediction process. This integration enables the model to maintain heightened sensitivity to local details, resulting in more refined and nuanced stroke generation. Furthermore, we incorporate adversarial training into our framework, enhancing the accuracy of stroke prediction and thereby improving the overall realism and fidelity of the synthesized paintings. Extensive qualitative evaluations, complemented by a controlled user study, validate that our DQ-Transformer surpasses existing methods in both visual realism and artistic authenticity, typically achieving these results with fewer strokes. The stroke-by-stroke painting animations are available on our project website.
- Abstract(参考訳): 本研究は, 動的で表現力豊かなブラシストロークの創出を強調する, 自動油絵への新たなアプローチを導入する。
重要な課題は、重複と共通点のストロークを緩和することであり、しばしば美的結果の低下につながる。
人間の絵画プロセスである「ie」にインスパイアされ、観察、比較、描画を行い、ディファレンシャル画像解析をニューラルオイル塗装モデルに組み込むことで、連続するブラシストロークの漸進的な影響に効果的に集中することができる。
この概念を運用するために,DQ-Transformer(differial Query Transformer, DQ-Transformer, DQ-Transformer)を提案する。
この統合により、モデルは局所的な詳細に対する高い感度を維持することができ、より洗練され、ニュアンスドストロークの生成をもたらす。
さらに,本フレームワークに逆行訓練を取り入れ,ストローク予測の精度を高め,合成絵画の全体的な現実性と忠実性を向上させる。
我々のDQ-Transformerは、視覚的リアリズムと芸術的正当性の両方において既存の手法を超越し、典型的にはより少ないストロークでこれらの結果を達成することを検証する。
ストローク・バイ・ストローク・ペインティングのアニメーションはプロジェクトのウェブサイトで公開されています。
関連論文リスト
- PaintFlow: A Unified Framework for Interactive Oil Paintings Editing and Generation [47.72342715926692]
油彩画は、人間の抽象的思考と芸術的表現を融合させる高水準の媒体である。
既存の生成および編集技術は、トレーニングデータの分散によって制約されることが多い。
油絵作成と編集のための統合型マルチモーダルフレームワークを提案する。
論文 参考訳(メタデータ) (2025-12-09T12:31:00Z) - Vectorized Region Based Brush Strokes for Artistic Rendering [3.5297361401370044]
近年の脳卒中絵は、脳卒中パラメータの予測と反復的精錬によって脳卒中の詳細を捉えることに焦点が当てられている。
これらの手法は、しばしば芸術的原則や意図に沿ったストローク構成を作り出すのに苦労する。
i) 対象領域におけるブラシストロークのセマンティックガイダンスを容易にし, (ii) ブラシストロークパラメータを計算し, (iii) セグメントとストローク間のシーケンスを構築し, 最終的な図面を逐次描画する。
論文 参考訳(メタデータ) (2025-06-11T17:45:36Z) - Emergence of Painting Ability via Recognition-Driven Evolution [49.666177849272856]
脳卒中枝とパレット枝を併用したモデルを提案する。
マシンビジョンで達成した認識精度を計測することにより、視覚コミュニケーションの効率を定量化する。
実験結果から,本モデルは高次認識タスクにおいて優れた性能を発揮することが示された。
論文 参考訳(メタデータ) (2025-01-09T04:37:31Z) - PrefPaint: Aligning Image Inpainting Diffusion Model with Human Preference [62.72779589895124]
画像インペイントのための拡散モデルと人間の審美基準との整合性を、強化学習フレームワークを用いて初めて試みる。
我々は、人間の好みを付加した約51,000枚の画像からなるデータセットで報酬モデルを訓練する。
画像拡張や3次元再構成などの下流タスクの塗装比較実験により, 提案手法の有効性が示された。
論文 参考訳(メタデータ) (2024-10-29T11:49:39Z) - AttentionPainter: An Efficient and Adaptive Stroke Predictor for Scene Painting [82.54770866332456]
ストロークベースのレンダリング(SBR)は、入力画像をパラメータ化されたストロークのシーケンスに分解することを目的としており、入力画像に似た絵に描画することができる。
単一ステップのニューラルペイントのための効率よく適応的なモデルであるAttentionPainterを提案する。
論文 参考訳(メタデータ) (2024-10-21T18:36:45Z) - BrushNet: A Plug-and-Play Image Inpainting Model with Decomposed
Dual-Branch Diffusion [61.90969199199739]
BrushNetは、ピクセルレベルのマスク付きイメージ機能を事前訓練されたDMに埋め込むために設計された、新しいプラグアンドプレイデュアルブランチモデルである。
BrushNetは、画像品質、マスク領域保存、テキストコヒーレンスを含む7つの主要な指標で、既存のモデルよりも優れたパフォーマンスを実現している。
論文 参考訳(メタデータ) (2024-03-11T17:59:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。