論文の概要: Style-Aware Gloss Control for Generative Non-Photorealistic Rendering
- arxiv url: http://arxiv.org/abs/2602.16611v1
- Date: Wed, 18 Feb 2026 17:05:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-19 15:58:30.661864
- Title: Style-Aware Gloss Control for Generative Non-Photorealistic Rendering
- Title(参考訳): 非フォトリアリスティックレンダリングのためのスタイル認識グロス制御
- Authors: Santiago Jimenez-Navarro, Belen Masia, Ana Serrano,
- Abstract要約: 学習モデルにおいて、光沢と芸術スタイルがどのように表現されるかを研究する。
我々は,我々のスタイルと光沢を意識した潜伏空間を潜伏拡散モデルに接続する軽量アダプタを提案する。
- 参考スコア(独自算出の注目度): 3.6258775536484347
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Humans can infer material characteristics of objects from their visual appearance, and this ability extends to artistic depictions, where similar perceptual strategies guide the interpretation of paintings or drawings. Among the factors that define material appearance, gloss, along with color, is widely regarded as one of the most important, and recent studies indicate that humans can perceive gloss independently of the artistic style used to depict an object. To investigate how gloss and artistic style are represented in learned models, we train an unsupervised generative model on a newly curated dataset of painterly objects designed to systematically vary such factors. Our analysis reveals a hierarchical latent space in which gloss is disentangled from other appearance factors, allowing for a detailed study of how gloss is represented and varies across artistic styles. Building on this representation, we introduce a lightweight adapter that connects our style- and gloss-aware latent space to a latent-diffusion model, enabling the synthesis of non-photorealistic images with fine-grained control of these factors. We compare our approach with previous models and observe improved disentanglement and controllability of the learned factors.
- Abstract(参考訳): 人間は視覚的な外見から物体の物質的特性を推測することができ、この能力は絵画や図面の解釈に類似した知覚的戦略が導かれる芸術的描写にまで及ぶ。
素材の外観を規定する要因のうち、光沢は色とともに最も重要視され、近年の研究では、光沢は物体を描くのに使用される芸術的様式とは無関係に知覚できることが示されている。
学習モデルにおいて、光沢や芸術的スタイルがどのように表現されるかを調べるために、これらの要因を体系的に変化させるように設計された、新しくキュレートされた絵画オブジェクトのデータセット上で教師なし生成モデルを訓練する。
我々の分析では、光沢が他の外観要因から切り離されている階層的な潜在空間が明らかとなり、光沢がどのように表現され、芸術的スタイルによって異なるか、詳細な研究が可能となった。
この表現に基づいて、我々は、我々のスタイルと光沢を意識した潜在空間を潜在拡散モデルに接続する軽量なアダプタを導入し、これらの因子をきめ細かな制御で非フォトリアリスティック画像の合成を可能にする。
提案手法を従来のモデルと比較し,学習因子の絡み合いと制御性の改善を観察する。
関連論文リスト
- An Exploratory Study on Abstract Images and Visual Representations Learned from Them [27.912006389955945]
このパフォーマンスギャップの背景にある理由を考察し、抽象レベルでのハイレベルなセマンティックコンテンツをどの程度キャプチャできるかを考察する。
次に、分類、セグメンテーション、オブジェクト検出など様々なタスクにわたって、HAID上の従来の視覚システムを訓練し評価する。
また、抽象画像が視覚意味情報を伝達し、視覚タスクに寄与する潜在的に効果的なフォーマットとして考えられるかどうかについても論じる。
論文 参考訳(メタデータ) (2025-09-17T16:30:34Z) - Learning Artistic Signatures: Symmetry Discovery and Style Transfer [8.288443063900825]
芸術様式の明確な定義はない。
スタイルは、局所的なテクスチャの配置を規定するグローバルな対称性のセットと考えるべきである。
局所的特徴とグローバル的特徴の両方を考慮し、リージェネレータと従来のテクスチャ尺度の両方を用いて、どちらの特徴セットよりもアーティスト間のスタイル的類似性を定量的に捉えることができることを示す。
論文 参考訳(メタデータ) (2024-12-05T18:56:23Z) - Opt-In Art: Learning Art Styles Only from Few Examples [50.60063523054282]
ごく少数の例を考慮すれば,絵画を使わずに訓練されたモデルを芸術的なスタイルに適応させることが可能であることを示す。
意外なことに, 芸術的データに事前に触れることなく, 高品質な芸術的アウトプットを達成できることが示唆された。
論文 参考訳(メタデータ) (2024-11-29T18:59:01Z) - Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。
既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。
このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-27T04:30:18Z) - ARTxAI: Explainable Artificial Intelligence Curates Deep Representation
Learning for Artistic Images using Fuzzy Techniques [11.286457041998569]
芸術的画像分類における異なる課題から得られる特徴が、類似した性質の他の課題を解決するのにどのように適しているかを示す。
本稿では、画像の既知の視覚特性をディープラーニングモデルで用いる特徴にマッピングする、説明可能な人工知能手法を提案する。
論文 参考訳(メタデータ) (2023-08-29T13:15:13Z) - Inversion-Based Style Transfer with Diffusion Models [78.93863016223858]
以前の任意の例として誘導された芸術的画像生成法は、しばしば形状変化の制御や要素の伝達に失敗する。
画像のキー情報を効率よく正確に学習できるインバージョンベースのスタイル転送手法(InST)を提案する。
論文 参考訳(メタデータ) (2022-11-23T18:44:25Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Learning Portrait Style Representations [34.59633886057044]
高レベル特性を取り入れたニューラルネットワークアーキテクチャによって学習されたスタイル表現について検討する。
美術史家によって注釈付けされた三重奏曲をスタイル類似性の監督として取り入れることで,学習スタイルの特徴の変化を見いだす。
また,計算解析用に用意された肖像画の大規模データセットを初めて提示する。
論文 参考訳(メタデータ) (2020-12-08T01:36:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。