論文の概要: Not Only Generative Art: Stable Diffusion for Content-Style
Disentanglement in Art Analysis
- arxiv url: http://arxiv.org/abs/2304.10278v1
- Date: Thu, 20 Apr 2023 13:00:46 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-21 13:24:19.944734
- Title: Not Only Generative Art: Stable Diffusion for Content-Style
Disentanglement in Art Analysis
- Title(参考訳): 生成的アートだけでなく, 芸術分析におけるコンテンツ型不連続の安定拡散
- Authors: Yankun Wu, Yuta Nakashima, Noa Garcia
- Abstract要約: 五屋(ごや)は、近年の創作モデルで捉えた芸術的知識を蒸留して、内容や様式を乱す方法である。
実験により、合成された画像は、アートワークの実際の分布のプロキシとして十分に役立っていることが示された。
- 参考スコア(独自算出の注目度): 23.388338598125195
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The duality of content and style is inherent to the nature of art. For
humans, these two elements are clearly different: content refers to the objects
and concepts in the piece of art, and style to the way it is expressed. This
duality poses an important challenge for computer vision. The visual appearance
of objects and concepts is modulated by the style that may reflect the author's
emotions, social trends, artistic movement, etc., and their deep comprehension
undoubtfully requires to handle both. A promising step towards a general
paradigm for art analysis is to disentangle content and style, whereas relying
on human annotations to cull a single aspect of artworks has limitations in
learning semantic concepts and the visual appearance of paintings. We thus
present GOYA, a method that distills the artistic knowledge captured in a
recent generative model to disentangle content and style. Experiments show that
synthetically generated images sufficiently serve as a proxy of the real
distribution of artworks, allowing GOYA to separately represent the two
elements of art while keeping more information than existing methods.
- Abstract(参考訳): 内容と様式の二重性は芸術の本質に固有のものである。
人間にとって、これら2つの要素は明らかに異なる: 内容は芸術作品のオブジェクトや概念を指し、その表現方法のスタイルを指す。
この双対性はコンピュータビジョンにとって重要な課題となる。
物体や概念の視覚的な外観は、著者の感情、社会的傾向、芸術運動などを反映するスタイルによって調節され、その深い理解は間違いなく両方を扱う必要がある。
アート分析の一般的なパラダイムに向けた有望なステップは、コンテンツとスタイルを歪めることである。一方、アートの単一側面を削るために人間のアノテーションに頼ることは、セマンティックな概念と絵画の視覚的な外観を学ぶのに制限がある。
そこで我々は,最近の生成モデルで得られた芸術的知識を蒸留し,内容やスタイルを乱す手法であるGOYAを提案する。
実験の結果,合成画像はアートの実際の分布のプロキシとして十分に機能し,GOYAは2つの要素を別々に表現し,既存の手法よりも多くの情報を保持することができることがわかった。
関連論文リスト
- KALE: An Artwork Image Captioning System Augmented with Heterogeneous Graph [24.586916324061168]
本稿では,アートワーク開発のための知識付加型視覚言語モデルを提案する。
KALEはメタデータを2つの方法で組み込む: 第一に直接テキスト入力、第二にマルチモーダルなヘテロジニアス知識グラフである。
実験結果から,KALEは複数のアートデータセットにまたがる既存の最先端の作業に対して高い性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-09-17T06:39:18Z) - AI Art Neural Constellation: Revealing the Collective and Contrastive
State of AI-Generated and Human Art [36.21731898719347]
我々は、人間の芸術遺産の文脈内でAI生成芸術を位置づけるための包括的な分析を行う。
私たちの比較分析は、ArtConstellationと呼ばれる広範なデータセットに基づいています。
鍵となる発見は、1800-2000年に作られた現代美術の原理とAIが生成したアートアートが視覚的に関連していることである。
論文 参考訳(メタデータ) (2024-02-04T11:49:51Z) - Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。
既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。
このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-27T04:30:18Z) - Text-to-Image Generation for Abstract Concepts [76.32278151607763]
抽象概念のためのテキスト・画像生成フレームワーク(TIAC)を提案する。
抽象概念は曖昧さを避けるための詳細な定義で明確な意図に明確化されている。
LLM抽出フォームパターンセットから概念依存型フォームを検索する。
論文 参考訳(メタデータ) (2023-09-26T02:22:39Z) - Text-Guided Synthesis of Eulerian Cinemagraphs [81.20353774053768]
テキスト記述からシネマグラフを作成する完全自動化された方法であるText2Cinemagraphを紹介する。
連続した動きと反復的なテクスチャを示す流れの川や漂流する雲などの流体要素のシネマグラフに焦点を当てる。
論文 参考訳(メタデータ) (2023-07-06T17:59:31Z) - Learning to Evaluate the Artness of AI-generated Images [64.48229009396186]
アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。
我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。
このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文 参考訳(メタデータ) (2023-05-08T17:58:27Z) - ALADIN-NST: Self-supervised disentangled representation learning of
artistic style through Neural Style Transfer [60.6863849241972]
我々は、画像に描かれた意味的内容から、より強く絡み合った視覚芸術スタイルの表現を学習する。
スタイルと内容の絡み合いに強く対処することで、スタイル固有のメトリクスが大きく向上することを示します。
論文 参考訳(メタデータ) (2023-04-12T10:33:18Z) - Inversion-Based Style Transfer with Diffusion Models [78.93863016223858]
以前の任意の例として誘導された芸術的画像生成法は、しばしば形状変化の制御や要素の伝達に失敗する。
画像のキー情報を効率よく正確に学習できるインバージョンベースのスタイル転送手法(InST)を提案する。
論文 参考訳(メタデータ) (2022-11-23T18:44:25Z) - Formal Analysis of Art: Proxy Learning of Visual Concepts from Style
Through Language Models [10.854399031287393]
本稿では,美術の視覚的要素と原理を用いて絵画を定量化する機械学習システムを提案する。
本稿では,絵画の視覚概念を学習する手法として,プロキシ学習(プロキシラーニング)を提案する。
論文 参考訳(メタデータ) (2022-01-05T21:03:29Z) - Explain Me the Painting: Multi-Topic Knowledgeable Art Description
Generation [26.099306167995376]
本研究は、美術作品の包括的記述を生成することにより、芸術を人間に近づける枠組みを提示する。
このフレームワークは、量的および質的両方の徹底的な分析と、比較人間の評価によって検証される。
論文 参考訳(メタデータ) (2021-09-13T07:08:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。