論文の概要: Art Style Classification with Self-Trained Ensemble of AutoEncoding
Transformations
- arxiv url: http://arxiv.org/abs/2012.03377v1
- Date: Sun, 6 Dec 2020 21:05:23 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-21 14:03:15.714986
- Title: Art Style Classification with Self-Trained Ensemble of AutoEncoding
Transformations
- Title(参考訳): 自動エンコーディング変換の自己学習アンサンブルによるアートスタイル分類
- Authors: Akshay Joshi, Ankit Agrawal, Sushmita Nair
- Abstract要約: 絵画の芸術的スタイルは豊かな記述物であり、アーティストが創造的なビジョンをどのように表現し表現するかについての視覚的知識と深い本質的な知識の両方を明らかにする。
本稿では,高度な自己指導型学習手法を用いて,クラス内およびクラス間変動の少ない複雑な芸術的スタイルを認識することの課題を解決する。
- 参考スコア(独自算出の注目度): 5.835728107167379
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The artistic style of a painting is a rich descriptor that reveals both
visual and deep intrinsic knowledge about how an artist uniquely portrays and
expresses their creative vision. Accurate categorization of paintings across
different artistic movements and styles is critical for large-scale indexing of
art databases. However, the automatic extraction and recognition of these
highly dense artistic features has received little to no attention in the field
of computer vision research. In this paper, we investigate the use of deep
self-supervised learning methods to solve the problem of recognizing complex
artistic styles with high intra-class and low inter-class variation. Further,
we outperform existing approaches by almost 20% on a highly class imbalanced
WikiArt dataset with 27 art categories. To achieve this, we train the EnAET
semi-supervised learning model (Wang et al., 2019) with limited annotated data
samples and supplement it with self-supervised representations learned from an
ensemble of spatial and non-spatial transformations.
- Abstract(参考訳): 絵画の芸術的スタイルは、芸術家が創造的なビジョンを独特に表現し表現する方法に関する視覚的および深い内在的な知識の両方を明らかにする豊かな記述子である。
異なる芸術運動やスタイルの絵画の正確な分類は、大規模な美術データベースの索引付けに不可欠である。
しかし、これらの高密度な芸術的特徴の自動抽出と認識は、コンピュータビジョン研究の分野ではほとんど注目を集めていない。
本稿では,高度な自己指導型学習手法を用いて,クラス内およびクラス間変動の少ない複雑な芸術スタイルを認識することの課題を解決する。
さらに,27のカテゴリを持つ高度にクラス不均衡なウィキアートデータセット上で,既存のアプローチを約20%上回っている。
そこで我々は,EnAET半教師付き学習モデル(Wang et al., 2019)を注釈付きデータサンプルで訓練し,空間的および非空間的変換のアンサンブルから学習した自己教師付き表現で補う。
関連論文リスト
- APDDv2: Aesthetics of Paintings and Drawings Dataset with Artist Labeled Scores and Comments [45.57709215036539]
Aesthetics Paintings and Drawings dataset (APDD)は,24の異なる芸術カテゴリーと10の美的属性を含む最初の総合的な絵画コレクションである。
APDDv2は画像コーパスを拡張し、アノテーションの品質を改善し、詳細な言語コメントを特徴としている。
本稿では,ArtCLIP(Art Assessment Network for Specific Painting Styles)の改訂版について紹介する。
論文 参考訳(メタデータ) (2024-11-13T11:46:42Z) - Deep Ensemble Art Style Recognition [2.3369294168789203]
過去数十年間の膨大な量のアートワークのデジタル化は、抽象概念に関連する膨大な量のデータの分類、分析、管理の必要性を生み出した。
美術作品における様々な芸術的特徴の認識は、深層学習社会において注目されている。
本稿では,深層ネットワークを用いた美術スタイル認識の問題について考察する。
論文 参考訳(メタデータ) (2024-05-19T21:26:11Z) - Rethinking Artistic Copyright Infringements in the Era of Text-to-Image Generative Models [47.19481598385283]
ArtSavantは、ウィキアートの作品の参照データセットと比較することで、アーティストのユニークなスタイルを決定するツールである。
そこで我々は,3つの人気テキスト・画像生成モデルにまたがる芸術的スタイルの複製の頻度を定量的に把握するために,大規模な実証的研究を行った。
論文 参考訳(メタデータ) (2024-04-11T17:59:43Z) - AI Art Neural Constellation: Revealing the Collective and Contrastive
State of AI-Generated and Human Art [36.21731898719347]
我々は、人間の芸術遺産の文脈内でAI生成芸術を位置づけるための包括的な分析を行う。
私たちの比較分析は、ArtConstellationと呼ばれる広範なデータセットに基づいています。
鍵となる発見は、1800-2000年に作られた現代美術の原理とAIが生成したアートアートが視覚的に関連していることである。
論文 参考訳(メタデータ) (2024-02-04T11:49:51Z) - CreativeSynth: Creative Blending and Synthesis of Visual Arts based on
Multimodal Diffusion [74.44273919041912]
大規模なテキスト・画像生成モデルは印象的な進歩を遂げ、高品質な画像を合成する能力を示している。
しかし、これらのモデルを芸術的な画像編集に適用することは、2つの重要な課題を提起する。
我々は,マルチモーダル入力をコーディネートする拡散モデルに基づく,革新的な統一フレームワークCreative Synthを構築した。
論文 参考訳(メタデータ) (2024-01-25T10:42:09Z) - ARTxAI: Explainable Artificial Intelligence Curates Deep Representation
Learning for Artistic Images using Fuzzy Techniques [11.286457041998569]
芸術的画像分類における異なる課題から得られる特徴が、類似した性質の他の課題を解決するのにどのように適しているかを示す。
本稿では、画像の既知の視覚特性をディープラーニングモデルで用いる特徴にマッピングする、説明可能な人工知能手法を提案する。
論文 参考訳(メタデータ) (2023-08-29T13:15:13Z) - Knowledge-Aware Prompt Tuning for Generalizable Vision-Language Models [64.24227572048075]
本稿では,視覚言語モデルのためのKnowledge-Aware Prompt Tuning(KAPT)フレームワークを提案する。
我々のアプローチは、人間の知性からインスピレーションを得ており、外部知識は、通常、オブジェクトの新たなカテゴリを認識するために組み込まれています。
論文 参考訳(メタデータ) (2023-08-22T04:24:45Z) - Learning to Evaluate the Artness of AI-generated Images [64.48229009396186]
アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。
我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。
このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文 参考訳(メタデータ) (2023-05-08T17:58:27Z) - ALADIN-NST: Self-supervised disentangled representation learning of
artistic style through Neural Style Transfer [60.6863849241972]
我々は、画像に描かれた意味的内容から、より強く絡み合った視覚芸術スタイルの表現を学習する。
スタイルと内容の絡み合いに強く対処することで、スタイル固有のメトリクスが大きく向上することを示します。
論文 参考訳(メタデータ) (2023-04-12T10:33:18Z) - AesUST: Towards Aesthetic-Enhanced Universal Style Transfer [15.078430702469886]
AesUSTは、新しいユニバーサルスタイルトランスファーアプローチである。
本研究では, 芸術作品の大規模なコーパスから, 普遍的な美的特徴を学習するための美的差別化手法を提案する。
また,モデルをより効果的にトレーニングするために,2つの審美規則を組み込んだ新しい2段階移動訓練戦略を開発した。
論文 参考訳(メタデータ) (2022-08-27T13:51:11Z) - Automatic analysis of artistic paintings using information-based
measures [1.25456674968456]
美術絵画に存在する隠されたパターンと関係を,その複雑さを分析して同定する。
正規化圧縮(NC)とブロック分解法(BDM)を91名の著者による4,266点の絵のデータセットに適用した。
アーティストのスタイル、その芸術的影響、および共有技術に関する重要な情報を記述した指紋を定義する。
論文 参考訳(メタデータ) (2021-02-02T21:40:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。