論文の概要: ARTxAI: Explainable Artificial Intelligence Curates Deep Representation
Learning for Artistic Images using Fuzzy Techniques
- arxiv url: http://arxiv.org/abs/2308.15284v1
- Date: Tue, 29 Aug 2023 13:15:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-08-30 14:07:32.468760
- Title: ARTxAI: Explainable Artificial Intelligence Curates Deep Representation
Learning for Artistic Images using Fuzzy Techniques
- Title(参考訳): artxai:ファジィテクニックを用いたアートイメージの深層表現学習をキュレートする人工知能
- Authors: Javier Fumanal-Idocin, Javier Andreu-Perez, Oscar Cord\'on, Hani
Hagras, Humberto Bustince
- Abstract要約: 芸術的画像分類における異なる課題から得られる特徴が、類似した性質の他の課題を解決するのにどのように適しているかを示す。
本稿では、画像の既知の視覚特性をディープラーニングモデルで用いる特徴にマッピングする、説明可能な人工知能手法を提案する。
- 参考スコア(独自算出の注目度): 11.286457041998569
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic art analysis employs different image processing techniques to
classify and categorize works of art. When working with artistic images, we
need to take into account further considerations compared to classical image
processing. This is because such artistic paintings change drastically
depending on the author, the scene depicted, and their artistic style. This can
result in features that perform very well in a given task but do not grasp the
whole of the visual and symbolic information contained in a painting. In this
paper, we show how the features obtained from different tasks in artistic image
classification are suitable to solve other ones of similar nature. We present
different methods to improve the generalization capabilities and performance of
artistic classification systems. Furthermore, we propose an explainable
artificial intelligence method to map known visual traits of an image with the
features used by the deep learning model considering fuzzy rules. These rules
show the patterns and variables that are relevant to solve each task and how
effective is each of the patterns found. Our results show that our proposed
context-aware features can achieve up to $6\%$ and $26\%$ more accurate results
than other context- and non-context-aware solutions, respectively, depending on
the specific task. We also show that some of the features used by these models
can be more clearly correlated to visual traits in the original image than
others.
- Abstract(参考訳): 自動アート分析は、異なる画像処理技術を用いて芸術作品の分類と分類を行う。
芸術的なイメージを扱う場合、従来の画像処理と比較して、さらなる考慮が必要となる。
これは、作者や場面、その画風によって大きく変化するためである。
これは、あるタスクで非常にうまく機能するが、絵画に含まれる視覚および象徴的な情報全体を把握しない特徴をもたらす可能性がある。
本稿では,芸術的画像分類における異なるタスクから得られた特徴が,類似する他の特徴を解決するのにどのように適しているかを示す。
芸術分類システムの一般化能力と性能を改善するための様々な方法を提案する。
さらに,ファジィルールを考慮した深層学習モデルを用いて画像の既知の視覚特性をマッピングする,説明可能な人工知能手法を提案する。
これらのルールは、各タスクを解決するためのパターンと変数を示し、各パターンがどの程度効果的かを示す。
その結果、提案するコンテキスト認識機能は、特定のタスクに応じて、他のコンテキスト認識および非コンテキスト認識ソリューションよりも、最大6\%$および26\%$の正確な結果が得られることがわかった。
また、これらのモデルで使用される特徴のいくつかは、原画像の視覚的特徴と他の特徴とより明確に相関できることを示した。
関連論文リスト
- KALE: An Artwork Image Captioning System Augmented with Heterogeneous Graph [24.586916324061168]
本稿では,アートワーク開発のための知識付加型視覚言語モデルを提案する。
KALEはメタデータを2つの方法で組み込む: 第一に直接テキスト入力、第二にマルチモーダルなヘテロジニアス知識グラフである。
実験結果から,KALEは複数のアートデータセットにまたがる既存の最先端の作業に対して高い性能を発揮することが示された。
論文 参考訳(メタデータ) (2024-09-17T06:39:18Z) - Impressions: Understanding Visual Semiotics and Aesthetic Impact [66.40617566253404]
画像のセミオティックスを調べるための新しいデータセットであるImpressionsを提示する。
既存のマルチモーダル画像キャプションと条件付き生成モデルは、画像に対する可視的応答をシミュレートするのに苦労していることを示す。
このデータセットは、微調整と少数ショット適応により、画像の印象や美的評価をモデル化する能力を大幅に改善する。
論文 参考訳(メタデータ) (2023-10-27T04:30:18Z) - Coarse-to-Fine Contrastive Learning in Image-Text-Graph Space for
Improved Vision-Language Compositionality [50.48859793121308]
対照的に訓練された視覚言語モデルは、視覚と言語表現学習において顕著な進歩を遂げた。
近年の研究では、対象、属性、関係性に対して構成的推論を行う能力に厳しい制限が強調されている。
論文 参考訳(メタデータ) (2023-05-23T08:28:38Z) - Learning to Evaluate the Artness of AI-generated Images [64.48229009396186]
アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。
我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。
このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文 参考訳(メタデータ) (2023-05-08T17:58:27Z) - Inching Towards Automated Understanding of the Meaning of Art: An
Application to Computational Analysis of Mondrian's Artwork [0.0]
本稿では,セマンティック処理に関連する能力の同定を試みる。
提案手法は,モンドリアン絵画の理解過程と電子回路設計の理解過程を比較することで,不足する機能を明らかにする。
本手法の有用性を説明するために,モンドリアンの絵画を他の美術品と区別する新しい3段階の計算手法について論じる。
論文 参考訳(メタデータ) (2022-12-29T23:34:19Z) - Inversion-Based Style Transfer with Diffusion Models [78.93863016223858]
以前の任意の例として誘導された芸術的画像生成法は、しばしば形状変化の制御や要素の伝達に失敗する。
画像のキー情報を効率よく正確に学習できるインバージョンベースのスタイル転送手法(InST)を提案する。
論文 参考訳(メタデータ) (2022-11-23T18:44:25Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Automatic analysis of artistic paintings using information-based
measures [1.25456674968456]
美術絵画に存在する隠されたパターンと関係を,その複雑さを分析して同定する。
正規化圧縮(NC)とブロック分解法(BDM)を91名の著者による4,266点の絵のデータセットに適用した。
アーティストのスタイル、その芸術的影響、および共有技術に関する重要な情報を記述した指紋を定義する。
論文 参考訳(メタデータ) (2021-02-02T21:40:30Z) - This is not the Texture you are looking for! Introducing Novel
Counterfactual Explanations for Non-Experts using Generative Adversarial
Learning [59.17685450892182]
反実用説明システムは、入力画像を変更して反実用推論を可能にする。
本稿では, 対向画像から画像への変換技術に基づく, 対向画像の説明を新たに生成する手法を提案する。
その結果,我々のアプローチは,2つの最先端技術システムよりも,メンタルモデル,説明満足度,信頼度,感情,自己効力に関して有意に優れた結果をもたらすことがわかった。
論文 参考訳(メタデータ) (2020-12-22T10:08:05Z) - Learning Portrait Style Representations [34.59633886057044]
高レベル特性を取り入れたニューラルネットワークアーキテクチャによって学習されたスタイル表現について検討する。
美術史家によって注釈付けされた三重奏曲をスタイル類似性の監督として取り入れることで,学習スタイルの特徴の変化を見いだす。
また,計算解析用に用意された肖像画の大規模データセットを初めて提示する。
論文 参考訳(メタデータ) (2020-12-08T01:36:45Z) - Art Style Classification with Self-Trained Ensemble of AutoEncoding
Transformations [5.835728107167379]
絵画の芸術的スタイルは豊かな記述物であり、アーティストが創造的なビジョンをどのように表現し表現するかについての視覚的知識と深い本質的な知識の両方を明らかにする。
本稿では,高度な自己指導型学習手法を用いて,クラス内およびクラス間変動の少ない複雑な芸術的スタイルを認識することの課題を解決する。
論文 参考訳(メタデータ) (2020-12-06T21:05:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。