論文の概要: CNN-Based Classification of Persian Miniature Paintings from Five Renowned Schools
- arxiv url: http://arxiv.org/abs/2411.10330v1
- Date: Fri, 15 Nov 2024 16:29:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-18 15:38:02.401288
- Title: CNN-Based Classification of Persian Miniature Paintings from Five Renowned Schools
- Title(参考訳): CNNによる5つの学校におけるペルシャのミニチュア絵画の分類
- Authors: Mojtaba Shahi, Roozbeh Rajabi, Farnaz Masoumzadeh,
- Abstract要約: 畳み込みニューラルネットワーク(CNN)を用いた新しいアプローチを導入し、ペルシアのミニチュアをHerat、Tabriz-e Avval、Shiraz-e Avval、Tabriz-e Dovvom、Qajarの5つの学校から分類する。
平均精度は91%を超える。
- 参考スコア(独自算出の注目度): 0.6827423171182154
- License:
- Abstract: This article addresses the gap in computational painting analysis focused on Persian miniature painting, a rich cultural and artistic heritage. It introduces a novel approach using Convolutional Neural Networks (CNN) to classify Persian miniatures from five schools: Herat, Tabriz-e Avval, Shiraz-e Avval, Tabriz-e Dovvom, and Qajar. The method achieves an average accuracy of over 91%. A meticulously curated dataset captures the distinct features of each school, with a patch-based CNN approach classifying image segments independently before merging results for enhanced accuracy. This research contributes significantly to digital art analysis, providing detailed insights into the dataset, CNN architecture, training, and validation processes. It highlights the potential for future advancements in automated art analysis, bridging machine learning, art history, and digital humanities, thereby aiding the preservation and understanding of Persian cultural heritage.
- Abstract(参考訳): 本稿では,ペルシャのミニチュア絵画に焦点をあてた計算絵画解析のギャップについて論じる。
畳み込みニューラルネットワーク(CNN)を用いた新しいアプローチを導入し、ペルシアのミニチュアをHerat、Tabriz-e Avval、Shiraz-e Avval、Tabriz-e Dovvom、Qajarの5つの学校から分類する。
平均精度は91%を超える。
厳密にキュレートされたデータセットが各学校の特徴を捉え、パッチベースのCNNアプローチで画像セグメントを個別に分類し、結果をマージして精度を高める。
この研究は、デジタルアート分析に大きく貢献し、データセット、CNNアーキテクチャ、トレーニング、検証プロセスに関する詳細な洞察を提供する。
これは、自動化された芸術分析、ブリッジング機械学習、美術史、デジタル人文科学の将来の進歩の可能性を強調し、ペルシア文化遺産の保存と理解を支援する。
関連論文リスト
- Unlocking Comics: The AI4VA Dataset for Visual Understanding [62.345344799258804]
本稿では,1950年代のフレンチ・ベルジアン漫画に,深度推定,セマンティックセグメンテーション,サリエンシ検出,キャラクタ識別などのタスクを注記した新しいデータセットを提案する。
2つの異なる一貫したスタイルで構成され、自然画像から得られたオブジェクトの概念とラベルを取り入れている。
このような多様な情報を含むことで、このデータセットは計算の創造性を約束するだけでなく、アートのデジタル化やストーリーテリングの革新のための道も提供します。
論文 参考訳(メタデータ) (2024-10-27T14:27:05Z) - GalleryGPT: Analyzing Paintings with Large Multimodal Models [64.98398357569765]
美術品の分析は、個人の審美性を豊かにし、批判的思考能力を促進することができる芸術鑑賞のための重要かつ基本的な技術である。
アートワークを自動解析する以前の作業は、主に分類、検索、その他の単純なタスクに焦点を当てており、AIの目標とは程遠い。
LLaVAアーキテクチャに基づいて微調整されたGalleryGPTと呼ばれる,絵画解析のための優れた大規模マルチモーダルモデルを提案する。
論文 参考訳(メタデータ) (2024-08-01T11:52:56Z) - Artificial Intelligence-powered fossil shark tooth identification: Unleashing the potential of Convolutional Neural Networks [10.946419654203613]
本研究では,分離されたサメの歯のイメージを分類するためのCNN(Convolutional Neural Networks)の能力について検討した。
我々は、認識タスクに特化されたSharkNet-XというCNNを開発し、平均精度0.85に5倍の精度で到達した。
結果について古生物学的な視点を与えながらCNNの振る舞いを理解し説明するために, SHAP法を導入した。
論文 参考訳(メタデータ) (2024-05-07T10:49:10Z) - Blind Dates: Examining the Expression of Temporality in Historical
Photographs [57.07335632641355]
マルチモーダル言語とビジョンモデルであるCLIPのオープンソース実装であるOpenCLIPを用いて、画像の日付を調査する。
我々は1950年から1999年までの39,866枚のグレースケールの歴史的プレス写真を含むtextitDe Boer Scene Detectionデータセットを使用している。
解析の結果、バス、車、猫、犬、そして人々が写っている画像はより正確に年代付けされており、時間的マーカーの存在が示唆されている。
論文 参考訳(メタデータ) (2023-10-10T13:51:24Z) - Deep image prior inpainting of ancient frescoes in the Mediterranean
Alpine arc [0.3958317527488534]
DIPベースの塗り絵は、アーティファクトを減らし、文脈的/非局所的な情報に適応し、美術史家にとって貴重なツールを提供する。
本研究では,地中海アルプス弧のいくつかの礼拝堂に位置する中世絵画の高度に損傷を受けたデジタル画像のデータセットに,欠落した画像内容の再構成を行う。
論文 参考訳(メタデータ) (2023-06-25T11:19:47Z) - Synergy of Machine and Deep Learning Models for Multi-Painter
Recognition [0.0]
我々は,62名のアーティストを含む絵画認識タスクのための大規模データセットを新たに導入し,良好な結果を得た。
RegNetは、機能をエクスポートする上で、SVMは、最大85%のパフォーマンスを持つ画家に基づいて、イメージの最高の分類を行う。
論文 参考訳(メタデータ) (2023-04-28T11:34:53Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Revisiting Classifier: Transferring Vision-Language Models for Video
Recognition [102.93524173258487]
ダウンストリームタスクのためのタスク非依存の深層モデルから知識を伝達することは、コンピュータビジョン研究において重要なトピックである。
本研究では,映像分類作業における知識の伝達に着目した。
予測された言語モデルを用いて、効率的な翻訳学習のための適切なセマンティックターゲットを生成する。
論文 参考訳(メタデータ) (2022-07-04T10:00:47Z) - Graph Neural Networks for Knowledge Enhanced Visual Representation of
Paintings [14.89186519385364]
ArtSAGENetは、グラフニューラルネットワーク(GNN)と畳み込みニューラルネットワーク(CNN)を統合する新しいアーキテクチャである。
提案したArtSAGENetは,アーティストとアートワーク間の重要な依存関係をキャプチャし,エンコードする。
本研究は美術品の分析とキュレーションにビジュアルコンテンツとセマンティクスを統合する大きな可能性を秘めている。
論文 参考訳(メタデータ) (2021-05-17T23:05:36Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Visual link retrieval and knowledge discovery in painting datasets [14.149494915144322]
本稿では,デジタル絵画データセットにおける視覚的リンク検索と知識発見のためのフレームワークを提案する。
ビジュアルリンク検索は、ディープ畳み込みニューラルネットワークを用いて特徴抽出を行う。
歴史的知識発見は、グラフ解析を行うことによって達成される。
論文 参考訳(メタデータ) (2020-03-18T21:16:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。