論文の概要: FolkTalent: Enhancing Classification and Tagging of Indian Folk Paintings
- arxiv url: http://arxiv.org/abs/2405.08776v1
- Date: Tue, 14 May 2024 17:11:33 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-15 13:18:28.169622
- Title: FolkTalent: Enhancing Classification and Tagging of Indian Folk Paintings
- Title(参考訳): FolkTalent:インドの民族絵画の分類とタグ付けの強化
- Authors: Nancy Hada, Aditya Singh, Kavita Vemuri,
- Abstract要約: インドの民俗画には、シンボル、色、テクスチャ、物語の豊富なモザイクがあり、文化的遺産の貴重な保存物となっている。
本論文は,これらの絵画を異なる芸術形式に分類し,その特徴を特徴付ける新しいアプローチを提案する。
フォークタレント(FolkTalent)という名前のカスタムデータセットは、12種類の絵画の2279枚のデジタル画像で構成されており、インドの民俗絵画の直接のアウトレットであるウェブサイトを使用して作成されている。
- 参考スコア(独自算出の注目度): 1.338174941551702
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Indian folk paintings have a rich mosaic of symbols, colors, textures, and stories making them an invaluable repository of cultural legacy. The paper presents a novel approach to classifying these paintings into distinct art forms and tagging them with their unique salient features. A custom dataset named FolkTalent, comprising 2279 digital images of paintings across 12 different forms, has been prepared using websites that are direct outlets of Indian folk paintings. Tags covering a wide range of attributes like color, theme, artistic style, and patterns are generated using GPT4, and verified by an expert for each painting. Classification is performed employing the RandomForest ensemble technique on fine-tuned Convolutional Neural Network (CNN) models to classify Indian folk paintings, achieving an accuracy of 91.83%. Tagging is accomplished via the prominent fine-tuned CNN-based backbones with a custom classifier attached to its top to perform multi-label image classification. The generated tags offer a deeper insight into the painting, enabling an enhanced search experience based on theme and visual attributes. The proposed hybrid model sets a new benchmark in folk painting classification and tagging, significantly contributing to cataloging India's folk-art heritage.
- Abstract(参考訳): インドの民俗画には、シンボル、色、テクスチャ、物語の豊富なモザイクがあり、文化的遺産の貴重な保存物となっている。
本論文は,これらの絵画を異なる芸術形式に分類し,その特徴を特徴付ける新しいアプローチを提案する。
フォークタレント(FolkTalent)という名前のカスタムデータセットは、12種類の絵画の2279枚のデジタル画像で構成されており、インドの民俗絵画の直接のアウトレットであるウェブサイトを使用して作成されている。
色、テーマ、芸術的スタイル、パターンといった幅広い属性をカバーしたタグは、GPT4を使用して生成され、各絵画の専門家によって検証される。
インドの民俗絵画を分類するために、細調整の畳み込みニューラルネットワーク(CNN)モデルでランダムフォレストアンサンブル技術を用いて分類が行われ、精度は91.83%に達する。
タグ付けはCNNベースの顕著な微調整バックボーンを通じて行われ、上部にカスタム分類器を取り付け、マルチラベル画像分類を行う。
生成されたタグは絵に深い洞察を与え、テーマと視覚属性に基づいた検索エクスペリエンスを向上する。
提案されたハイブリッドモデルは、民俗絵画の分類とタグ付けの新しいベンチマークを設定し、インドの民俗芸術遺産のカタログ化に大きく貢献した。
関連論文リスト
- Measuring Style Similarity in Diffusion Models [118.22433042873136]
画像からスタイル記述子を理解し抽出するためのフレームワークを提案する。
我々のフレームワークは、スタイルが画像の主観的特性であるという洞察を用いてキュレートされた新しいデータセットで構成されている。
また、テキスト・ツー・イメージ・モデルのトレーニングデータセットで使用される画像に対して、生成した画像のスタイルに使用できるスタイル属性記述子を抽出する手法を提案する。
論文 参考訳(メタデータ) (2024-04-01T17:58:30Z) - Enhance Image Classification via Inter-Class Image Mixup with Diffusion Model [80.61157097223058]
画像分類性能を高めるための一般的な戦略は、T2Iモデルによって生成された合成画像でトレーニングセットを増強することである。
本研究では,既存のデータ拡張技術の欠点について検討する。
Diff-Mixと呼ばれる革新的なクラス間データ拡張手法を導入する。
論文 参考訳(メタデータ) (2024-03-28T17:23:45Z) - Chinese Painting Style Transfer Using Deep Generative Models [0.0]
アートスタイルの転送は、コンテンツを保存しながらイメージのスタイルを変更することを目的としている。
本研究は,中国絵画様式の転写における最先端の深層生成モデルについて研究・活用する。
論文 参考訳(メタデータ) (2023-10-15T23:05:17Z) - CCLAP: Controllable Chinese Landscape Painting Generation via Latent
Diffusion Model [54.74470985388726]
制御可能な中国の風景画作成方法CCLAP。
本手法は,特に芸術的・芸術的概念において,最先端の演奏を実現する。
論文 参考訳(メタデータ) (2023-04-09T04:16:28Z) - Inversion-Based Style Transfer with Diffusion Models [78.93863016223858]
以前の任意の例として誘導された芸術的画像生成法は、しばしば形状変化の制御や要素の伝達に失敗する。
画像のキー情報を効率よく正確に学習できるインバージョンベースのスタイル転送手法(InST)を提案する。
論文 参考訳(メタデータ) (2022-11-23T18:44:25Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - Art Creation with Multi-Conditional StyleGANs [81.72047414190482]
人間のアーティストは、独特のスキル、理解、そして深い感情や感情を引き起こすアートワークを作る真の意図の組み合わせが必要です。
本研究では,多条件生成支援ネットワーク(GAN)アプローチを導入し,人間の芸術を模倣する現実的な絵画を合成する。
論文 参考訳(メタデータ) (2022-02-23T20:45:41Z) - Paint4Poem: A Dataset for Artistic Visualization of Classical Chinese
Poems [20.72849584295798]
Paint4Poemと呼ばれる新しいデータセットを構築します。
Paint4Poemは、中国の影響力のある画家から手作業で集めた、高品質な詩画301組で構成されている。
詩の多様性,絵画スタイル,および詩と絵画の意味的関連性について,Paint4Poemを分析した。
論文 参考訳(メタデータ) (2021-09-23T22:57:16Z) - Focusing on Persons: Colorizing Old Images Learning from Modern
Historical Movies [18.44861416980508]
本稿では, 歴史的人物の多彩な高忠実度衣料着の着色について, 微粒な意味理解と先行性に基づく検討を行った。
分類,微粒な意味解析,色分けという3つの部分を含むヒストリーネットを提案する。
本手法は、特に軍服において、最先端の着色方法よりも優れています。
論文 参考訳(メタデータ) (2021-08-14T11:04:18Z) - Words as Art Materials: Generating Paintings with Sequential GANs [8.249180979158815]
大規模な分散データセット上での芸術画像の生成について検討する。
このデータセットには、形状、色、内容など、バリエーションのあるイメージが含まれている。
本稿では,逐次生成適応型ネットワークモデルを提案する。
論文 参考訳(メタデータ) (2020-07-08T19:17:14Z) - Automatic Tag Recommendation for Painting Artworks Using Diachronic
Descriptions [3.3948742816399693]
この作品は1979年に始まり、ブラジルの画家カンディド・ポルティナリの絵画の復元とカタログ化を目的としていたポルティナリ・プロジェクト(Portinari Project)によって行われた。
それぞれの絵の記述は、絵画が復元された40年以上にわたって、多数の協力者によって作成され、これらのダイアクロニックな描写は、それぞれの絵を記述するために使用される語彙に偏りを生じさせた。
提案フレームワークは, (i) 各絵画のイメージを入力として受け取り, 可能なタグとして頻繁なアイテムセットを使用するニューラルネットワークと, (ii) 事前学習した分類器の出力に基づいて関連するタグをグループ化するクラスタリングステップとから構成される。
論文 参考訳(メタデータ) (2020-04-21T02:10:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。