論文の概要: Understanding Compositional Structures in Art Historical Images using
Pose and Gaze Priors
- arxiv url: http://arxiv.org/abs/2009.03807v1
- Date: Tue, 8 Sep 2020 15:01:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-20 21:40:43.029335
- Title: Understanding Compositional Structures in Art Historical Images using
Pose and Gaze Priors
- Title(参考訳): ポーズと視線先行を用いた美術史画像の構成構造理解
- Authors: Prathmesh Madhu, Tilman Marquart, Ronak Kosti, Peter Bell, Andreas
Maier and Vincent Christlein
- Abstract要約: 画像合成は、アーティストとそのアートワークを研究するために、画像内の相互作用を分析するのに有用である。
本研究では,既存の機械学習技術を用いて,このプロセスの自動化を試みる。
本手法は, (a) 絵画のアクション領域とアクションラインの検出, (b) 前景と背景のポーズに基づくセグメンテーションの2つの中心的なテーマに焦点を当てる。
- 参考スコア(独自算出の注目度): 20.98603643788824
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Image compositions as a tool for analysis of artworks is of extreme
significance for art historians. These compositions are useful in analyzing the
interactions in an image to study artists and their artworks. Max Imdahl in his
work called Ikonik, along with other prominent art historians of the 20th
century, underlined the aesthetic and semantic importance of the structural
composition of an image. Understanding underlying compositional structures
within images is challenging and a time consuming task. Generating these
structures automatically using computer vision techniques (1) can help art
historians towards their sophisticated analysis by saving lot of time;
providing an overview and access to huge image repositories and (2) also
provide an important step towards an understanding of man made imagery by
machines. In this work, we attempt to automate this process using the existing
state of the art machine learning techniques, without involving any form of
training. Our approach, inspired by Max Imdahl's pioneering work, focuses on
two central themes of image composition: (a) detection of action regions and
action lines of the artwork; and (b) pose-based segmentation of foreground and
background. Currently, our approach works for artworks comprising of
protagonists (persons) in an image. In order to validate our approach
qualitatively and quantitatively, we conduct a user study involving experts and
non-experts. The outcome of the study highly correlates with our approach and
also demonstrates its domain-agnostic capability. We have open-sourced the code
at https://github.com/image-compostion-canvas-group/image-compostion-canvas.
- Abstract(参考訳): 美術史家にとって、美術品の分析ツールとしてのイメージ構成は極めて重要である。
これらの構成は、アーティストとその作品を研究するために画像内の相互作用を分析するのに有用である。
マックス・イムダール(Max Imdahl)は、イコニク(Ikonik)と呼ばれる作品の中で、20世紀の他の著名な美術史家とともに、画像の構造構成の美的・意味的な重要性を説いた。
画像内の構成構造を理解することは難しく、時間を要する作業である。
コンピュータビジョン技術を用いてこれらの構造を自動生成することは、美術史家にとって、多くの時間を節約し、膨大な画像リポジトリの概観とアクセスを提供し、また、機械による人造画像の理解に向けた重要な一歩となる。
本研究では,既存の最先端の機械学習技術を用いて,トレーニングの形式を伴わずにこのプロセスを自動化しようとする。
マックス・インダールの先駆的作品に触発された我々のアプローチは、イメージ構成の2つの中心的なテーマに焦点を当てている。
(a)作品の動作領域及び動作線の検出及び
(b)前景と背景のポーズに基づくセグメンテーション
現在,本手法は画像中の主人公(人物)からなるアートワークを対象としている。
質的,定量的にアプローチを検証するため,専門家や非専門家によるユーザスタディを実施している。
研究結果は我々のアプローチと非常に相関し、ドメインに依存しない能力を示す。
コードをhttps://github.com/image-compostion-canvas-group/image-compostion-canvasでオープンソース化しました。
関連論文リスト
- GalleryGPT: Analyzing Paintings with Large Multimodal Models [64.98398357569765]
美術品の分析は、個人の審美性を豊かにし、批判的思考能力を促進することができる芸術鑑賞のための重要かつ基本的な技術である。
アートワークを自動解析する以前の作業は、主に分類、検索、その他の単純なタスクに焦点を当てており、AIの目標とは程遠い。
LLaVAアーキテクチャに基づいて微調整されたGalleryGPTと呼ばれる,絵画解析のための優れた大規模マルチモーダルモデルを提案する。
論文 参考訳(メタデータ) (2024-08-01T11:52:56Z) - Learning to Evaluate the Artness of AI-generated Images [64.48229009396186]
アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。
我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。
このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文 参考訳(メタデータ) (2023-05-08T17:58:27Z) - Deep Image Matting: A Comprehensive Survey [85.77905619102802]
本稿では,ディープラーニング時代における画像マッチングの最近の進歩を概観する。
本稿では,補助的な入力ベースの画像マッチングと,自動的な画像マッチングという,2つの基本的なサブタスクに焦点を当てる。
画像マッチングの関連応用について論じ,今後の研究への課題と可能性を明らかにする。
論文 参考訳(メタデータ) (2023-04-10T15:48:55Z) - A domain adaptive deep learning solution for scanpath prediction of
paintings [66.46953851227454]
本稿では,ある絵画の視覚的体験における視聴者の眼球運動分析に焦点を当てた。
我々は、人間の視覚的注意を予測するための新しいアプローチを導入し、人間の認知機能に影響を及ぼす。
提案した新しいアーキテクチャは、画像を取り込んでスキャンパスを返す。
論文 参考訳(メタデータ) (2022-09-22T22:27:08Z) - ICC++: Explainable Image Retrieval for Art Historical Corpora using
Image Composition Canvas [19.80532568090711]
我々は,画像合成Canvas (ICC++) と呼ばれる新しい手法を提案し,類似の合成要素を持つ画像の比較と検索を行う。
ICC++は、Max Imdahl氏の仕事によって動機付けられた低レベルの機能(構成要素)を生成することに特化したICCよりも改善されている。
論文 参考訳(メタデータ) (2022-06-22T14:06:29Z) - Automatic Image Content Extraction: Operationalizing Machine Learning in
Humanistic Photographic Studies of Large Visual Archives [81.88384269259706]
本稿では,機械学習による大規模画像アーカイブの検索と解析のための自動画像コンテンツ抽出フレームワークを提案する。
提案する枠組みは、人文科学と社会科学のいくつかの分野に適用できる。
論文 参考訳(メタデータ) (2022-04-05T12:19:24Z) - Learning Portrait Style Representations [34.59633886057044]
高レベル特性を取り入れたニューラルネットワークアーキテクチャによって学習されたスタイル表現について検討する。
美術史家によって注釈付けされた三重奏曲をスタイル類似性の監督として取り入れることで,学習スタイルの特徴の変化を見いだす。
また,計算解析用に用意された肖像画の大規模データセットを初めて提示する。
論文 参考訳(メタデータ) (2020-12-08T01:36:45Z) - A Data Set and a Convolutional Model for Iconography Classification in
Paintings [3.4138918206057265]
美術におけるイコノグラフィー(英: Iconography in art)は、美術作品の視覚的内容を研究し、そのモチーフとテーマを決定する分野である。
コンピュータビジョンの技法を前例のない規模のアートイメージの分析に適用することで、図像学の研究と教育を支援することができる。
論文 参考訳(メタデータ) (2020-10-06T12:40:46Z) - Visual link retrieval and knowledge discovery in painting datasets [14.149494915144322]
本稿では,デジタル絵画データセットにおける視覚的リンク検索と知識発見のためのフレームワークを提案する。
ビジュアルリンク検索は、ディープ畳み込みニューラルネットワークを用いて特徴抽出を行う。
歴史的知識発見は、グラフ解析を行うことによって達成される。
論文 参考訳(メタデータ) (2020-03-18T21:16:33Z) - Scene Text Synthesis for Efficient and Effective Deep Network Training [62.631176120557136]
我々は,背景画像に前景オブジェクトを埋め込むことで,注釈付き訓練画像を構成する革新的な画像合成技術を開発した。
提案手法は,ディープネットワークトレーニングにおける合成画像の有用性を高める2つの重要な要素から構成される。
複数の公開データセットに対する実験により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2019-01-26T10:15:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。