論文の概要: Semi-supervised Human Pose Estimation in Art-historical Images
- arxiv url: http://arxiv.org/abs/2207.02976v1
- Date: Wed, 6 Jul 2022 21:20:58 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-08 15:06:59.671013
- Title: Semi-supervised Human Pose Estimation in Art-historical Images
- Title(参考訳): 美術史画像における半教師付きポーズ推定
- Authors: Matthias Springstein, Stefanie Schneider, Christian Althaus, Ralph
Ewerth
- Abstract要約: アート言語画像における人間のポーズを推定する新しい手法を提案する。
我々の手法は、事前訓練されたモデルやスタイル転送を使用する方法よりも、はるかに優れた結果が得られる。
- 参考スコア(独自算出の注目度): 9.633949256082763
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Gesture as \enquote*{language} of non-verbal communication has been
theoretically established since the 17th century. However, its relevance for
the visual arts has been expressed only sporadically. This may be primarily due
to the sheer overwhelming amount of data that traditionally had to be processed
by hand. With the steady progress of digitization, though, a growing number of
historical artifacts have been indexed and made available to the public,
creating a need for automatic retrieval of art-historical motifs with similar
body constellations or poses. Since the domain of art differs significantly
from existing real-world data sets for human pose estimation due to its style
variance, this presents new challenges. In this paper, we propose a novel
approach to estimate human poses in art-historical images. In contrast to
previous work that attempts to bridge the domain gap with pre-trained models or
through style transfer, we suggest semi-supervised learning for both object and
keypoint detection. Furthermore, we introduce a novel domain-specific art data
set that includes both bounding box and keypoint annotations of human figures.
Our approach achieves significantly better results than methods that use
pre-trained models or style transfer.
- Abstract(参考訳): 非言語コミュニケーションの<enquote*{language}としてのジェスチャーは、17世紀から理論的に確立されてきた。
しかし、視覚芸術との関係は散発的にしか表現されていない。
これは主に、伝統的に手作業で処理する必要があった膨大な量のデータのためかもしれない。
しかし、デジタル化の着実に進んだ進展に伴い、多くの歴史的遺物がインデックス化され、一般に公開され、類似の身体星座やポーズを持つ美術史的モチーフの自動検索の必要性が生じた。
アート領域は、そのスタイルのばらつきにより、人間のポーズ推定のための既存の実世界のデータセットと大きく異なるため、新しい課題が提示される。
本稿では,美術史画像における人間のポーズを推定する新しい手法を提案する。
事前訓練されたモデルやスタイル転送でドメインギャップを埋めようとする従来の作業とは対照的に、オブジェクトとキーポイントの両方を検出するための半教師付き学習を提案する。
さらに,人間図形のバウンディングボックスとキーポイントアノテーションの両方を含む新しいドメイン固有アートデータセットを導入する。
我々の手法は、事前訓練されたモデルやスタイル転送を使用する方法よりもはるかに優れた結果が得られる。
関連論文リスト
- GRPose: Learning Graph Relations for Human Image Generation with Pose Priors [21.971188335727074]
人間の画像生成のための制御情報を提供するために,ポーズ前のグラフ関係を探索するフレームワークを提案する。
提案モデルでは,最新のベンチマークモデルと比較して,ポーズ平均精度が9.98%向上した。
論文 参考訳(メタデータ) (2024-08-29T13:58:34Z) - Information Theoretic Text-to-Image Alignment [49.396917351264655]
本稿では,ステア画像生成のための情報理論アライメント尺度を用いた新しい手法を提案する。
提案手法は最先端の手法よりも優れているが,MIを推定するためには事前学習されたデノナイジングネットワークを必要としない。
論文 参考訳(メタデータ) (2024-05-31T12:20:02Z) - UniHuman: A Unified Model for Editing Human Images in the Wild [49.896715833075106]
実環境における画像編集の複数の側面に対処する統一モデルUniHumanを提案する。
モデルの生成品質と一般化能力を向上させるために,人間の視覚エンコーダからのガイダンスを利用する。
ユーザスタディでは、UniHumanは平均して77%のケースでユーザに好まれる。
論文 参考訳(メタデータ) (2023-12-22T05:00:30Z) - There Is a Digital Art History [1.0878040851637998]
我々はJohanna Drucker氏の質問を再考する。
我々は,「デジタル」美術史へのパラダイムシフトを示唆する2つの主要な側面に着目した分析を行った。
論文 参考訳(メタデータ) (2023-08-14T21:21:03Z) - Learning to Evaluate the Artness of AI-generated Images [64.48229009396186]
アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。
我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。
このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文 参考訳(メタデータ) (2023-05-08T17:58:27Z) - Poses of People in Art: A Data Set for Human Pose Estimation in Digital
Art History [0.6345523830122167]
芸術における人間のポーズを推定するための,最初のオープンライセンスデータセットを紹介する。
美術作品群は、22の美術史的描写様式の2,454点からなる。
10,749人の人物は、最大で17個のキーポイントでラベル付けされた画像1枚につき最大4つの長方形の境界ボックスで正確に囲まれている。
論文 参考訳(メタデータ) (2023-01-12T16:23:58Z) - CtlGAN: Few-shot Artistic Portraits Generation with Contrastive Transfer
Learning [77.27821665339492]
CtlGANは、新しいコントラッシブ・トランスファー学習戦略を備えた、数発のアート・ポートレート生成モデルである。
ソースドメインで事前訓練したStyleGANを,対象の芸術領域に適応させる。
実面をZ+空間に埋め込んだ新しいエンコーダを提案し,適応型デコーダに対処するためのデュアルパストレーニング戦略を提案する。
論文 参考訳(メタデータ) (2022-03-16T13:28:17Z) - Learning Dynamics via Graph Neural Networks for Human Pose Estimation
and Tracking [98.91894395941766]
ポーズ検出とは無関係なポーズダイナミクスを学習する新しいオンライン手法を提案する。
具体的には、空間的・時間的情報と視覚的情報の両方を明示的に考慮したグラフニューラルネットワーク(GNN)を通して、このダイナミクスの予測を導出する。
PoseTrack 2017とPoseTrack 2018データセットの実験では、提案手法が人間のポーズ推定とトラッキングタスクの両方において、技術の現状よりも優れた結果が得られることを示した。
論文 参考訳(メタデータ) (2021-06-07T16:36:50Z) - Enhancing Human Pose Estimation in Ancient Vase Paintings via
Perceptually-grounded Style Transfer Learning [15.888271913164969]
本研究では, 既知の人物の自然像のデータセットを適応させ, 画像スタイルの変換により, ギリシアの花瓶絵画の様式にアノテーションを付加する方法を示す。
我々は,スタイル変換学習を用いることで,平均平均精度(mAP)と平均平均リコール(mAR)を6%以上向上させることを示す。
徹底的なアブレーション研究では,スタイル強度の影響を対象とした解析を行い,モデルが汎用的なドメインスタイルを学習していることを明らかにする。
論文 参考訳(メタデータ) (2020-12-10T12:08:03Z) - Towards Accurate Human Pose Estimation in Videos of Crowded Scenes [134.60638597115872]
我々は、時間的文脈を利用して新しいデータを収集する視点から、混雑したシーンのビデオにおける人間のポーズ推定を改善することに注力する。
あるフレームについては、過去のフレームから過去のポーズを転送し、その後のフレームから現在のフレームへ未来的なポーズを後退させ、ビデオにおける安定した人間のポーズ推定に繋がる。
このようにして、HIEチャレンジのテストデータセット上で、13本中7本、56.33本の平均w_APで最高の性能を達成する。
論文 参考訳(メタデータ) (2020-10-16T13:19:11Z) - Demographic Influences on Contemporary Art with Unsupervised Style
Embeddings [25.107166631583212]
contempArtは絵画と図面のコレクションであり、Instagram上のソーシャル接続と追加の社会デマグラフィー情報に基づく詳細なグラフネットワークである。
画像の教師なしスタイルの埋め込みを生成するのに適した3つの手法を評価し,残りのデータと相関する。
論文 参考訳(メタデータ) (2020-09-30T10:13:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。