論文の概要: PPJudge: Towards Human-Aligned Assessment of Artistic Painting Process
- arxiv url: http://arxiv.org/abs/2507.09242v1
- Date: Sat, 12 Jul 2025 10:30:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-15 18:48:22.77346
- Title: PPJudge: Towards Human-Aligned Assessment of Artistic Painting Process
- Title(参考訳): PPJudge:芸術的絵画プロセスの人間性評価に向けて
- Authors: Shiqi Jiang, Xinpeng Li, Xi Mao, Changbo Wang, Chenhui Li,
- Abstract要約: 本研究では,絵画プロセスの人為的アセスメントのための新しい枠組みを提案する。
具体的には、実画像と合成画像からなる最初の大規模データセットであるペイントプロセスアセスメントデータセット(PPAD)を紹介する。
また、時間的に認識された位置符号化を付加したトランスフォーマーベースモデルPPJudgeを提案する。
- 参考スコア(独自算出の注目度): 15.405025452748585
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Artistic image assessment has become a prominent research area in computer vision. In recent years, the field has witnessed a proliferation of datasets and methods designed to evaluate the aesthetic quality of paintings. However, most existing approaches focus solely on static final images, overlooking the dynamic and multi-stage nature of the artistic painting process. To address this gap, we propose a novel framework for human-aligned assessment of painting processes. Specifically, we introduce the Painting Process Assessment Dataset (PPAD), the first large-scale dataset comprising real and synthetic painting process images, annotated by domain experts across eight detailed attributes. Furthermore, we present PPJudge (Painting Process Judge), a Transformer-based model enhanced with temporally-aware positional encoding and a heterogeneous mixture-of-experts architecture, enabling effective assessment of the painting process. Experimental results demonstrate that our method outperforms existing baselines in accuracy, robustness, and alignment with human judgment, offering new insights into computational creativity and art education.
- Abstract(参考訳): 芸術的イメージアセスメントはコンピュータビジョンにおいて顕著な研究領域となっている。
近年では、絵画の美的品質を評価するためのデータセットや手法が急増している。
しかし、既存のほとんどのアプローチは静的な最終像にのみ焦点をあてており、芸術的絵画プロセスの動的かつ多段階的な性質を見越している。
このギャップに対処するために,絵画プロセスの人為的アライメント評価のための新しい枠組みを提案する。
具体的には,8つの詳細な属性のドメインエキスパートが注釈を付した,実画像と合成画像からなる最初の大規模データセットであるPainting Process Assessment Dataset (PPAD)を紹介する。
さらに、PJudge(Painting Process Judge)は、時間的に認識された位置エンコーディングを拡張したトランスフォーマーベースのモデルであり、不均質な混在型アーキテクチャであり、塗装工程の効果的評価を可能にする。
実験結果から,本手法は,人間の判断と精度,頑健性,整合性において,既存のベースラインよりも優れており,計算創造性や美術教育に関する新たな知見が得られた。
関連論文リスト
- Vectorized Region Based Brush Strokes for Artistic Rendering [3.5297361401370044]
近年の脳卒中絵は、脳卒中パラメータの予測と反復的精錬によって脳卒中の詳細を捉えることに焦点が当てられている。
これらの手法は、しばしば芸術的原則や意図に沿ったストローク構成を作り出すのに苦労する。
i) 対象領域におけるブラシストロークのセマンティックガイダンスを容易にし, (ii) ブラシストロークパラメータを計算し, (iii) セグメントとストローク間のシーケンスを構築し, 最終的な図面を逐次描画する。
論文 参考訳(メタデータ) (2025-06-11T17:45:36Z) - APDDv2: Aesthetics of Paintings and Drawings Dataset with Artist Labeled Scores and Comments [45.57709215036539]
Aesthetics Paintings and Drawings dataset (APDD)は,24の異なる芸術カテゴリーと10の美的属性を含む最初の総合的な絵画コレクションである。
APDDv2は画像コーパスを拡張し、アノテーションの品質を改善し、詳細な言語コメントを特徴としている。
本稿では,ArtCLIP(Art Assessment Network for Specific Painting Styles)の改訂版について紹介する。
論文 参考訳(メタデータ) (2024-11-13T11:46:42Z) - GalleryGPT: Analyzing Paintings with Large Multimodal Models [64.98398357569765]
美術品の分析は、個人の審美性を豊かにし、批判的思考能力を促進することができる芸術鑑賞のための重要かつ基本的な技術である。
アートワークを自動解析する以前の作業は、主に分類、検索、その他の単純なタスクに焦点を当てており、AIの目標とは程遠い。
LLaVAアーキテクチャに基づいて微調整されたGalleryGPTと呼ばれる,絵画解析のための優れた大規模マルチモーダルモデルを提案する。
論文 参考訳(メタデータ) (2024-08-01T11:52:56Z) - Paintings and Drawings Aesthetics Assessment with Rich Attributes for Various Artistic Categories [47.705077586687196]
Aesthetics of Paintings and Drawingsデータセットは、合計4985枚の画像で構成され、注釈数は31100枚を超える。
APDDの建設は世界中の28人のプロアーティストから活発に参加し、芸術分野を専門とする数十人の学生が参加した。
最終的なAPDDデータセットは、合計4985のイメージで構成され、アノテーション数は31100を超える。
論文 参考訳(メタデータ) (2024-05-05T16:05:56Z) - Reimagining Reality: A Comprehensive Survey of Video Inpainting
Techniques [6.36998581871295]
ビデオ・インペイント(英: Video inpainting)とは、ビデオ・シーケンスの欠落や破損した部分を再生または埋めるプロセスである。
本研究は, 主要な技術, その基盤となる理論, 有効利用を分解する。
我々は、視覚的品質を評価するために人間中心のアプローチを採用し、異なる映像塗装技術の出力を評価するためにアノテータのパネルを登録する。
論文 参考訳(メタデータ) (2024-01-31T14:41:40Z) - Interactive Neural Painting [66.9376011879115]
本稿では,対話型ニューラルペイント(NP)の最初のアプローチを提案する。
2段デコーダを用いた条件変圧器変分自動エンコーダ(VAE)アーキテクチャに基づく新しい手法であるI-Paintを提案する。
実験の結果,本手法は良好なストローク提案を提供し,最先端技術と比較した。
論文 参考訳(メタデータ) (2023-07-31T07:02:00Z) - Learning to Evaluate the Artness of AI-generated Images [64.48229009396186]
アートスコア(ArtScore)は、アーティストによる本物のアートワークと画像がどの程度似ているかを評価するために設計されたメトリクスである。
我々は、写真とアートワークの生成のために事前訓練されたモデルを採用し、一連の混合モデルを生み出した。
このデータセットはニューラルネットワークのトレーニングに使用され、任意の画像の定量化精度レベルを推定する方法を学ぶ。
論文 参考訳(メタデータ) (2023-05-08T17:58:27Z) - Perceptual Artifacts Localization for Inpainting [60.5659086595901]
そこで本研究では,知覚的アーティファクトの自動セグメンテーションの学習タスクを提案する。
データセット上で高度なセグメンテーションネットワークをトレーニングし、インペイントされた画像内のインペイントされたアーティファクトを確実にローカライズする。
また, 対象領域と対象領域全体との比率である知覚人工物比 (PAR) という新しい評価指標を提案する。
論文 参考訳(メタデータ) (2022-08-05T18:50:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。