論文の概要: The ArtBench Dataset: Benchmarking Generative Models with Artworks
- arxiv url: http://arxiv.org/abs/2206.11404v1
- Date: Wed, 22 Jun 2022 22:10:18 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-24 12:43:38.042916
- Title: The ArtBench Dataset: Benchmarking Generative Models with Artworks
- Title(参考訳): ArtBenchデータセット: Artworksで生成モデルをベンチマークする
- Authors: Peiyuan Liao, Xiuyu Li, Xihui Liu, Kurt Keutzer
- Abstract要約: ArtBench-10は、アートベンチマーク生成のための最初のクラスバランス、高品質、クリーンな注釈付き、標準化されたデータセットである。
10の独特な芸術様式から6万点のアート作品と、5000枚の訓練画像と1000枚のテスト画像で構成されている。
- 参考スコア(独自算出の注目度): 32.29345091626141
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce ArtBench-10, the first class-balanced, high-quality, cleanly
annotated, and standardized dataset for benchmarking artwork generation. It
comprises 60,000 images of artwork from 10 distinctive artistic styles, with
5,000 training images and 1,000 testing images per style. ArtBench-10 has
several advantages over previous artwork datasets. Firstly, it is
class-balanced while most previous artwork datasets suffer from the long tail
class distributions. Secondly, the images are of high quality with clean
annotations. Thirdly, ArtBench-10 is created with standardized data collection,
annotation, filtering, and preprocessing procedures. We provide three versions
of the dataset with different resolutions ($32\times32$, $256\times256$, and
original image size), formatted in a way that is easy to be incorporated by
popular machine learning frameworks. We also conduct extensive benchmarking
experiments using representative image synthesis models with ArtBench-10 and
present in-depth analysis. The dataset is available at
https://github.com/liaopeiyuan/artbench under a Fair Use license.
- Abstract(参考訳): 今回我々はartbench-10を紹介する。artbench-10は,最初のクラスバランス,高品質,クリーンアノテート,標準化された,アートワーク生成のためのデータセットである。
10の異なる芸術的スタイルから6万枚の芸術作品があり、5,000枚のトレーニング画像と1000枚のテスト画像がある。
artbench-10は、以前のアートワークデータセットよりもいくつかの利点がある。
まず、ほとんどの過去のアートデータセットが長い尾のクラス分布に悩まされている間、クラスバランスが取れます。
第二に、画像はきれいなアノテーションで高品質です。
第3に、ArtBench-10は標準化されたデータ収集、アノテーション、フィルタリング、前処理の手順で作成される。
一般的な機械学習フレームワークに簡単に組み込める方法でフォーマットされたデータセットの3つのバージョン(32\times32$,256\times256$,オリジナル画像サイズ)を提供する。
また,ArtBench-10を用いた画像合成モデルを用いた広範囲なベンチマーク実験を行い,詳細な解析を行った。
データセットはFair Useライセンスの下でhttps://github.com/liaopeiyuan/artbenchで公開されている。
関連論文リスト
- Stylistic Multi-Task Analysis of Ukiyo-e Woodblock Prints [6.748153937479316]
本稿では, 文体分析の範囲を広げることを目的とした, この近代日本美術様式について考察する。
私たちのデータセットは17世紀から今日のメタデータに対応する175.000ドル以上の印刷物で構成されています。
論文 参考訳(メタデータ) (2024-10-16T08:55:09Z) - UHD-IQA Benchmark Database: Pushing the Boundaries of Blind Photo Quality Assessment [4.563959812257119]
固定幅3840ピクセルの6073 UHD-1 (4K)画像からなる画像品質評価データセットを提案する。
私たちの作品は、高い技術品質の高度に美的な写真に焦点を当てており、文学のギャップを埋めています。
データセットには、クラウドソーシング調査を通じて得られた知覚的品質評価が注釈付けされている。
論文 参考訳(メタデータ) (2024-06-25T11:30:31Z) - Toffee: Efficient Million-Scale Dataset Construction for Subject-Driven Text-to-Image Generation [58.09421301921607]
我々は、主観的画像編集と生成のための最初の大規模データセットを構築した。
データセットは、以前の最大のデータセットの5倍のサイズですが、コストは、何万時間も低いです。
論文 参考訳(メタデータ) (2024-06-13T16:40:39Z) - Emu: Enhancing Image Generation Models Using Photogenic Needles in a
Haystack [75.00066365801993]
Webスケールの画像-テキストペアによるテキスト-画像モデルのトレーニングにより、テキストから幅広い視覚概念を生成することができる。
これらの事前訓練されたモデルは、高度に美的な画像を生成することに関して、しばしば課題に直面します。
本稿では,高度に視覚的に魅力的な画像のみを生成するために,事前学習されたモデルを誘導する品質チューニングを提案する。
論文 参考訳(メタデータ) (2023-09-27T17:30:19Z) - Towards Artistic Image Aesthetics Assessment: a Large-scale Dataset and
a New Method [64.40494830113286]
まず、Boldbrush Artistic Image dataset (BAID)という大規模なAIAAデータセットを紹介します。
そこで我々は,芸術的イメージを評価するために,スタイル特異的で汎用的な美的情報を効果的に抽出し,活用する新たな手法であるSAANを提案する。
実験により,提案手法は提案したBAIDデータセット上で既存のIAA手法よりも優れていることが示された。
論文 参考訳(メタデータ) (2023-03-27T12:59:15Z) - CtlGAN: Few-shot Artistic Portraits Generation with Contrastive Transfer
Learning [77.27821665339492]
CtlGANは、新しいコントラッシブ・トランスファー学習戦略を備えた、数発のアート・ポートレート生成モデルである。
ソースドメインで事前訓練したStyleGANを,対象の芸術領域に適応させる。
実面をZ+空間に埋め込んだ新しいエンコーダを提案し,適応型デコーダに対処するためのデュアルパストレーニング戦略を提案する。
論文 参考訳(メタデータ) (2022-03-16T13:28:17Z) - ClevrTex: A Texture-Rich Benchmark for Unsupervised Multi-Object
Segmentation [23.767094632640763]
本稿では,アルゴリズムの比較,評価,分析を行うための次の課題として,ClevrTexを提案する。
ClarTexは、様々な形状、テクスチャ、フォトマップ素材を備えた合成シーンを特徴としている。
我々は、ClevrTex上で、最近の多数の教師なしマルチオブジェクトセグメンテーションモデルをベンチマークし、テクスチャ化された環境では、すべての最先端のアプローチが良い表現を学習できないことを発見した。
論文 参考訳(メタデータ) (2021-11-19T15:11:25Z) - Privacy-Preserving Portrait Matting [73.98225485513905]
P3M-10kは、プライバシー保護ポートレートマットのための最初の大規模な匿名化ベンチマークです。
P3M-10kは1万枚の高解像度顔写真と高品質のアルファマットで構成されています。
意味認識と詳細マッチングの両方に統一されたフレームワークのパワーを利用するP3M-Netを提案する。
論文 参考訳(メタデータ) (2021-04-29T09:20:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。