Fugu-MT 論文翻訳(概要): DEArt: Dataset of European Art

論文の概要: DEArt: Dataset of European Art

arxiv url: http://arxiv.org/abs/2211.01226v2
Date: Thu, 3 Nov 2022 07:33:46 GMT
ステータス: 翻訳完了
システム内更新日: 2022-11-04 11:47:16.216056
Title: DEArt: Dataset of European Art
Title（参考訳）: DEArt: ヨーロッパ美術のデータセット
Authors: Artem Reshetnikov, Maria-Cristina Marinescu, Joaquim More Lopez
Abstract要約: 我々は,第2世紀から第8世紀にかけての絵画の参照を目的としたオブジェクト検出とポーズ分類データセットであるDEArtを提案する。 15,000以上の画像が含まれており、約80%の非イコニックで、69クラスのすべてのインスタンスを識別するバウンディングボックスのマニュアルアノテーションと、人間に似たオブジェクトを識別するボックスのポーズが12種類含まれている。以上の結果から, 文化遺産領域のオブジェクト検出器は, 伝達学習による汎用画像の最先端モデルに匹敵する精度を達成できることが示唆された。
参考スコア（独自算出の注目度）: 0.17188280334580194
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Large datasets that were made publicly available to the research community over the last 20 years have been a key enabling factor for the advances in deep learning algorithms for NLP or computer vision. These datasets are generally pairs of aligned image / manually annotated metadata, where images are photographs of everyday life. Scholarly and historical content, on the other hand, treat subjects that are not necessarily popular to a general audience, they may not always contain a large number of data points, and new data may be difficult or impossible to collect. Some exceptions do exist, for instance, scientific or health data, but this is not the case for cultural heritage (CH). The poor performance of the best models in computer vision - when tested over artworks - coupled with the lack of extensively annotated datasets for CH, and the fact that artwork images depict objects and actions not captured by photographs, indicate that a CH-specific dataset would be highly valuable for this community. We propose DEArt, at this point primarily an object detection and pose classification dataset meant to be a reference for paintings between the XIIth and the XVIIIth centuries. It contains more than 15000 images, about 80% non-iconic, aligned with manual annotations for the bounding boxes identifying all instances of 69 classes as well as 12 possible poses for boxes identifying human-like objects. Of these, more than 50 classes are CH-specific and thus do not appear in other datasets; these reflect imaginary beings, symbolic entities and other categories related to art. Additionally, existing datasets do not include pose annotations. Our results show that object detectors for the cultural heritage domain can achieve a level of precision comparable to state-of-art models for generic images via transfer learning.
Abstract（参考訳）: 過去20年間に研究コミュニティに公開されてきた大規模なデータセットは、NLPやコンピュータビジョンのためのディープラーニングアルゴリズムの進歩の鍵となる要素である。これらのデータセットは、概してアライメントされた画像/手動で注釈付きメタデータのペアであり、画像は日常生活の写真である。一方、学術的かつ歴史的コンテンツは、必ずしも一般の聴衆に人気がない主題を扱い、必ずしも大量のデータポイントを含まない可能性があり、新しいデータは収集が困難または不可能である可能性がある。科学データや健康データなど、いくつかの例外があるが、文化遺産(CH)ではそうではない。コンピュータビジョンにおける最高のモデル(アートワークよりもテストする場合)のパフォーマンスの低さと、CHのための広範囲な注釈付きデータセットが欠如していること、そしてアートイメージが写真によってキャプチャされていないオブジェクトやアクションを描いているという事実は、CH固有のデータセットがこのコミュニティにとって非常に価値があることを示唆している。本稿は,第2世紀から第8世紀にかけての絵画の参照を目的とした,物体検出・ポーズ分類データセットであるDEArtを提案する。 15,000以上の画像があり、約80%が非iconicで、69クラスのすべてのインスタンスを識別するバウンディングボックスの手動アノテーションと、12のポーズで人間に似たオブジェクトを識別できる。これらのうち、50以上のクラスはch固有であり、そのため他のデータセットには現れない。さらに、既存のデータセットにはポーズアノテーションが含まれていない。以上の結果から,文化遺産領域のオブジェクト検出器は,伝達学習による汎用画像の最先端モデルに匹敵する精度を達成できることが示唆された。

関連論文リスト

Smelly, dense, and spreaded: The Object Detection for Olfactory References (ODOR) dataset [11.701487651068263]
提案されたODORデータセットは、4712イメージに対して38,116のオブジェクトレベルのアノテーションを提供する。我々は、カテゴリの詳細なセット、密なオブジェクトと重なり合うオブジェクト、画像キャンバス全体の空間分布など、挑戦的なデータセット特性を示す。このデータセットは、研究者に対して、物体の認識と匂いの知覚の交わりを調査するよう求めている。
論文参考訳（メタデータ） (2025-07-11T07:58:21Z)
Towards Artistic Image Aesthetics Assessment: a Large-scale Dataset and a New Method [64.40494830113286]
まず、Boldbrush Artistic Image dataset (BAID)という大規模なAIAAデータセットを紹介します。そこで我々は,芸術的イメージを評価するために,スタイル特異的で汎用的な美的情報を効果的に抽出し,活用する新たな手法であるSAANを提案する。実験により,提案手法は提案したBAIDデータセット上で既存のIAA手法よりも優れていることが示された。
論文参考訳（メタデータ） (2023-03-27T12:59:15Z)
Poses of People in Art: A Data Set for Human Pose Estimation in Digital Art History [0.6345523830122167]
芸術における人間のポーズを推定するための,最初のオープンライセンスデータセットを紹介する。美術作品群は、22の美術史的描写様式の2,454点からなる。 10,749人の人物は、最大で17個のキーポイントでラベル付けされた画像1枚につき最大4つの長方形の境界ボックスで正確に囲まれている。
論文参考訳（メタデータ） (2023-01-12T16:23:58Z)
Bugs in the Data: How ImageNet Misrepresents Biodiversity [98.98950914663813]
ImageNet-1k検証セットで野生動物を表す269のクラスから13450の画像を解析した。多くのクラスが未定義あるいは重複しており、画像の12%が誤ってラベル付けされていることがわかった。また,ImageNet-1kに含まれる野生生物関連ラベルと画像の両方が,地理的,文化的に有意な偏見を呈していることがわかった。
論文参考訳（メタデータ） (2022-08-24T17:55:48Z)
Is Medieval Distant Viewing Possible? : Extending and Enriching Annotation of Legacy Image Collections using Visual Analytics [3.89394670917253]
本稿では,相反するメタデータと重複するメタデータを示す2つの注釈付き中世の写本画像について述べる。統合データセットの"ブリッジ"として機能する,より均一なラベルセットを作ることを目標としています。ビジュアルインターフェースは、メタデータの総合計を超えるデータ間の関係について、専門家に概要を提供する。
論文参考訳（メタデータ） (2022-08-20T10:59:33Z)
VizWiz-FewShot: Locating Objects in Images Taken by People With Visual Impairments [74.72656607288185]
我々は、撮影した画像の視覚的内容について真に学ぼうとしていた写真家を起源とする、数発のローカライゼーションデータセットを紹介した。視覚障害者が撮影した4500枚以上の画像に、100のカテゴリの約10,000のセグメンテーションが含まれている。既存の数発のオブジェクト検出やインスタンスセグメンテーションデータセットと比較して、私たちのデータセットは、オブジェクトの穴を見つける最初のものです。
論文参考訳（メタデータ） (2022-07-24T20:44:51Z)
ImageSubject: A Large-scale Dataset for Subject Detection [9.430492045581534]
主に被写体は、写真家が強調したいものなので、通常、画像やビデオの中に存在します。主対象を検出することは、機械が画像やビデオの内容を理解するのを助ける重要な技術である。我々は、オブジェクトのレイアウトを理解し、その中の主要な対象を見つけるために、モデルのトレーニングを目標とする新しいデータセットを提案する。
論文参考訳（メタデータ） (2022-01-09T22:49:59Z)
Generalized Category Discovery [148.32255950504182]
本稿では,ラベル付き画像集合とラベル付き画像集合とを併用した画像認識手法を提案する。ここでは、未表示の画像はラベル付きクラスから、あるいは新しいものから来ているかもしれない。まず、新しいカテゴリー発見から最先端のアルゴリズムを取り入れ、そのタスクに適応することで、強力なベースラインを確立する。次に、単純だが効果的な半教師付き$k$-meansメソッドを導入する。
論文参考訳（メタデータ） (2022-01-07T18:58:35Z)
CPPE-5: Medical Personal Protective Equipment Dataset [0.0]
このデータセットには、5つのオブジェクトカテゴリ(カバール、フェイスシールド、手袋、マスク、ゴーグル)が含まれており、各イメージには境界ボックスと正のラベルのセットがアノテートされている。このデータセットでトレーニングされたモデルが、複雑なシーンの現実的なシナリオで簡単に使用できるようにするために、我々のデータセットは主に、各シーンに複数のオブジェクトがある複雑なシーンを自然のコンテキストで表示する画像を含んでいる。
論文参考訳（メタデータ） (2021-12-15T18:45:55Z)
Learning to Detect Every Thing in an Open World [139.78830329914135]
我々は、Learning to Detect Every Thing (LDET)と呼ぶ、シンプルながら驚くほど強力なデータ拡張とトレーニングスキームを提案する。可視だがラベル付けされていない背景オブジェクトの隠蔽を避けるため、元の画像の小さな領域から採取した背景画像上に注釈付きオブジェクトを貼り付ける。 LDETは、オープンワールドのインスタンスセグメンテーションタスクにおいて、多くのデータセットに大きな改善をもたらす。
論文参考訳（メタデータ） (2021-12-03T03:56:06Z)
cofga: A Dataset for Fine Grained Classification of Objects from Aerial Imagery [2.169919643934826]
細粒度分類研究の発展のための新しいオープンデータセットであるCOFGAを紹介する。データセットの2,104枚の画像は、地上515cmの地中撮影システムから収集される。 14256個の注釈付きオブジェクトは、2つのクラス、15のサブクラス、14のユニークな特徴、8の知覚された色に分類された。
論文参考訳（メタデータ） (2021-05-26T18:39:47Z)
Salient Objects in Clutter [130.63976772770368]
本稿では,既存の正当性オブジェクト検出(SOD)データセットの重大な設計バイアスを特定し,対処する。この設計バイアスは、既存のデータセットで評価した場合、最先端のSODモデルのパフォーマンスの飽和につながった。我々は,新しい高品質データセットを提案し,前回のsaliencyベンチマークを更新する。
論文参考訳（メタデータ） (2021-05-07T03:49:26Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。