論文の概要: WikiChurches: A Fine-Grained Dataset of Architectural Styles with
Real-World Challenges
- arxiv url: http://arxiv.org/abs/2108.06959v1
- Date: Mon, 16 Aug 2021 08:33:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 21:14:04.194201
- Title: WikiChurches: A Fine-Grained Dataset of Architectural Styles with
Real-World Challenges
- Title(参考訳): wikichurches: 現実の課題を伴うアーキテクチャスタイルのきめ細かいデータセット
- Authors: Bj\"orn Barz, Joachim Denzler
- Abstract要約: 建築様式分類のための新しいデータセットについて紹介する。
データセットは、さまざまな研究分野のベンチマークとして機能する。
さらに、139の教会に特徴的な視覚的特徴を示す631のバウンディングボックスアノテーションを提供する。
- 参考スコア(独自算出の注目度): 9.625253146891025
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We introduce a novel dataset for architectural style classification,
consisting of 9,485 images of church buildings. Both images and style labels
were sourced from Wikipedia. The dataset can serve as a benchmark for various
research fields, as it combines numerous real-world challenges: fine-grained
distinctions between classes based on subtle visual features, a comparatively
small sample size, a highly imbalanced class distribution, a high variance of
viewpoints, and a hierarchical organization of labels, where only some images
are labeled at the most precise level. In addition, we provide 631 bounding box
annotations of characteristic visual features for 139 churches from four major
categories. These annotations can, for example, be useful for research on
fine-grained classification, where additional expert knowledge about
distinctive object parts is often available. Images and annotations are
available at: https://doi.org/10.5281/zenodo.5166987
- Abstract(参考訳): 建築様式分類のための新しいデータセットを導入し,教会建築の9,485枚の画像から構成した。
画像とスタイルのラベルはウィキペディアから作成されている。
このデータセットは、微妙な視覚的特徴に基づくクラス間のきめ細かい区別、比較的小さなサンプルサイズ、高度に不均衡なクラス分布、視点のばらつき、ラベルの階層的な構成など、現実世界のさまざまな課題のベンチマークとして機能する。
さらに,4つのカテゴリの139の教会に対して,特徴的な視覚特徴のバウンディングボックスアノテーションを631個提供する。
これらのアノテーションは、例えば、細かい粒度の分類の研究に役立ち、異なるオブジェクト部分に関する専門家の知識がしばしば利用できる。
https://doi.org/10.5281/zenodo.5166987
関連論文リスト
- Is Medieval Distant Viewing Possible? : Extending and Enriching Annotation of Legacy Image Collections using Visual Analytics [3.89394670917253]
本稿では,相反するメタデータと重複するメタデータを示す2つの注釈付き中世の写本画像について述べる。
統合データセットの"ブリッジ"として機能する,より均一なラベルセットを作ることを目標としています。
ビジュアルインターフェースは、メタデータの総合計を超えるデータ間の関係について、専門家に概要を提供する。
論文 参考訳(メタデータ) (2022-08-20T10:59:33Z) - On Guiding Visual Attention with Language Specification [76.08326100891571]
注意をそらすのではなく,タスク関連機能に分類証拠を限定するためのアドバイスとして,ハイレベルな言語仕様を用いる。
この方法で空間的注意を監督することは、偏りのあるノイズのあるデータを用いた分類タスクの性能を向上させる。
論文 参考訳(メタデータ) (2022-02-17T22:40:19Z) - cofga: A Dataset for Fine Grained Classification of Objects from Aerial
Imagery [2.169919643934826]
細粒度分類研究の発展のための新しいオープンデータセットであるCOFGAを紹介する。
データセットの2,104枚の画像は、地上515cmの地中撮影システムから収集される。
14256個の注釈付きオブジェクトは、2つのクラス、15のサブクラス、14のユニークな特徴、8の知覚された色に分類された。
論文 参考訳(メタデータ) (2021-05-26T18:39:47Z) - Enhancing Fine-Grained Classification for Low Resolution Images [97.82441158440527]
低解像度画像は、限られた情報内容の固有の課題と、サブカテゴリ分類に有用な詳細の欠如に悩まされる。
本研究では,補助情報を用いて分類の識別的特徴を学習する,新たな属性支援損失を提案する。
提案する損失関数により、モデルは属性レベルの分離性を取り入れながら、クラス固有の識別特徴を学習することができる。
論文 参考訳(メタデータ) (2021-05-01T13:19:02Z) - Noisy Labels Can Induce Good Representations [53.47668632785373]
アーキテクチャがノイズラベルによる学習に与える影響について検討する。
ノイズラベルを用いたトレーニングは,モデルが一般化に乏しい場合でも,有用な隠れ表現を誘導できることを示す。
この発見は、騒々しいラベルで訓練されたモデルを改善する簡単な方法につながります。
論文 参考訳(メタデータ) (2020-12-23T18:58:05Z) - Grafit: Learning fine-grained image representations with coarse labels [114.17782143848315]
本稿では,学習ラベルの提供するものよりも細かな表現を学習する問題に対処する。
粗いラベルと下層の細粒度潜在空間を併用することにより、カテゴリレベルの検索手法の精度を大幅に向上させる。
論文 参考訳(メタデータ) (2020-11-25T19:06:26Z) - Exploring the Hierarchy in Relation Labels for Scene Graph Generation [75.88758055269948]
提案手法は,Recall@50において,複数の最先端ベースラインを大きなマージン(最大33%の相対利得)で改善することができる。
実験により,提案手法により,最先端のベースラインを大きなマージンで改善できることが示された。
論文 参考訳(メタデータ) (2020-09-12T17:36:53Z) - Impact of base dataset design on few-shot image classification [33.31817928613412]
本研究では,異なる画像集合上で訓練された深部特徴を,数ショットの分類設定で評価することにより,トレーニングデータの変動の影響を系統的に研究する。
簡単なベースラインをアートアルゴリズムの先進的な状態に置き換えるよりも,数ショットの分類において,ベースデータセット設計がパフォーマンスを劇的に向上させることを示す。
論文 参考訳(メタデータ) (2020-07-17T09:58:50Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z) - Learning to segment images with classification labels [0.0]
本稿では,画像レベルのラベルを用いることで,セグメンテーションレベルの真実の要求を緩和できるアーキテクチャを提案する。
実験では,クラス毎に1つのセグメンテーションレベルのアノテーションしか使用せず,完全に注釈付けされたデータセットに匹敵する性能が得られることを示した。
論文 参考訳(メタデータ) (2019-12-28T22:01:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。