論文の概要: The Large Labelled Logo Dataset (L3D): A Multipurpose and Hand-Labelled
Continuously Growing Dataset
- arxiv url: http://arxiv.org/abs/2112.05404v1
- Date: Fri, 10 Dec 2021 09:21:44 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-13 21:29:31.840570
- Title: The Large Labelled Logo Dataset (L3D): A Multipurpose and Hand-Labelled
Continuously Growing Dataset
- Title(参考訳): Large Labelled Logo Dataset (L3D):多目的・手作り連続成長データセット
- Authors: Asier Guti\'errez-Fandi\~no, David P\'erez-Fern\'andez, Jordi
Armengol-Estap\'e
- Abstract要約: データセットは、EUIPOオープンレジストリから抽出された256x256 RGBの約770kのカラー画像で構成されている。
それぞれのラベルは、画像に現れる図形的要素とテキスト的要素を分類する複数のラベルに関連付けられている。
このデータセットの2つの直接的な応用、すなわちロゴ分類とロゴ生成を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this work, we present the Large Labelled Logo Dataset (L3D), a
multipurpose, hand-labelled, continuously growing dataset. It is composed of
around 770k of color 256x256 RGB images extracted from the European Union
Intellectual Property Office (EUIPO) open registry. Each of them is associated
to multiple labels that classify the figurative and textual elements that
appear in the images. These annotations have been classified by the EUIPO
evaluators using the Vienna classification, a hierarchical classification of
figurative marks. We suggest two direct applications of this dataset, namely,
logo classification and logo generation.
- Abstract(参考訳): 本稿では,多目的・手書き・連続的に拡大するデータセットである,l3d(large labelled logo dataset)を提案する。
欧州知的財産庁(euipo)のオープンレジストリから抽出された約770kの256x256 rgb画像で構成されている。
それぞれのラベルは、画像に現れる図形要素とテキスト要素を分類する複数のラベルに関連付けられている。
これらの注釈はウィーン分類 (ウィーン分類) を用いてeuipo評価者によって分類されている。
このデータセットの2つの直接的な応用、すなわちロゴ分類とロゴ生成を提案する。
関連論文リスト
- Dual-Perspective Semantic-Aware Representation Blending for Multi-Label
Image Recognition with Partial Labels [70.36722026729859]
本稿では,多粒度カテゴリ固有の意味表現を異なる画像にブレンドした,二重パースペクティブな意味認識表現ブレンディング(DSRB)を提案する。
提案したDSは、すべての比率ラベル設定において、最先端のアルゴリズムを一貫して上回っている。
論文 参考訳(メタデータ) (2022-05-26T00:33:44Z) - Heterogeneous Semantic Transfer for Multi-label Recognition with Partial Labels [70.45813147115126]
部分ラベル付きマルチラベル画像認識(MLR-PL)は、アノテーションのコストを大幅に削減し、大規模なMLRを促進する。
それぞれの画像と異なる画像の間に強い意味的相関が存在することがわかった。
これらの相関関係は、未知のラベルを取得するために、既知のラベルが持つ知識を転送するのに役立ちます。
論文 参考訳(メタデータ) (2022-05-23T08:37:38Z) - Multi-Label Logo Recognition and Retrieval based on Weighted Fusion of
Neural Features [6.6144185930393435]
ロゴ画像の多ラベル分類と類似性検索のためのシステムを提案する。
この方法は、その形状、色、ビジネスセクター、意味論、一般的な特徴に基づいて、最も類似したロゴを得ることを可能にする。
提案手法はEUTMデータセットを用いて評価される。
論文 参考訳(メタデータ) (2022-05-11T11:40:40Z) - Towards Few-shot Entity Recognition in Document Images: A Label-aware
Sequence-to-Sequence Framework [28.898240725099782]
アノテーション付き文書画像のほんの数ショットしか必要としないエンティティ認識モデルを構築します。
ラベルを意識したSeq2seqフレームワーク LASER を開発した。
2つのベンチマークデータセットの実験は、数ショット設定下でのLASERの優位性を示している。
論文 参考訳(メタデータ) (2022-03-30T18:30:42Z) - Semantic-Aware Representation Blending for Multi-Label Image Recognition
with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。
MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文 参考訳(メタデータ) (2022-03-04T07:56:16Z) - Structured Semantic Transfer for Multi-Label Recognition with Partial
Labels [85.6967666661044]
部分ラベル付きマルチラベル認識モデルのトレーニングを可能にする構造化意味伝達(SST)フレームワークを提案する。
このフレームワークは2つの相補的なトランスファーモジュールから構成され、インテリアイメージとクロスイメージセマンティック相関を探索する。
Microsoft COCO、Visual Genome、Pascal VOCデータセットの実験は、提案されたSSTフレームワークが現在の最先端アルゴリズムよりも優れたパフォーマンスが得られることを示している。
論文 参考訳(メタデータ) (2021-12-21T02:15:01Z) - LogoDet-3K: A Large-Scale Image Dataset for Logo Detection [61.296935298332606]
完全アノテーション付き最大のロゴ検出データセットであるLogoDet-3Kを紹介する。
3000のロゴカテゴリー、約20万の注釈付きロゴオブジェクト、158,652の画像がある。
大規模なロゴ検出のための最先端のYOLOv3フレームワークにFocal LosとCIoU Losを組み込んだ強力なベースライン手法であるLogo-Yoloを提案する。
論文 参考訳(メタデータ) (2020-08-12T14:57:53Z) - Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。
画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文 参考訳(メタデータ) (2020-04-02T10:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。