論文の概要: Multi-Label Logo Recognition and Retrieval based on Weighted Fusion of
Neural Features
- arxiv url: http://arxiv.org/abs/2205.05419v1
- Date: Wed, 11 May 2022 11:40:40 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-12 19:34:47.821314
- Title: Multi-Label Logo Recognition and Retrieval based on Weighted Fusion of
Neural Features
- Title(参考訳): 重み付けによる神経特徴の融合に基づくマルチラベルロゴ認識と検索
- Authors: Marisa Bernabeu, Antonio Javier Gallego, Antonio Pertusa
- Abstract要約: ロゴ画像の多ラベル分類と類似性検索のためのシステムを提案する。
この方法は、その形状、色、ビジネスセクター、意味論、一般的な特徴に基づいて、最も類似したロゴを得ることを可能にする。
提案手法はEUTMデータセットを用いて評価される。
- 参考スコア(独自算出の注目度): 6.6144185930393435
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Logo classification is a particular case of image classification, since these
may contain only text, images, or a combination of both. In this work, we
propose a system for the multi-label classification and similarity search of
logo images. The method allows obtaining the most similar logos on the basis of
their shape, color, business sector, semantics, general characteristics, or a
combination of such features established by the user. This is done by employing
a set of multi-label networks specialized in certain characteristics of logos.
The features extracted from these networks are combined to perform the
similarity search according to the search criteria established. Since the text
of logos is sometimes irrelevant for the classification, a preprocessing stage
is carried out to remove it, thus improving the overall performance. The
proposed approach is evaluated using the European Union Trademark (EUTM)
dataset, structured with the hierarchical Vienna classification system, which
includes a series of metadata with which to index trademarks. We also make a
comparison between well known logo topologies and Vienna in order to help
designers understand their correspondences. The experimentation carried out
attained reliable performance results, both quantitatively and qualitatively,
which outperformed the state-of-the-art results. In addition, since the
semantics and classification of brands can often be subjective, we also
surveyed graphic design students and professionals in order to assess the
reliability of the proposed method.
- Abstract(参考訳): ロゴの分類は画像分類の特別な場合であり、テキスト、画像、または両方の組み合わせのみを含んでいる可能性がある。
本研究では,ロゴ画像のマルチラベル分類と類似性検索を行うシステムを提案する。
この方法は、その形状、色、ビジネスセクタ、意味論、一般的な特徴、またはユーザが確立した特徴の組み合わせに基づいて、最も類似したロゴを取得することができる。
これは、ロゴの特定の特性に特化している複数のラベルネットワークを用いて行われる。
これらのネットワークから抽出された特徴を組み合わせ、確立された検索基準に従って類似検索を行う。
ロゴのテキストは分類と無関係な場合があるため、前処理段階を施して削除し、全体的な性能を向上させる。
提案手法は,商標を索引付けする一連のメタデータを含む階層的ウィーン分類システムで構築されたEUTMデータセットを用いて評価される。
また、著名なロゴトポロジーとウィーンの比較を行い、デザイナーがそれらの対応を理解するのを助ける。
実験の結果, 定量的, 質的にも, 信頼性の高い結果が得られ, 最先端の成果を上回った。
また,ブランドのセマンティクスや分類は主観的であることが多いため,提案手法の信頼性を評価するため,グラフィックデザインの学生や専門家も調査した。
関連論文リスト
- Graph Attention Transformer Network for Multi-Label Image Classification [48.8971234800309]
複雑なラベル間関係を効果的にマイニングできる多ラベル画像分類のための一般的なフレームワークを提案する。
提案手法は3つのデータセット上で最先端の性能を実現することができる。
論文 参考訳(メタデータ) (2022-03-08T12:39:05Z) - Semantic-Aware Representation Blending for Multi-Label Image Recognition
with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。
MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文 参考訳(メタデータ) (2022-03-04T07:56:16Z) - Structured Semantic Transfer for Multi-Label Recognition with Partial
Labels [85.6967666661044]
部分ラベル付きマルチラベル認識モデルのトレーニングを可能にする構造化意味伝達(SST)フレームワークを提案する。
このフレームワークは2つの相補的なトランスファーモジュールから構成され、インテリアイメージとクロスイメージセマンティック相関を探索する。
Microsoft COCO、Visual Genome、Pascal VOCデータセットの実験は、提案されたSSTフレームワークが現在の最先端アルゴリズムよりも優れたパフォーマンスが得られることを示している。
論文 参考訳(メタデータ) (2021-12-21T02:15:01Z) - Spatial-context-aware deep neural network for multi-class image
classification [12.961070515143161]
意味情報と空間情報の両方を考慮したラベル予測のために,空間コンテキストを考慮した深層ニューラルネットワークを提案する。
このフレームワークはMicrosoft COCOとPASCAL VOCで評価され、画像のマルチラベリングに広く使われているベンチマークデータセットである。
論文 参考訳(メタデータ) (2021-11-24T06:36:10Z) - Contextual Similarity Aggregation with Self-attention for Visual
Re-ranking [96.55393026011811]
本稿では,自己注意を伴う文脈的類似性集約による視覚的再ランク付け手法を提案する。
提案手法の汎用性と有効性を示すため,4つのベンチマークデータセットの総合的な実験を行った。
論文 参考訳(メタデータ) (2021-10-26T06:20:31Z) - Expert Knowledge-Guided Length-Variant Hierarchical Label Generation for
Proposal Classification [21.190465278587045]
提案分類は、提案をラベルの長さ可変シーケンスに分類することを目的としている。
我々は3つの特徴を共同でモデル化する新しいディーププロポーザル分類フレームワークを開発した。
我々のモデルは,次のラベル予測を止めるために,ラベルシーケンスの最適な長さを自動的に識別することができる。
論文 参考訳(メタデータ) (2021-09-14T13:09:28Z) - Discriminative Semantic Feature Pyramid Network with Guided Anchoring
for Logo Detection [52.36825190893928]
我々は,DSFP-GAを用いた識別的セマンティック特徴ピラミッドネットワークという新しい手法を提案する。
我々のアプローチは主に差別的セマンティック特徴ピラミッド(DSFP)とガイドアンコリング(GA)から構成される。
論文 参考訳(メタデータ) (2021-08-31T11:59:00Z) - Multi-Label Image Classification with Contrastive Learning [57.47567461616912]
コントラスト学習の直接適用は,複数ラベルの場合においてほとんど改善できないことを示す。
完全教師付き環境下でのコントラスト学習を用いたマルチラベル分類のための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-07-24T15:00:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。