Fugu-MT 論文翻訳(概要): Multi-Label Logo Recognition and Retrieval based on Weighted Fusion of Neural Features

論文の概要: Multi-Label Logo Recognition and Retrieval based on Weighted Fusion of Neural Features

arxiv url: http://arxiv.org/abs/2205.05419v1
Date: Wed, 11 May 2022 11:40:40 GMT
ステータス: 翻訳完了
システム内更新日: 2022-05-12 19:34:47.821314
Title: Multi-Label Logo Recognition and Retrieval based on Weighted Fusion of Neural Features
Title（参考訳）: 重み付けによる神経特徴の融合に基づくマルチラベルロゴ認識と検索
Authors: Marisa Bernabeu, Antonio Javier Gallego, Antonio Pertusa
Abstract要約: ロゴ画像の多ラベル分類と類似性検索のためのシステムを提案する。この方法は、その形状、色、ビジネスセクター、意味論、一般的な特徴に基づいて、最も類似したロゴを得ることを可能にする。提案手法はEUTMデータセットを用いて評価される。
参考スコア（独自算出の注目度）: 6.6144185930393435
License: http://creativecommons.org/licenses/by-nc-nd/4.0/
Abstract: Logo classification is a particular case of image classification, since these may contain only text, images, or a combination of both. In this work, we propose a system for the multi-label classification and similarity search of logo images. The method allows obtaining the most similar logos on the basis of their shape, color, business sector, semantics, general characteristics, or a combination of such features established by the user. This is done by employing a set of multi-label networks specialized in certain characteristics of logos. The features extracted from these networks are combined to perform the similarity search according to the search criteria established. Since the text of logos is sometimes irrelevant for the classification, a preprocessing stage is carried out to remove it, thus improving the overall performance. The proposed approach is evaluated using the European Union Trademark (EUTM) dataset, structured with the hierarchical Vienna classification system, which includes a series of metadata with which to index trademarks. We also make a comparison between well known logo topologies and Vienna in order to help designers understand their correspondences. The experimentation carried out attained reliable performance results, both quantitatively and qualitatively, which outperformed the state-of-the-art results. In addition, since the semantics and classification of brands can often be subjective, we also surveyed graphic design students and professionals in order to assess the reliability of the proposed method.
Abstract（参考訳）: ロゴの分類は画像分類の特別な場合であり、テキスト、画像、または両方の組み合わせのみを含んでいる可能性がある。本研究では,ロゴ画像のマルチラベル分類と類似性検索を行うシステムを提案する。この方法は、その形状、色、ビジネスセクタ、意味論、一般的な特徴、またはユーザが確立した特徴の組み合わせに基づいて、最も類似したロゴを取得することができる。これは、ロゴの特定の特性に特化している複数のラベルネットワークを用いて行われる。これらのネットワークから抽出された特徴を組み合わせ、確立された検索基準に従って類似検索を行う。ロゴのテキストは分類と無関係な場合があるため、前処理段階を施して削除し、全体的な性能を向上させる。提案手法は,商標を索引付けする一連のメタデータを含む階層的ウィーン分類システムで構築されたEUTMデータセットを用いて評価される。また、著名なロゴトポロジーとウィーンの比較を行い、デザイナーがそれらの対応を理解するのを助ける。実験の結果, 定量的, 質的にも, 信頼性の高い結果が得られ, 最先端の成果を上回った。また,ブランドのセマンティクスや分類は主観的であることが多いため,提案手法の信頼性を評価するため,グラフィックデザインの学生や専門家も調査した。

関連論文リスト

Semantic-Aware Graph Matching Mechanism for Multi-Label Image Recognition [21.36538164675385]
マルチラベル画像認識は、画像に存在するラベルの集合を予測することを目的としている。本稿では、各画像をインスタンスの袋として扱い、複数ラベル画像認識のタスクをインスタンス-ラベルマッチング選択問題として定式化する。マルチラベル画像認識(ML-SGM)のための革新的なセマンティック対応グラフマッチングフレームワークを提案する。
論文参考訳（メタデータ） (2023-04-21T23:48:01Z)
Dual-Perspective Semantic-Aware Representation Blending for Multi-Label Image Recognition with Partial Labels [70.36722026729859]
本稿では,多粒度カテゴリ固有の意味表現を異なる画像にブレンドした,二重パースペクティブな意味認識表現ブレンディング(DSRB)を提案する。提案したDSは、すべての比率ラベル設定において、最先端のアルゴリズムを一貫して上回っている。
論文参考訳（メタデータ） (2022-05-26T00:33:44Z)
Heterogeneous Semantic Transfer for Multi-label Recognition with Partial Labels [70.45813147115126]
部分ラベル付きマルチラベル画像認識(MLR-PL)は、アノテーションのコストを大幅に削減し、大規模なMLRを促進する。それぞれの画像と異なる画像の間に強い意味的相関が存在することがわかった。これらの相関関係は、未知のラベルを取得するために、既知のラベルが持つ知識を転送するのに役立ちます。
論文参考訳（メタデータ） (2022-05-23T08:37:38Z)
Semantic-Aware Representation Blending for Multi-Label Image Recognition with Partial Labels [86.17081952197788]
そこで我々は,未知のラベルを補うために,異なる画像にカテゴリ固有の表現をブレンドして,既知のラベルの情報を伝達することを提案する。 MS-COCO、Visual Genome、Pascal VOC 2007データセットの実験は、提案されたSARBフレームワークが、現在の主要な競合相手よりも優れたパフォーマンスを得ることを示している。
論文参考訳（メタデータ） (2022-03-04T07:56:16Z)
Contextual Similarity Aggregation with Self-attention for Visual Re-ranking [96.55393026011811]
本稿では,自己注意を伴う文脈的類似性集約による視覚的再ランク付け手法を提案する。提案手法の汎用性と有効性を示すため,4つのベンチマークデータセットの総合的な実験を行った。
論文参考訳（メタデータ） (2021-10-26T06:20:31Z)
Knowledge-Guided Multi-Label Few-Shot Learning for General Image Recognition [75.44233392355711]
KGGRフレームワークは、ディープニューラルネットワークと統計ラベル相関の事前知識を利用する。まず、統計ラベルの共起に基づいて異なるラベルを相関させる構造化知識グラフを構築する。次に、ラベルセマンティクスを導入し、学習セマンティクス固有の特徴をガイドする。グラフノードの相互作用を探索するためにグラフ伝搬ネットワークを利用する。
論文参考訳（メタデータ） (2020-09-20T15:05:29Z)
Zero-Shot Recognition through Image-Guided Semantic Classification [9.291055558504588]
ゼロショット学習(ZSL)のための新しい埋め込み型フレームワークを提案する。複数ラベル分類のための2値関係法により,画像と意味分類器のマッピングを逆学習する手法を提案する。 IGSCは概念的には単純であり、分類のための既存のディープアーキテクチャをわずかに拡張することで実現可能である。
論文参考訳（メタデータ） (2020-07-23T06:22:40Z)
Hierarchical Image Classification using Entailment Cone Embeddings [68.82490011036263]
まずラベル階層の知識を任意のCNNベースの分類器に注入する。画像からの視覚的セマンティクスと組み合わせた外部セマンティクス情報の利用が全体的な性能を高めることを実証的に示す。
論文参考訳（メタデータ） (2020-04-02T10:22:02Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。