論文の概要: Makeup216: Logo Recognition with Adversarial Attention Representations
- arxiv url: http://arxiv.org/abs/2112.06533v1
- Date: Mon, 13 Dec 2021 10:08:56 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 17:24:26.734045
- Title: Makeup216: Logo Recognition with Adversarial Attention Representations
- Title(参考訳): makeup216: 敵対的注意表現を用いたロゴ認識
- Authors: Junjun Hu, Yanhao Zhu, Bo Zhao, Jiexin Zheng, Chenxu Zhao, Xiangyu
Zhu, Kangle Wu, Darun Tang
- Abstract要約: メイクアップ216は、メイクアップの分野で最大の、そして最も複雑なロゴのデータセットで、現実世界から撮影された。
216のロゴと157のブランドで構成され、その中には10,019の画像と37,018の注釈付きロゴオブジェクトが含まれる。
提案するフレームワークは,Makeup216と他の大規模オープンロゴデータセットで競合する結果を得た。
- 参考スコア(独自算出の注目度): 16.78131635640705
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: One of the challenges of logo recognition lies in the diversity of forms,
such as symbols, texts or a combination of both; further, logos tend to be
extremely concise in design while similar in appearance, suggesting the
difficulty of learning discriminative representations. To investigate the
variety and representation of logo, we introduced Makeup216, the largest and
most complex logo dataset in the field of makeup, captured from the real world.
It comprises of 216 logos and 157 brands, including 10,019 images and 37,018
annotated logo objects. In addition, we found that the marginal background
around the pure logo can provide a important context information and proposed
an adversarial attention representation framework (AAR) to attend on the logo
subject and auxiliary marginal background separately, which can be combined for
better representation. Our proposed framework achieved competitive results on
Makeup216 and another large-scale open logo dataset, which could provide fresh
thinking for logo recognition. The dataset of Makeup216 and the code of the
proposed framework will be released soon.
- Abstract(参考訳): ロゴ認識の課題の1つは、シンボル、テキスト、またはそれらの組み合わせといった形態の多様性にある。さらに、ロゴはデザインにおいて極めて簡潔であり、外観は類似しており、識別表現を学ぶことの難しさを示唆している。
ロゴの多様性と表現について検討するため,実世界から取得した化粧分野における最大かつ最も複雑なロゴデータセットであるMakeup216を紹介した。
216のロゴと157のブランドで構成され、その中には10,019の画像と37,018の注釈付きロゴオブジェクトが含まれる。
また,純正ロゴの辺縁背景が重要な文脈情報を提供できること,ロゴテーマと補助辺縁背景に別々に出席する敵注意表現フレームワーク(aar)を提案し,より優れた表現のために組み合わせることができることを示した。
提案するフレームワークは,Makeup216と,ロゴ認識の新たな考え方を提供する大規模オープンロゴデータセット上で,競合する結果を得た。
Makeup216のデータセットと提案されたフレームワークのコードは近くリリースされる。
関連論文リスト
- LogoSticker: Inserting Logos into Diffusion Models for Customized Generation [73.59571559978278]
テキスト・ツー・イメージ・モデルにロゴを挿入する作業を導入する。
我々の目標は、ロゴのアイデンティティを拡散モデルに挿入し、様々な状況下でシームレスに合成できるようにすることです。
この課題に対処するために,新しい2相パイプラインLogoStickerを提案する。
論文 参考訳(メタデータ) (2024-07-18T17:54:49Z) - SLANT: Spurious Logo ANalysis Toolkit [61.59021920232986]
SLANT: Spurious Logo Analysis Toolkitを開発した。
というロゴをマイニングするためのセミオートマチックなメカニズムが組み込まれている。
我々は、VLモデルが負の人形容詞と相関する様々な無害なロゴを発見した。
攻撃者は有害なコンテンツに急激なロゴを配置することができ、モデルがそれを無害と誤分類する原因となった。
論文 参考訳(メタデータ) (2024-06-03T15:41:31Z) - FashionLOGO: Prompting Multimodal Large Language Models for Fashion Logo Embeddings [26.395196542803543]
本稿では,MLLMに製品画像の適切なテキストを生成するよう促すアプローチを提案する。
実世界のデータセットに関する我々の実験は、FashionLOGOが汎用的で堅牢なロゴ埋め込みを生成することができることを証明している。
論文 参考訳(メタデータ) (2023-08-17T14:30:26Z) - LogoNet: a fine-grained network for instance-level logo sketch retrieval [7.858317554338922]
2kのロゴインスタンスと9k以上のスケッチを含むインスタンスレベルのロゴスケッチデータセットを構築した。
次に、ロゴの正確なスケッチ検索のためのLogoNetと呼ばれるハイブリッドアテンション機構に基づく、きめ細かいトリプルブランチCNNアーキテクチャを開発する。
論文 参考訳(メタデータ) (2023-04-05T04:03:02Z) - Contrastive Multi-View Textual-Visual Encoding: Towards One Hundred
Thousand-Scale One-Shot Logo Identification [2.243832625209014]
オープン・セットのワンショット・セッティングにおいて,ビジネスブランドのロゴを自然シーンで識別する問題について検討する。
ロゴに現れるテキストをエンコードする新しい多視点テキスト視覚符号化フレームワークを提案する。
提案手法は, 自然シーンの作業において, 作付ロゴ識別, 作付ロゴ識別, エンド・ツー・エンドのロゴ識別を行う。
論文 参考訳(メタデータ) (2022-11-23T12:59:41Z) - Deep Learning for Logo Detection: A Survey [59.278443852492465]
本稿では, 深層学習技術のロゴ検出への応用について概説する。
既存のロゴ検出戦略と学習戦略の長所と短所を詳細に分析する。
知的輸送やブランド監視から著作権や商標の遵守に至るまで,さまざまな分野におけるロゴ検出の応用を要約する。
論文 参考訳(メタデータ) (2022-10-10T02:07:41Z) - Discriminative Semantic Feature Pyramid Network with Guided Anchoring
for Logo Detection [52.36825190893928]
我々は,DSFP-GAを用いた識別的セマンティック特徴ピラミッドネットワークという新しい手法を提案する。
我々のアプローチは主に差別的セマンティック特徴ピラミッド(DSFP)とガイドアンコリング(GA)から構成される。
論文 参考訳(メタデータ) (2021-08-31T11:59:00Z) - FoodLogoDet-1500: A Dataset for Large-Scale Food Logo Detection via
Multi-Scale Feature Decoupling Network [55.49022825759331]
高度な食品ロゴ検出アルゴリズムを開発するには、大規模な食品ロゴデータセットが緊急に必要である。
FoodLogoDet-1500は、1500のカテゴリ、約10万の画像、約15万個の手動で注釈付けされた食品ロゴオブジェクトを備えた、新しい大規模一般公開の食品ロゴデータセットである。
食品のロゴを識別する手法として,MFDNet(Multi-scale Feature Decoupling Network)を提案する。
論文 参考訳(メタデータ) (2021-08-10T12:47:04Z) - LogoDet-3K: A Large-Scale Image Dataset for Logo Detection [61.296935298332606]
完全アノテーション付き最大のロゴ検出データセットであるLogoDet-3Kを紹介する。
3000のロゴカテゴリー、約20万の注釈付きロゴオブジェクト、158,652の画像がある。
大規模なロゴ検出のための最先端のYOLOv3フレームワークにFocal LosとCIoU Losを組み込んだ強力なベースライン手法であるLogo-Yoloを提案する。
論文 参考訳(メタデータ) (2020-08-12T14:57:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。