論文の概要: LogoDet-3K: A Large-Scale Image Dataset for Logo Detection
- arxiv url: http://arxiv.org/abs/2008.05359v1
- Date: Wed, 12 Aug 2020 14:57:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-31 06:00:25.680068
- Title: LogoDet-3K: A Large-Scale Image Dataset for Logo Detection
- Title(参考訳): LogoDet-3K:ロゴ検出のための大規模画像データセット
- Authors: Jing Wang, Weiqing Min, Sujuan Hou, Shengnan Ma, Yuanjie Zheng,
Shuqiang Jiang
- Abstract要約: 完全アノテーション付き最大のロゴ検出データセットであるLogoDet-3Kを紹介する。
3000のロゴカテゴリー、約20万の注釈付きロゴオブジェクト、158,652の画像がある。
大規模なロゴ検出のための最先端のYOLOv3フレームワークにFocal LosとCIoU Losを組み込んだ強力なベースライン手法であるLogo-Yoloを提案する。
- 参考スコア(独自算出の注目度): 61.296935298332606
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Logo detection has been gaining considerable attention because of its wide
range of applications in the multimedia field, such as copyright infringement
detection, brand visibility monitoring, and product brand management on social
media. In this paper, we introduce LogoDet-3K, the largest logo detection
dataset with full annotation, which has 3,000 logo categories, about 200,000
manually annotated logo objects and 158,652 images. LogoDet-3K creates a more
challenging benchmark for logo detection, for its higher comprehensive coverage
and wider variety in both logo categories and annotated objects compared with
existing datasets. We describe the collection and annotation process of our
dataset, analyze its scale and diversity in comparison to other datasets for
logo detection. We further propose a strong baseline method Logo-Yolo, which
incorporates Focal loss and CIoU loss into the state-of-the-art YOLOv3
framework for large-scale logo detection. Logo-Yolo can solve the problems of
multi-scale objects, logo sample imbalance and inconsistent bounding-box
regression. It obtains about 4% improvement on the average performance compared
with YOLOv3, and greater improvements compared with reported several deep
detection models on LogoDet-3K. The evaluations on other three existing
datasets further verify the effectiveness of our method, and demonstrate better
generalization ability of LogoDet-3K on logo detection and retrieval tasks. The
LogoDet-3K dataset is used to promote large-scale logo-related research and it
can be found at https://github.com/Wangjing1551/LogoDet-3K-Dataset.
- Abstract(参考訳): 著作権侵害検出、ブランドの可視性監視、ソーシャルメディア上の製品ブランド管理など、マルチメディア分野における幅広い応用により、ローゴ検出が注目されている。
本稿では,3000のロゴカテゴリ,約20万の注釈付きロゴオブジェクト,および158,652のイメージを有する,全アノテーション付き最大のロゴ検出データセットであるLogoDet-3Kを紹介する。
LogoDet-3Kは、ロゴ検出のためのより難しいベンチマークを作成し、ロゴカテゴリと注釈付きオブジェクトの両方において、既存のデータセットと比較して、より包括的なカバレッジと広範な多様性を実現する。
当社のデータセットの収集とアノテーションプロセスについて説明し,ロゴ検出のための他のデータセットと比較して,そのスケールと多様性を分析した。
さらに,大規模なロゴ検出のための最先端のyolov3フレームワークに焦点損失とciou損失を組み込んだ,強力なベースライン手法であるlogo-yoloを提案する。
Logo-Yoloは、マルチスケールオブジェクト、ロゴサンプルの不均衡、一貫性のないバウンディングボックス回帰の問題を解決することができる。
YOLOv3と比較して平均パフォーマンスが約4%向上し、LogoDet-3Kのいくつかのディープ検出モデルと比較して改善が進んだ。
本手法の有効性を検証し,ロゴ検出および検索作業におけるLogoDet-3Kの一般化能力の向上を実証した。
LogoDet-3Kデータセットは、大規模なロゴ関連の研究を促進するために使用され、https://github.com/Wangjing1551/LogoDet-3K-Datasetで見ることができる。
関連論文リスト
- SLANT: Spurious Logo ANalysis Toolkit [61.59021920232986]
SLANT: Spurious Logo Analysis Toolkitを開発した。
というロゴをマイニングするためのセミオートマチックなメカニズムが組み込まれている。
我々は、VLモデルが負の人形容詞と相関する様々な無害なロゴを発見した。
攻撃者は有害なコンテンツに急激なロゴを配置することができ、モデルがそれを無害と誤分類する原因となった。
論文 参考訳(メタデータ) (2024-06-03T15:41:31Z) - Image-Text Pre-Training for Logo Recognition [0.27195102129094995]
マッチングモデルの性能向上のための2つの新しいコントリビューションを提案する。
微調整済みのImageNet事前学習モデルの標準パラダイムは、マッチング問題を効果的に解決するために必要なテキスト感度を見つけるのに失敗する。
OpenLogoDet3K47で微調整された場合、イメージテキストデータ上で事前トレーニングされた同じビジョンバックボーンが、980.6%のリコール@1.99ドルを達成した。
論文 参考訳(メタデータ) (2023-09-18T23:18:02Z) - Contrastive Multi-View Textual-Visual Encoding: Towards One Hundred
Thousand-Scale One-Shot Logo Identification [2.243832625209014]
オープン・セットのワンショット・セッティングにおいて,ビジネスブランドのロゴを自然シーンで識別する問題について検討する。
ロゴに現れるテキストをエンコードする新しい多視点テキスト視覚符号化フレームワークを提案する。
提案手法は, 自然シーンの作業において, 作付ロゴ識別, 作付ロゴ識別, エンド・ツー・エンドのロゴ識別を行う。
論文 参考訳(メタデータ) (2022-11-23T12:59:41Z) - Deep Learning for Logo Detection: A Survey [59.278443852492465]
本稿では, 深層学習技術のロゴ検出への応用について概説する。
既存のロゴ検出戦略と学習戦略の長所と短所を詳細に分析する。
知的輸送やブランド監視から著作権や商標の遵守に至るまで,さまざまな分野におけるロゴ検出の応用を要約する。
論文 参考訳(メタデータ) (2022-10-10T02:07:41Z) - Discriminative Semantic Feature Pyramid Network with Guided Anchoring
for Logo Detection [52.36825190893928]
我々は,DSFP-GAを用いた識別的セマンティック特徴ピラミッドネットワークという新しい手法を提案する。
我々のアプローチは主に差別的セマンティック特徴ピラミッド(DSFP)とガイドアンコリング(GA)から構成される。
論文 参考訳(メタデータ) (2021-08-31T11:59:00Z) - FoodLogoDet-1500: A Dataset for Large-Scale Food Logo Detection via
Multi-Scale Feature Decoupling Network [55.49022825759331]
高度な食品ロゴ検出アルゴリズムを開発するには、大規模な食品ロゴデータセットが緊急に必要である。
FoodLogoDet-1500は、1500のカテゴリ、約10万の画像、約15万個の手動で注釈付けされた食品ロゴオブジェクトを備えた、新しい大規模一般公開の食品ロゴデータセットである。
食品のロゴを識別する手法として,MFDNet(Multi-scale Feature Decoupling Network)を提案する。
論文 参考訳(メタデータ) (2021-08-10T12:47:04Z) - An Effective and Robust Detector for Logo Detection [58.448716977297565]
一部の攻撃者は、よく訓練されたロゴ検出モデルを侵害で騙している。
本稿では,2回検討する機構に基づく新しいロゴ検出手法を提案する。
我々は,デテクトRSアルゴリズムを,等化損失関数,マルチスケール変換,および逆データ拡張を備えたカスケードスキーマに拡張する。
論文 参考訳(メタデータ) (2021-08-01T10:17:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。