論文の概要: Discriminative Semantic Feature Pyramid Network with Guided Anchoring
for Logo Detection
- arxiv url: http://arxiv.org/abs/2108.13775v1
- Date: Tue, 31 Aug 2021 11:59:00 GMT
- ステータス: 処理完了
- システム内更新日: 2021-09-01 21:29:04.135660
- Title: Discriminative Semantic Feature Pyramid Network with Guided Anchoring
for Logo Detection
- Title(参考訳): ロゴ検出のためのガイドアンコリングによる識別的セマンティック特徴ピラミッドネットワーク
- Authors: Baisong Zhang, Weiqing Min, Jing Wang, Sujuan Hou, Qiang Hou, Yuanjie
Zheng, Shuqiang Jiang
- Abstract要約: 我々は,DSFP-GAを用いた識別的セマンティック特徴ピラミッドネットワークという新しい手法を提案する。
我々のアプローチは主に差別的セマンティック特徴ピラミッド(DSFP)とガイドアンコリング(GA)から構成される。
- 参考スコア(独自算出の注目度): 52.36825190893928
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, logo detection has received more and more attention for its wide
applications in the multimedia field, such as intellectual property protection,
product brand management, and logo duration monitoring. Unlike general object
detection, logo detection is a challenging task, especially for small logo
objects and large aspect ratio logo objects in the real-world scenario. In this
paper, we propose a novel approach, named Discriminative Semantic Feature
Pyramid Network with Guided Anchoring (DSFP-GA), which can address these
challenges via aggregating the semantic information and generating different
aspect ratio anchor boxes. More specifically, our approach mainly consists of
Discriminative Semantic Feature Pyramid (DSFP) and Guided Anchoring (GA).
Considering that low-level feature maps that are used to detect small logo
objects lack semantic information, we propose the DSFP, which can enrich more
discriminative semantic features of low-level feature maps and can achieve
better performance on small logo objects. Furthermore, preset anchor boxes are
less efficient for detecting large aspect ratio logo objects. We therefore
integrate the GA into our method to generate large aspect ratio anchor boxes to
mitigate this issue. Extensive experimental results on four benchmarks
demonstrate the effectiveness of our proposed DSFP-GA. Moreover, we further
conduct visual analysis and ablation studies to illustrate the advantage of our
method in detecting small and large aspect logo objects. The code and models
can be found at https://github.com/Zhangbaisong/DSFP-GA.
- Abstract(参考訳): 近年,知的財産保護,製品ブランド管理,ロゴ持続時間監視といったマルチメディア分野の幅広い応用において,ロゴ検出が注目されている。
一般的なオブジェクト検出とは異なり、ロゴ検出は特に小さなロゴオブジェクトと現実世界のシナリオにおける大きなアスペクト比のロゴオブジェクトに対して難しいタスクである。
本稿では,意味情報を集約し,異なるアスペクト比アンカーボックスを生成することにより,これらの課題に対処できる,dsfp-gaを用いた識別的意味的特徴ピラミッドネットワークという新しいアプローチを提案する。
より具体的には,本手法は主に差別的意味的特徴ピラミッド(DSFP)とガイドアンコリング(GA)から構成される。
小さいロゴオブジェクトを検出するために使用される低レベル特徴マップに意味情報がないことを考慮し、低レベル特徴マップのより識別的な意味的特徴を豊かにし、小さなロゴオブジェクトのパフォーマンスを向上させるdsfpを提案する。
さらに、大アスペクト比ロゴオブジェクトの検出には、プリセットアンカーボックスの効率が低い。
そこで我々はgaを本手法に統合し,この問題を軽減するために大きなアスペクト比アンカーボックスを生成する。
提案したDSFP-GAの有効性を4つのベンチマークで検証した。
さらに,小型・大型のロゴオブジェクトの検出において,この手法の利点を示すために,視覚解析およびアブレーション研究を行っている。
コードとモデルはhttps://github.com/Zhangbaisong/DSFP-GAで見ることができる。
関連論文リスト
- Fine-grained Background Representation for Weakly Supervised Semantic Segmentation [35.346567242839065]
本稿では,多様なBGセマンティクスを発見し,表現するために,FBR法を提案する。
そこで本研究では,FG陰性線を抽出し,地中コントラスト学習を効果的に行うためのアクティブサンプリング戦略を提案する。
本手法は,Pascal Voc および MS COCO テストセットにおいて,73.2 mIoU と 45.6 mIoU のセグメンテーション結果を得る。
論文 参考訳(メタデータ) (2024-06-22T06:45:25Z) - Improving the Detection of Small Oriented Objects in Aerial Images [0.0]
本研究では,オブジェクト指向物体検出モデルの分類・回帰タスクを強化することにより,空中画像中の小型物体を高精度に検出する手法を提案する。
ガイド・アテンション・ロス(GALoss)とボックス・ポイント・ロス(BPLoss)の2つの損失からなるアテンション・ポイント・ネットワークを設計した。
実験結果から,小型オブジェクトインスタンスを用いた標準指向型空中データセットにおける注意点ネットワークの有効性が示された。
論文 参考訳(メタデータ) (2024-01-12T11:00:07Z) - Small Object Detection via Coarse-to-fine Proposal Generation and
Imitation Learning [52.06176253457522]
本稿では,粗粒度パイプラインと特徴模倣学習に基づく小型物体検出に適した2段階フレームワークを提案する。
CFINetは、大規模な小さなオブジェクト検出ベンチマークであるSODA-DとSODA-Aで最先端の性能を達成する。
論文 参考訳(メタデータ) (2023-08-18T13:13:09Z) - Holistic Prototype Attention Network for Few-Shot VOS [74.25124421163542]
FSVOS(Few-shot Video Object segmentation)は、少数のサポートイメージに頼って、目に見えないクラスの動的オブジェクトをセグメントすることを目的としている。
本稿では,FSVOS を前進させるための総合プロトタイプアテンションネットワーク (HPAN) を提案する。
論文 参考訳(メタデータ) (2023-07-16T03:48:57Z) - Learning Remote Sensing Object Detection with Single Point Supervision [17.12725535531483]
Pointly Supervised Object Detection (PSOD) は、ボックスレベルの監視対象検出と比較してラベリングコストが低いため、かなりの関心を集めている。
本研究では,RS画像に適したPSOD法を提案する。
提案手法は,最先端の画像レベルとポイントレベルの教師付き検出法と比較して性能が大幅に向上し,PSODとボックスレベルの教師付きオブジェクト検出の差を低減できる。
論文 参考訳(メタデータ) (2023-05-23T15:06:04Z) - A Cross-direction Task Decoupling Network for Small Logo Detection [28.505952002735334]
我々は,小さなロゴ検出のためのクロスダイレクトタスクデカップリングネットワーク(CTDNet)を創造的に提案する。
4つのロゴデータセットの総合的な実験により,提案手法の有効性と有効性を示す。
論文 参考訳(メタデータ) (2023-05-04T02:23:34Z) - Deep Learning for Logo Detection: A Survey [59.278443852492465]
本稿では, 深層学習技術のロゴ検出への応用について概説する。
既存のロゴ検出戦略と学習戦略の長所と短所を詳細に分析する。
知的輸送やブランド監視から著作権や商標の遵守に至るまで,さまざまな分野におけるロゴ検出の応用を要約する。
論文 参考訳(メタデータ) (2022-10-10T02:07:41Z) - An Effective and Robust Detector for Logo Detection [58.448716977297565]
一部の攻撃者は、よく訓練されたロゴ検出モデルを侵害で騙している。
本稿では,2回検討する機構に基づく新しいロゴ検出手法を提案する。
我々は,デテクトRSアルゴリズムを,等化損失関数,マルチスケール変換,および逆データ拡張を備えたカスケードスキーマに拡張する。
論文 参考訳(メタデータ) (2021-08-01T10:17:53Z) - LogoDet-3K: A Large-Scale Image Dataset for Logo Detection [61.296935298332606]
完全アノテーション付き最大のロゴ検出データセットであるLogoDet-3Kを紹介する。
3000のロゴカテゴリー、約20万の注釈付きロゴオブジェクト、158,652の画像がある。
大規模なロゴ検出のための最先端のYOLOv3フレームワークにFocal LosとCIoU Losを組み込んだ強力なベースライン手法であるLogo-Yoloを提案する。
論文 参考訳(メタデータ) (2020-08-12T14:57:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。