論文の概要: A Cross-direction Task Decoupling Network for Small Logo Detection
- arxiv url: http://arxiv.org/abs/2305.02503v1
- Date: Thu, 4 May 2023 02:23:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-05 17:15:02.112462
- Title: A Cross-direction Task Decoupling Network for Small Logo Detection
- Title(参考訳): 小さなロゴ検出のためのクロスディレクティブタスクデカップリングネットワーク
- Authors: Hou, Sujuan and Li, Xingzhuo and Min, Weiqing and Li, Jiacheng and
Wang, Jing and Zheng, Yuanjie and Jiang, Shuqiang
- Abstract要約: 我々は,小さなロゴ検出のためのクロスダイレクトタスクデカップリングネットワーク(CTDNet)を創造的に提案する。
4つのロゴデータセットの総合的な実験により,提案手法の有効性と有効性を示す。
- 参考スコア(独自算出の注目度): 28.505952002735334
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Logo detection plays an integral role in many applications. However, handling
small logos is still difficult since they occupy too few pixels in the image,
which burdens the extraction of discriminative features. The aggregation of
small logos also brings a great challenge to the classification and
localization of logos. To solve these problems, we creatively propose
Cross-direction Task Decoupling Network (CTDNet) for small logo detection. We
first introduce Cross-direction Feature Pyramid (CFP) to realize
cross-direction feature fusion by adopting horizontal transmission and vertical
transmission. In addition, Multi-frequency Task Decoupling Head (MTDH)
decouples the classification and localization tasks into two branches. A multi
frequency attention convolution branch is designed to achieve more accurate
regression by combining discrete cosine transform and convolution creatively.
Comprehensive experiments on four logo datasets demonstrate the effectiveness
and efficiency of the proposed method.
- Abstract(参考訳): ロゴ検出は多くのアプリケーションで不可欠な役割を果たす。
しかし,画像中の画素数が多すぎるため,識別的特徴の抽出が困難なため,小さなロゴの扱いは依然として困難である。
小さなロゴの集約は、ロゴの分類とローカライズにも大きな課題をもたらします。
これらの問題を解決するために,小さなロゴ検出のためのクロス指向タスクデカップリングネットワーク(CTDNet)を提案する。
まず, 水平伝送と垂直伝送を併用したクロス指向機能融合を実現するために, クロス指向特徴ピラミッド(cfp)を導入する。
さらに、マルチ周波数タスクデカップリングヘッド(MTDH)は、分類タスクとローカライゼーションタスクを2つのブランチに分離する。
多周波数注意畳み込み分岐は離散コサイン変換と畳み込みを創造的に組み合わせてより正確な回帰を達成するように設計されている。
4つのロゴデータセットの総合実験により,提案手法の有効性と有効性を示した。
関連論文リスト
- LogoSticker: Inserting Logos into Diffusion Models for Customized Generation [73.59571559978278]
テキスト・ツー・イメージ・モデルにロゴを挿入する作業を導入する。
我々の目標は、ロゴのアイデンティティを拡散モデルに挿入し、様々な状況下でシームレスに合成できるようにすることです。
この課題に対処するために,新しい2相パイプラインLogoStickerを提案する。
論文 参考訳(メタデータ) (2024-07-18T17:54:49Z) - Few-Shot Object Detection with Fully Cross-Transformer [35.49840687007507]
Few-shot Object Detection (FSOD) は、ごく少数のトレーニング例を用いて、新しいオブジェクトを検出することを目的としている。
本稿では,機能バックボーンと検出ヘッドの両方にクロストランスフォーマーを組み込むことにより,FSODのための新しいFCTモデルを提案する。
本モデルでは,複数レベルのインタラクションを導入することにより,2つのブランチ間の数ショットの類似性学習を改善することができる。
論文 参考訳(メタデータ) (2022-03-28T18:28:51Z) - Discriminative Semantic Feature Pyramid Network with Guided Anchoring
for Logo Detection [52.36825190893928]
我々は,DSFP-GAを用いた識別的セマンティック特徴ピラミッドネットワークという新しい手法を提案する。
我々のアプローチは主に差別的セマンティック特徴ピラミッド(DSFP)とガイドアンコリング(GA)から構成される。
論文 参考訳(メタデータ) (2021-08-31T11:59:00Z) - An Effective and Robust Detector for Logo Detection [58.448716977297565]
一部の攻撃者は、よく訓練されたロゴ検出モデルを侵害で騙している。
本稿では,2回検討する機構に基づく新しいロゴ検出手法を提案する。
我々は,デテクトRSアルゴリズムを,等化損失関数,マルチスケール変換,および逆データ拡張を備えたカスケードスキーマに拡張する。
論文 参考訳(メタデータ) (2021-08-01T10:17:53Z) - MRDet: A Multi-Head Network for Accurate Oriented Object Detection in
Aerial Images [51.227489316673484]
水平アンカーから変換された指向性提案を生成するために、任意指向領域提案ネットワーク(AO-RPN)を提案する。
正確なバウンディングボックスを得るために,検出タスクを複数のサブタスクに分離し,マルチヘッドネットワークを提案する。
各ヘッドは、対応するタスクに最適な特徴を学習するために特別に設計されており、ネットワークがオブジェクトを正確に検出することができる。
論文 参考訳(メタデータ) (2020-12-24T06:36:48Z) - Robust Facial Landmark Detection by Cross-order Cross-semantic Deep
Network [58.843211405385205]
顔のランドマーク検出を堅牢にするためのセマンティックな特徴学習を促進するために,クロスオーダー・クロスセマンティック・ディープ・ネットワーク(CCDN)を提案する。
具体的には、より識別的な表現学習のためのクロスオーダーチャネル相関を導入するために、クロスオーダー2列マルチ励起(CTM)モジュールを提案する。
新しいクロス・オーダー・クロス・セマンティック・レギュレータ (COCS) は、顔のランドマーク検出のために異なるアクティベーションからクロス・オーダーのクロス・セマンティック特徴を学習するためにネットワークを駆動するように設計されている。
論文 参考訳(メタデータ) (2020-11-16T08:19:26Z) - Suppress and Balance: A Simple Gated Network for Salient Object
Detection [89.88222217065858]
両問題を同時に解くための単純なゲートネットワーク(GateNet)を提案する。
多レベルゲートユニットの助けを借りて、エンコーダからの貴重なコンテキスト情報をデコーダに最適に送信することができる。
さらに,提案したFold-ASPP操作(Fold-ASPP)に基づくアトラス空間ピラミッドプーリングを用いて,様々なスケールのサリアンオブジェクトを正確に位置決めする。
論文 参考訳(メタデータ) (2020-07-16T02:00:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。