論文の概要: Global Meets Local: Effective Multi-Label Image Classification via
Category-Aware Weak Supervision
- arxiv url: http://arxiv.org/abs/2211.12716v1
- Date: Wed, 23 Nov 2022 05:39:17 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-24 15:15:05.156238
- Title: Global Meets Local: Effective Multi-Label Image Classification via
Category-Aware Weak Supervision
- Title(参考訳): Global Meets Local: Category-Aware Weak Supervisionによる効果的なマルチラベル画像分類
- Authors: Jiawei Zhan, Jun Liu, Wei Tang, Guannan Jiang, Xi Wang, Bin-Bin Gao,
Tianliang Zhang, Wenlong Wu, Wei Zhang, Chengjie Wang, Yuan Xie
- Abstract要約: 本稿では,効果的雑音・確率抑圧を実現するための統一的な枠組みを構築した。
我々はグローバルな特徴とローカルな特徴の相補的な情報を探るため、粒度横断型アテンションモジュールを開発した。
我々のフレームワークは最先端の手法よりも優れた性能を実現している。
- 参考スコア(独自算出の注目度): 37.761378069277676
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Multi-label image classification, which can be categorized into
label-dependency and region-based methods, is a challenging problem due to the
complex underlying object layouts. Although region-based methods are less
likely to encounter issues with model generalizability than label-dependency
methods, they often generate hundreds of meaningless or noisy proposals with
non-discriminative information, and the contextual dependency among the
localized regions is often ignored or over-simplified. This paper builds a
unified framework to perform effective noisy-proposal suppression and to
interact between global and local features for robust feature learning.
Specifically, we propose category-aware weak supervision to concentrate on
non-existent categories so as to provide deterministic information for local
feature learning, restricting the local branch to focus on more high-quality
regions of interest. Moreover, we develop a cross-granularity attention module
to explore the complementary information between global and local features,
which can build the high-order feature correlation containing not only
global-to-local, but also local-to-local relations. Both advantages guarantee a
boost in the performance of the whole network. Extensive experiments on two
large-scale datasets (MS-COCO and VOC 2007) demonstrate that our framework
achieves superior performance over state-of-the-art methods.
- Abstract(参考訳): ラベル依存と領域ベースの方法に分類できるマルチラベル画像分類は、複雑なオブジェクトレイアウトのために難しい問題である。
領域ベースの手法はラベル依存法よりもモデル一般化可能性の問題に遭遇する可能性は低いが、何百もの無意味または騒がしい提案を非識別情報で生成し、局所化された領域間の文脈依存はしばしば無視または単純化される。
本稿では,雑音抑圧を効果的に行うための統一フレームワークを構築し,ロバストな特徴学習のためのグローバル特徴とローカル特徴の相互作用について述べる。
具体的には,局所的特徴学習のための決定論的情報を提供するために,非存在カテゴリに集中するためのカテゴリ認識の弱い監督を提案する。
さらに,グローバル-ローカル間だけでなくローカル-ローカル間関係も含む高次特徴相関を構築できるグローバル-ローカル間の補完情報を探索するクロスグラニュラ性アテンションモジュールを開発した。
どちらのメリットも、ネットワーク全体のパフォーマンスの向上を保証します。
2つの大規模データセット(MS-COCOとVOC 2007)に対する大規模な実験により、我々のフレームワークは最先端の手法よりも優れた性能を達成できることを示した。
関連論文リスト
- Local-Global Attention: An Adaptive Mechanism for Multi-Scale Feature Integration [0.9790236766474198]
Local-Global Attentionは、ローカルとグローバルの両方のコンテキスト機能を統合するように設計されている。
我々は、広く使われているオブジェクト検出および分類データセットのローカル・グローバル・アテンション機構を徹底的に評価した。
論文 参考訳(メタデータ) (2024-11-14T17:22:16Z) - Adaptive Global-Local Representation Learning and Selection for
Cross-Domain Facial Expression Recognition [54.334773598942775]
ドメインシフトは、クロスドメイン顔表情認識(CD-FER)において重要な課題となる
適応的グローバルローカル表現学習・選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-20T02:21:41Z) - A Task-aware Dual Similarity Network for Fine-grained Few-shot Learning [19.90385022248391]
TDSNet(Task-aware Dual similarity Network)は,グローバルな不変機能と識別的局所的詳細を探索する手法である。
TDSNetは、他の最先端アルゴリズムと比較することで、競争性能を達成する。
論文 参考訳(メタデータ) (2022-10-22T04:24:55Z) - S2RL: Do We Really Need to Perceive All States in Deep Multi-Agent
Reinforcement Learning? [26.265100805551764]
協調型マルチエージェント強化学習(MARL)は多くの実践的応用で広く利用されている。
局所観測における無関係情報を捨てるために,スパースアテンション機構を利用したスパース状態ベースMARLフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-20T07:33:40Z) - Local-Global Associative Frame Assemble in Video Re-ID [57.7470971197962]
ビデオ列から自動生成されたオブジェクト境界ボックスにおける雑音および非表現フレームは、ビデオ再識別(Re-ID)における識別表現の学習に困難をもたらす
既存の手法の多くは、局所的な部分アライメントまたはグローバルな外観相関によって、ビデオフレームの重要性を個別に評価することで、この問題に対処している。
本研究では,局所的なアライメントとグローバルな相関関係を共同で検討し,相互の促進・強化について考察する。
論文 参考訳(メタデータ) (2021-10-22T19:07:39Z) - Discriminative Region-based Multi-Label Zero-Shot Learning [145.0952336375342]
マルチラベルゼロショット学習(Multi-label zero-shot Learning、ZSL)は、標準のシングルラベルZSLのより現実的な対位法である。
本稿では,地域別識別可能性保存型ZSLに対する代替アプローチを提案する。
論文 参考訳(メタデータ) (2021-08-20T17:56:47Z) - Gait Recognition via Effective Global-Local Feature Representation and
Local Temporal Aggregation [28.721376937882958]
歩行認識は最も重要な生体計測技術の一つであり、多くの分野で応用されている。
近年の歩行認識フレームワークは、人間のグローバルな外観または地域から抽出された記述子によって各歩行フレームを表現している。
歩行認識のための識別的特徴表現を実現するための新しい特徴抽出・融合フレームワークを提案する。
論文 参考訳(メタデータ) (2020-11-03T04:07:13Z) - Inter-Image Communication for Weakly Supervised Localization [77.2171924626778]
弱教師付きローカライゼーションは、画像レベルの監督のみを使用して対象対象領域を見つけることを目的としている。
我々は,より正確な物体位置を学習するために,異なる物体間の画素レベルの類似性を活用することを提案する。
ILSVRC検証セット上でトップ1のローカライズ誤差率45.17%を達成する。
論文 参考訳(メタデータ) (2020-08-12T04:14:11Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。