論文の概要: Attribute Localization and Revision Network for Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2310.07548v1
- Date: Wed, 11 Oct 2023 14:50:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-12 22:19:19.503097
- Title: Attribute Localization and Revision Network for Zero-Shot Learning
- Title(参考訳): ゼロショット学習のための属性ローカライゼーションとリビジョンネットワーク
- Authors: Junzhe Xu, Suling Duan, Chenwei Tang, Zhenan He, Jiancheng Lv
- Abstract要約: ゼロショット学習により、モデルは属性などの補助的な意味情報の助けを借りて、目に見えないカテゴリを認識できる。
本稿では,局所的な特徴とグローバルな特徴の選択がゼロサムゲームではなく,グローバルな特徴が属性の理解に寄与することを発見した。
- 参考スコア(独自算出の注目度): 13.530912616208722
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Zero-shot learning enables the model to recognize unseen categories with the
aid of auxiliary semantic information such as attributes. Current works
proposed to detect attributes from local image regions and align extracted
features with class-level semantics. In this paper, we find that the choice
between local and global features is not a zero-sum game, global features can
also contribute to the understanding of attributes. In addition, aligning
attribute features with class-level semantics ignores potential intra-class
attribute variation. To mitigate these disadvantages, we present Attribute
Localization and Revision Network in this paper. First, we design Attribute
Localization Module (ALM) to capture both local and global features from image
regions, a novel module called Scale Control Unit is incorporated to fuse
global and local representations. Second, we propose Attribute Revision Module
(ARM), which generates image-level semantics by revising the ground-truth value
of each attribute, compensating for performance degradation caused by ignoring
intra-class variation. Finally, the output of ALM will be aligned with revised
semantics produced by ARM to achieve the training process. Comprehensive
experimental results on three widely used benchmarks demonstrate the
effectiveness of our model in the zero-shot prediction task.
- Abstract(参考訳): ゼロショット学習により、モデルは属性などの補助的な意味情報の助けを借りて、目に見えないカテゴリを認識できる。
局所画像領域から属性を検出し,抽出した特徴をクラスレベルの意味論と整合させる作業が提案されている。
本稿では,局所的な特徴とグローバルな特徴の選択がゼロサムゲームではなく,グローバルな特徴が属性の理解に寄与することを発見した。
さらに、属性機能とクラスレベルのセマンティクスの整合は、潜在的なクラス内属性の変動を無視する。
これらの欠点を緩和するため,本稿では属性のローカライズとリビジョンネットワークを提案する。
まず,画像領域から局所的特徴と大域的特徴の両方をキャプチャするために属性局在化モジュール(alm)を設計し,グローバル表現と局所表現を融合させるためにスケール制御ユニット(scale control unit)と呼ばれる新しいモジュールを組み込んだ。
次に,各属性の基底値を変更し,クラス内変動を無視した性能低下を補償して画像レベルの意味論を生成する属性リビジョンモジュール(arm)を提案する。
最後に、ALMの出力は、トレーニングプロセスを達成するためにARMによって生成された改訂されたセマンティクスと整合する。
3つのベンチマークの総合実験結果から,ゼロショット予測タスクにおけるモデルの有効性を実証した。
関連論文リスト
- Adaptive Global-Local Representation Learning and Selection for
Cross-Domain Facial Expression Recognition [54.334773598942775]
ドメインシフトは、クロスドメイン顔表情認識(CD-FER)において重要な課題となる
適応的グローバルローカル表現学習・選択フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-20T02:21:41Z) - Dual Feature Augmentation Network for Generalized Zero-shot Learning [14.410978100610489]
ゼロショット学習 (ZSL) は,見知らぬクラスから知識を伝達することによって,サンプルを訓練せずに新しいクラスを推論することを目的としている。
ZSLの既存の埋め込みベースのアプローチは、画像上の属性を見つけるために注意機構を用いるのが一般的である。
本稿では,2つの機能拡張モジュールからなる新しいDual Feature Augmentation Network (DFAN)を提案する。
論文 参考訳(メタデータ) (2023-09-25T02:37:52Z) - Attribute Prototype Network for Any-Shot Learning [113.50220968583353]
属性ローカライズ機能を統合した画像表現は、任意のショット、すなわちゼロショットと少数ショットのイメージ分類タスクに有用である、と我々は主張する。
クラスレベルの属性のみを用いてグローバルな特徴とローカルな特徴を共同で学習する新しい表現学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-04T02:25:40Z) - Region Semantically Aligned Network for Zero-Shot Learning [18.18665627472823]
本研究では、未確認クラスの局所的特徴をそれらの意味属性にマッピングする地域意味ネットワーク(RSAN)を提案する。
出力の特定の領域から各属性を取得し、これらの属性を認識に活用する。
いくつかの標準ZSLデータセットの実験では、提案したRSAN法の利点が示され、最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-10-14T03:23:40Z) - Goal-Oriented Gaze Estimation for Zero-Shot Learning [62.52340838817908]
識別的属性の局在性を改善するために, 目標指向視線推定モジュール(GEM)を提案する。
属性記述に導かれた新しい物体を認識する視覚注意領域を得るために,実際の人間の視線位置を予測することを目的とする。
この研究は、高レベルのコンピュータビジョンタスクに人間の視線データセットと自動視線推定アルゴリズムを集めることの有望な利点を示しています。
論文 参考訳(メタデータ) (2021-03-05T02:14:57Z) - Attribute Prototype Network for Zero-Shot Learning [113.50220968583353]
差別的グローバルな特徴と局所的な特徴を共同で学習するゼロショット表現学習フレームワークを提案する。
本モデルでは,画像中の属性の視覚的証拠を指摘し,画像表現の属性ローカライゼーション能力の向上を確認した。
論文 参考訳(メタデータ) (2020-08-19T06:46:35Z) - Simple and effective localized attribute representations for zero-shot
learning [48.053204004771665]
Zero-shot Learning (ZSL) は、目に見えないクラスとイメージを区別することを目的としている。
本稿では,意味/属性空間における局所化表現を提案する。
提案手法は,ゼロショット学習のための新しいベースラインとして利用することができる。
論文 参考訳(メタデータ) (2020-06-10T16:46:12Z) - Global Context-Aware Progressive Aggregation Network for Salient Object
Detection [117.943116761278]
我々は,低レベルな外観特徴,高レベルな意味特徴,グローバルな文脈特徴を統合化するための新しいネットワークGCPANetを提案する。
提案手法は, 定量的かつ定性的に, 最先端の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-03-02T04:26:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。