論文の概要: Structure-Aware Feature Generation for Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2108.07032v1
- Date: Mon, 16 Aug 2021 11:52:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-17 15:00:15.244757
- Title: Structure-Aware Feature Generation for Zero-Shot Learning
- Title(参考訳): ゼロショット学習のための構造認識特徴生成
- Authors: Lianbo Zhang, Shaoli Huang, Xinchao Wang, Wei Liu, Dacheng Tao
- Abstract要約: 潜在空間と生成ネットワークの両方を学習する際の位相構造を考慮し,SA-GANと呼ばれる新しい構造認識特徴生成手法を提案する。
本手法は,未確認クラスの一般化能力を大幅に向上させ,分類性能を向上させる。
- 参考スコア(独自算出の注目度): 108.76968151682621
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Zero-Shot Learning (ZSL) targets at recognizing unseen categories by
leveraging auxiliary information, such as attribute embedding. Despite the
encouraging results achieved, prior ZSL approaches focus on improving the
discriminant power of seen-class features, yet have largely overlooked the
geometric structure of the samples and the prototypes. The subsequent
attribute-based generative adversarial network (GAN), as a result, also
neglects the topological information in sample generation and further yields
inferior performances in classifying the visual features of unseen classes. In
this paper, we introduce a novel structure-aware feature generation scheme,
termed as SA-GAN, to explicitly account for the topological structure in
learning both the latent space and the generative networks. Specifically, we
introduce a constraint loss to preserve the initial geometric structure when
learning a discriminative latent space, and carry out our GAN training with
additional supervising signals from a structure-aware discriminator and a
reconstruction module. The former supervision distinguishes fake and real
samples based on their affinity to class prototypes, while the latter aims to
reconstruct the original feature space from the generated latent space. This
topology-preserving mechanism enables our method to significantly enhance the
generalization capability on unseen-classes and consequently improve the
classification performance. Experiments on four benchmarks demonstrate that the
proposed approach consistently outperforms the state of the art. Our code can
be found in the supplementary material and will also be made publicly
available.
- Abstract(参考訳): zero-shot learning (zsl) は属性埋め込みなどの補助情報を活用することで、見当たらないカテゴリの認識を目標としている。
奨励的な結果が得られたにも拘わらず、以前のZSLアプローチは目に見える特徴の識別能力の改善に重点を置いていたが、サンプルとプロトタイプの幾何学的構造をほとんど見落としていた。
その後の属性ベース生成対数ネットワーク(GAN)は、サンプル生成におけるトポロジ情報を無視し、また、見知らぬクラスの視覚的特徴の分類において、劣る性能を得る。
本稿では,SA-GANと呼ばれる新しい構造認識特徴生成手法を導入し,潜在空間と生成ネットワークの両方を学習する際のトポロジ的構造を明示的に説明する。
具体的には、識別的潜在空間を学習する際に初期幾何構造を保存するための制約損失を導入し、構造認識型判別器と再構成モジュールから追加の教師あり信号を含むgan訓練を行う。
前者は偽のサンプルと実際のサンプルをクラスプロトタイプとの親和性に基づいて区別し、後者は生成された潜在空間から元の特徴空間を再構築することを目指している。
このトポロジー保存機構により,unseenクラスの一般化能力が大幅に向上し,分類性能が向上する。
4つのベンチマークによる実験は、提案手法が一貫して最先端技術を上回ることを示している。
私たちのコードは補足資料に載っており、公開も予定しています。
関連論文リスト
- A Bayesian Unification of Self-Supervised Clustering and Energy-Based
Models [11.007541337967027]
我々は、最先端の自己教師型学習目標のベイズ分析を行う。
目的関数が既存の自己教師型学習戦略より優れていることを示す。
また、GEDIをニューロシンボリックな枠組みに統合できることを実証した。
論文 参考訳(メタデータ) (2023-12-30T04:46:16Z) - Instance Adaptive Prototypical Contrastive Embedding for Generalized
Zero Shot Learning [11.720039414872296]
一般的なゼロショット学習は、トレーニング中に目に見えないラベルがアクセスできないと仮定して、目に見えないラベルと見えないラベルからサンプルを分類することを目的としている。
GZSLの最近の進歩は、生成ネットワークにコントラッシブラーニングベースの埋め込みを組み込むことによって、加速している。
論文 参考訳(メタデータ) (2023-09-13T14:26:03Z) - Feature construction using explanations of individual predictions [0.0]
本稿では,予測モデルのインスタンスベース説明の集約に基づく探索空間の削減手法を提案する。
これらのグループに対する探索の削減が特徴構築の時間を大幅に短縮することを実証的に示す。
いくつかの分類器の分類精度を大幅に向上させ,大規模データセットにおいても提案する特徴構築の実現可能性を示した。
論文 参考訳(メタデータ) (2023-01-23T18:59:01Z) - Class-Specific Semantic Reconstruction for Open Set Recognition [101.24781422480406]
オープンセット認識により、ディープニューラルネットワーク(DNN)は未知のクラスのサンプルを識別できる。
本稿では,自動エンコーダ(AE)とプロトタイプ学習を統合したCSSR(Class-Specific Semantic Reconstruction)を提案する。
複数のデータセットで実験を行った結果,提案手法は閉集合認識と開集合認識の両方において優れた性能を発揮することがわかった。
論文 参考訳(メタデータ) (2022-07-05T16:25:34Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z) - Self-Supervised Class Incremental Learning [51.62542103481908]
既存のクラスインクリメンタルラーニング(CIL)手法は、データラベルに敏感な教師付き分類フレームワークに基づいている。
新しいクラスデータに基づいて更新する場合、それらは破滅的な忘れがちである。
本稿では,SSCILにおける自己指導型表現学習のパフォーマンスを初めて考察する。
論文 参考訳(メタデータ) (2021-11-18T06:58:19Z) - Unveiling the Potential of Structure-Preserving for Weakly Supervised
Object Localization [71.79436685992128]
本稿では,WSOLの畳み込み機能に組み込まれた構造情報を完全に活用するための2段階構造保存アクティベーション(SPA)を提案する。
第1段階では、分類ネットワークによって引き起こされる構造ミス問題を軽減するために制限アクティベーションモジュール(ram)が設計されている。
第2段階では, 自己相関マップ生成(SCG)モジュールと呼ばれるプロセス後アプローチを提案し, 構造保存ローカライゼーションマップを得る。
論文 参考訳(メタデータ) (2021-03-08T03:04:14Z) - Closed-Form Factorization of Latent Semantics in GANs [65.42778970898534]
画像合成のために訓練されたGAN(Generative Adversarial Networks)の潜在空間に、解釈可能な次元の豊富なセットが出現することが示されている。
本研究では,GANが学習した内部表現について検討し,その基礎となる変動要因を教師なしで明らかにする。
本稿では,事前学習した重みを直接分解することで,潜在意味発見のためのクローズドフォーム因数分解アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-07-13T18:05:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。