論文の概要: Bidirectional Mapping Coupled GAN for Generalized Zero-Shot Learning
- arxiv url: http://arxiv.org/abs/2012.15054v2
- Date: Fri, 19 Feb 2021 08:25:09 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-18 17:01:54.689556
- Title: Bidirectional Mapping Coupled GAN for Generalized Zero-Shot Learning
- Title(参考訳): 汎用ゼロショット学習のための双方向マッピング結合型GAN
- Authors: Tasfia Shermin, Shyh Wei Teng, Ferdous Sohel, Manzur Murshed, Guojun
Lu
- Abstract要約: 双方向マッピングに基づく一般化ゼロショット学習(gzsl)手法は,参照データと未認識データを認識するための合成特徴の品質に依存する。
既知領域の合同分布を学習し,これらの手法においてドメイン識別の保持が重要である。
本研究では,可視クラスセマンティクスと可視クラスセマンティクスを併用し,強い視覚的セマンティック結合を通じて関節分布を学習する。
- 参考スコア(独自算出の注目度): 7.22073260315824
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Bidirectional mapping-based generalized zero-shot learning (GZSL) methods
rely on the quality of synthesized features to recognize seen and unseen data.
Therefore, learning a joint distribution of seen-unseen domains and preserving
domain distinction is crucial for these methods. However, existing methods only
learn the underlying distribution of seen data, although unseen class semantics
are available in the GZSL problem setting. Most methods neglect retaining
domain distinction and use the learned distribution to recognize seen and
unseen data. Consequently, they do not perform well. In this work, we utilize
the available unseen class semantics alongside seen class semantics and learn
joint distribution through a strong visual-semantic coupling. We propose a
bidirectional mapping coupled generative adversarial network (BMCoGAN) by
extending the coupled generative adversarial network into a dual-domain
learning bidirectional mapping model. We further integrate a Wasserstein
generative adversarial optimization to supervise the joint distribution
learning. We design a loss optimization for retaining domain distinctive
information in the synthesized features and reducing bias towards seen classes,
which pushes synthesized seen features towards real seen features and pulls
synthesized unseen features away from real seen features. We evaluate BMCoGAN
on benchmark datasets and demonstrate its superior performance against
contemporary methods.
- Abstract(参考訳): 双方向マッピングに基づく一般化ゼロショット学習(GZSL)手法は、合成された特徴の質に頼り、見えないデータを認識する。
したがって、見掛けのない領域の合同分布を学習し、ドメインの区別を保ち続けることが重要となる。
しかし、既存の手法は、GZSL問題設定では未確認のクラスセマンティクスが利用できるが、観測データの基盤となる分布のみを学習する。
ほとんどの手法は、ドメインの区別を無視し、学習した分布を使って、見つからないデータを認識する。
そのため、性能は良くない。
本研究は,見知らぬクラスセマンティクスとともに利用可能なクラスセマンティクスを利用し,強い視覚・意味的結合を通して共同分布を学習する。
本稿では,2分野の学習双方向マッピングモデルに結合した生成逆数ネットワークを拡張して,双方向マッピング結合生成逆数ネットワーク(BMCoGAN)を提案する。
さらに,wasserstein生成敵最適化を統合し,共同分布学習を監督する。
我々は、合成された特徴にドメイン固有の情報を保持し、合成された特徴を実際の特徴へプッシュし、合成されていない特徴を実際の特徴から引き離すような損失最適化を設計する。
ベンチマークデータセット上でBMCoGANを評価し,現代の手法と比較して優れた性能を示す。
関連論文リスト
- Dual Relation Mining Network for Zero-Shot Learning [48.89161627050706]
本稿では,効果的な視覚・意味的相互作用を実現し,知識伝達のための属性間の意味的関係を学習するためのDual Relation Mining Network(DRMN)を提案する。
具体的には,多層的特徴融合により視覚情報を強化する視覚・意味的関係マイニングのためのデュアルアテンションブロック(DAB)を提案する。
セマンティック・インタラクション・トランスフォーマ(SIT)を用いて画像間の属性表現の一般化を促進する。
論文 参考訳(メタデータ) (2024-05-06T16:31:19Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z) - Interpolation-based Correlation Reduction Network for Semi-Supervised
Graph Learning [49.94816548023729]
補間型相関低減ネットワーク(ICRN)と呼ばれる新しいグラフコントラスト学習手法を提案する。
提案手法では,決定境界のマージンを大きくすることで,潜在特徴の識別能力を向上させる。
この2つの設定を組み合わせることで、豊富なラベル付きノードと稀に価値あるラベル付きノードから豊富な監視情報を抽出し、離散表現学習を行う。
論文 参考訳(メタデータ) (2022-06-06T14:26:34Z) - Voxel-wise Adversarial Semi-supervised Learning for Medical Image
Segmentation [4.489713477369384]
医用画像セグメンテーションのための新しい対向学習に基づく半教師付きセグメンテーション手法を提案する。
本手法では,複数の階層から局所的特徴とグローバルな特徴を埋め込んで,複数のクラス間のコンテキスト関係を学習する。
左心房(シングルクラス)とマルチオーガニックデータセット(マルチクラス)のイメージセグメンテーションにおける、最先端の半教師あり学習手法よりも優れています。
論文 参考訳(メタデータ) (2022-05-14T06:57:19Z) - Semi-supervised Domain Adaptive Structure Learning [72.01544419893628]
半教師付きドメイン適応 (SSDA) は,1) アノテーションの低いデータに過度に適合する手法と,2) ドメイン間の分散シフトの両方を克服しなければならない課題である。
SSLとDAの協調を正規化するための適応型構造学習手法を提案する。
論文 参考訳(メタデータ) (2021-12-12T06:11:16Z) - HSVA: Hierarchical Semantic-Visual Adaptation for Zero-Shot Learning [74.76431541169342]
ゼロショット学習(ZSL)は、目に見えないクラス認識の問題に取り組み、目に見えないクラスから目に見えないクラスに意味的な知識を移す。
本稿では,意味領域と視覚領域を協調させる新しい階層型意味視覚適応(HSVA)フレームワークを提案する。
4つのベンチマークデータセットの実験では、HSVAは従来のZSLと一般的なZSLの両方で優れた性能を示す。
論文 参考訳(メタデータ) (2021-09-30T14:27:50Z) - An Integrated Attribute Guided Dense Attention Model for Fine-Grained
Generalized Zero-Shot Learning [7.22073260315824]
組み込み学習(EL)と機能合成(FS)は、細かい粒度のGZSLメソッドの一般的なカテゴリの2つです。
ELとFSの両カテゴリのグローバルおよび直接属性管理された局所視覚機能について検討する。
提案手法がベンチマークデータセットの現代手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-12-31T21:38:46Z) - Adversarial Bipartite Graph Learning for Video Domain Adaptation [50.68420708387015]
ドメイン適応技術は,異なる領域間のモデルを適応させることに重点を置いているが,ビデオ認識領域ではめったに研究されていない。
近年,映像のソースと対象映像の表現を統一するために,対角学習を活用する視覚領域適応はビデオにはあまり効果がない。
本稿では,ソースとターゲットの相互作用を直接モデル化するAdversarial Bipartite Graph (ABG)学習フレームワークを提案する。
論文 参考訳(メタデータ) (2020-07-31T03:48:41Z) - Two-Level Adversarial Visual-Semantic Coupling for Generalized Zero-shot
Learning [21.89909688056478]
トレーニング中に推論ネットワークを用いて生成ネットワークを増強する2段階のジョイントアイデアを提案する。
これにより、ビジュアルドメインとセマンティックドメイン間の効果的な知識伝達のための強力な相互モーダル相互作用が提供される。
提案手法は,4つのベンチマークデータセットに対して,いくつかの最先端手法に対して評価し,その性能を示す。
論文 参考訳(メタデータ) (2020-07-15T15:34:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。