論文の概要: Metric Learning for Projections Bias of Generalized Zero-shot Learning
- arxiv url: http://arxiv.org/abs/2309.01390v1
- Date: Mon, 4 Sep 2023 06:41:29 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-06 19:43:26.598909
- Title: Metric Learning for Projections Bias of Generalized Zero-shot Learning
- Title(参考訳): 一般化ゼロショット学習における投影バイアスの計量学習
- Authors: Chong Zhang, Mingyu Jin, Qinkai Yu, Haochen Xue, Xiaobo Jin
- Abstract要約: 汎用ゼロショット学習モデル (GZSL) は、見知らぬクラスのサンプルのみをトレーニングデータとして認識することを目的としている。
最適化されたマハラノビス距離表現の学習を支援するために、2つの枝を持つ新たな損失関数を提案する。
- 参考スコア(独自算出の注目度): 7.020870744580684
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Generalized zero-shot learning models (GZSL) aim to recognize samples from
seen or unseen classes using only samples from seen classes as training data.
During inference, GZSL methods are often biased towards seen classes due to the
visibility of seen class samples during training. Most current GZSL methods try
to learn an accurate projection function (from visual space to semantic space)
to avoid bias and ensure the effectiveness of GZSL methods. However, during
inference, the computation of distance will be important when we classify the
projection of any sample into its nearest class since we may learn a biased
projection function in the model. In our work, we attempt to learn a
parameterized Mahalanobis distance within the framework of VAEGAN (Variational
Autoencoder \& Generative Adversarial Networks), where the weight matrix
depends on the network's output. In particular, we improved the network
structure of VAEGAN to leverage the discriminative models of two branches to
separately predict the seen samples and the unseen samples generated by this
seen one. We proposed a new loss function with two branches to help us learn
the optimized Mahalanobis distance representation. Comprehensive evaluation
benchmarks on four datasets demonstrate the superiority of our method over the
state-of-the-art counterparts. Our codes are available at
https://anonymous.4open.science/r/111hxr.
- Abstract(参考訳): 汎用ゼロショット学習モデル (GZSL) は、見知らぬクラスのサンプルのみをトレーニングデータとして認識することを目的としている。
推論中、GZSLメソッドは、トレーニング中に見られるクラスサンプルの可視性のために、しばしば見かけたクラスに偏っている。
現在のほとんどのGZSL法は、バイアスを回避し、GZSL法の有効性を確保するために、正確な投影関数(視覚空間から意味空間まで)を学習しようとする。
しかしながら、推論の間、モデル内のバイアス付き投影関数を学ぶことができるため、任意のサンプルの投影を最も近いクラスに分類する場合、距離の計算が重要となる。
本研究では,重み行列がネットワークの出力に依存するVAEGAN(Variational Autoencoder \& Generative Adversarial Networks)のフレームワーク内で,パラメータ化されたマハラノビス距離を学習しようとする。
特に,vaeganのネットワーク構造を改良し,二つの枝の識別モデルを用いて,観察したサンプルと得られた未検出サンプルを別々に予測した。
最適化されたマハラノビス距離表現を学習するために、2つの分岐を持つ新しい損失関数を提案した。
4つのデータセットに対する総合的な評価ベンチマークは、最先端のデータセットよりも優れた方法を示している。
私たちのコードはhttps://anonymous.4open.science/r/111hxrで利用可能です。
関連論文リスト
- SIGMA:Sinkhorn-Guided Masked Video Modeling [69.31715194419091]
SIGMA (Sinkhorn-guided Masked Video Modelling) は、新しいビデオ事前学習法である。
時空管の特徴を,限られた数の学習可能なクラスタに均等に分散する。
10個のデータセットによる実験結果から,より高性能で時間的,堅牢な映像表現を学習する上で,SIGMAの有効性が検証された。
論文 参考訳(メタデータ) (2024-07-22T08:04:09Z) - Class-Imbalanced Semi-Supervised Learning for Large-Scale Point Cloud
Semantic Segmentation via Decoupling Optimization [64.36097398869774]
半教師付き学習(SSL)は大規模3Dシーン理解のための活発な研究課題である。
既存のSSLベースのメソッドは、クラス不均衡とポイントクラウドデータのロングテール分布による厳しいトレーニングバイアスに悩まされている。
本稿では,特徴表現学習と分類器を別の最適化方法で切り離してバイアス決定境界を効果的にシフトする,新しいデカップリング最適化フレームワークを提案する。
論文 参考訳(メタデータ) (2024-01-13T04:16:40Z) - Revealing the Proximate Long-Tail Distribution in Compositional
Zero-Shot Learning [20.837664254230567]
合成ゼロショット学習(CZSL)は、目に見える状態オブジェクト対から新しいペアへ知識を伝達することを目的としている。
状態オブジェクトの組み合わせの予測によって引き起こされる視覚バイアスは、識別可能なクラスプロトタイプの学習を妨げる視覚的特徴を曖昧にする。
CZSLの長尾分布におけるクラスの役割を数学的に推定する。
この知見に基づいて, 合成による視覚的偏見を分類器の訓練と推定に組み入れ, 事前の近似クラスとして推定する。
論文 参考訳(メタデータ) (2023-12-26T07:35:02Z) - Prompt Tuning Pushes Farther, Contrastive Learning Pulls Closer: A
Two-Stage Approach to Mitigate Social Biases [13.837927115198308]
本稿では,コントラスト学習と連続的プロンプト拡張を用いた逆トレーニングによる2段階脱バイアスモデルを提案する。
我々のアプローチは、トレーニングプロセスに困難を加えることで、より強固なデバイアス性能を達成するためのモデルを導出します。
論文 参考訳(メタデータ) (2023-07-04T09:35:03Z) - Federated Zero-Shot Learning for Visual Recognition [55.65879596326147]
本稿では,Federated Zero-Shot Learning FedZSLフレームワークを提案する。
FedZSLは、エッジデバイス上の分散データから中心的なモデルを学ぶ。
FedZSLの有効性と堅牢性は、3つのゼロショットベンチマークデータセットで実施された広範な実験によって実証された。
論文 参考訳(メタデータ) (2022-09-05T14:49:34Z) - Towards Unbiased Label Distribution Learning for Facial Pose Estimation
Using Anisotropic Spherical Gaussian [8.597165738132617]
Anisotropic Spherical Gaussian (ASG)-based LDL approach for face pose Estimationを提案する。
特に、我々のアプローチでは、不偏期待を常に生成する単位球面上の球面ガウス分布を採用する。
提案手法は, AFLW2000 と BIWI のデータセットに新たな最先端記録を設定する。
論文 参考訳(メタデータ) (2022-08-19T02:12:36Z) - A Gating Model for Bias Calibration in Generalized Zero-shot Learning [18.32369721322249]
汎用ゼロショット学習(GZSL)は,補助情報のみを用いることで,見つからないクラスデータに一般化できるモデルを訓練することを目的とする。
GZSLの主な課題の1つは、トレーニング中に利用可能なクラスデータのみに過度に適合することに起因する、見かけたクラスに対するバイアス付きモデル予測である。
GZSLのための2ストリームオートエンコーダに基づくゲーティングモデルを提案する。
論文 参考訳(メタデータ) (2022-03-08T16:41:06Z) - Doubly Contrastive Deep Clustering [135.7001508427597]
本稿では、サンプルビューとクラスビューの両方でコントラスト損失を構築する新しい二重コントラストディープクラスタリング(DCDC)フレームワークを紹介します。
具体的には、サンプルビューに対して、元のサンプルとその拡張バージョンのクラス分布を正のサンプルペアとして設定する。
クラスビューでは、クラスのサンプル分布から正のペアと負のペアを構築します。
このように、2つのコントラスト損失は、サンプルとクラスレベルでのミニバッチサンプルのクラスタリング結果をうまく制限します。
論文 参考訳(メタデータ) (2021-03-09T15:15:32Z) - Entropy-Based Uncertainty Calibration for Generalized Zero-Shot Learning [49.04790688256481]
一般化ゼロショット学習(GZSL)の目的は、目に見えないクラスと見えないクラスの両方を認識することである。
ほとんどのGZSLメソッドは、通常、見えないクラスの意味情報から視覚表現を合成することを学ぶ。
本論文では,三重項損失を持つ2重変分オートエンコーダを利用する新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2021-01-09T05:21:27Z) - Information Bottleneck Constrained Latent Bidirectional Embedding for
Zero-Shot Learning [59.58381904522967]
本稿では,密な視覚-意味的結合制約を持つ埋め込み型生成モデルを提案する。
視覚空間と意味空間の両方の埋め込みパラメトリック分布を校正する統合潜在空間を学習する。
本手法は, 画像のラベルを生成することにより, トランスダクティブZSL設定に容易に拡張できる。
論文 参考訳(メタデータ) (2020-09-16T03:54:12Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。