論文の概要: Prototypical Model with Novel Information-theoretic Loss Function for
Generalized Zero Shot Learning
- arxiv url: http://arxiv.org/abs/2112.03134v1
- Date: Mon, 6 Dec 2021 16:01:46 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-07 14:58:43.713478
- Title: Prototypical Model with Novel Information-theoretic Loss Function for
Generalized Zero Shot Learning
- Title(参考訳): 汎用ゼロショット学習のための新しい情報理論損失関数を持つ原型モデル
- Authors: Chunlin Ji, Hanchu Shen, Zhan Xiong, Feng Chen, Meiying Zhang, Huiwen
Yang
- Abstract要約: 一般ゼロショット学習(GZSL)は、ディープラーニングの技術的課題である。
本稿では,知識伝達と意味的関係の定量化について,情報理論の観点から考察する。
決定論的GZSLモデルのための情報理論損失関数を3つ提案する。
- 参考スコア(独自算出の注目度): 3.870962269034544
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Generalized zero shot learning (GZSL) is still a technical challenge of deep
learning as it has to recognize both source and target classes without data
from target classes. To preserve the semantic relation between source and
target classes when only trained with data from source classes, we address the
quantification of the knowledge transfer and semantic relation from an
information-theoretic viewpoint. To this end, we follow the prototypical model
and format the variables of concern as a probability vector. Leveraging on the
proposed probability vector representation, the information measurement such as
mutual information and entropy, can be effectively evaluated with simple closed
forms. We discuss the choice of common embedding space and distance function
when using the prototypical model. Then We propose three information-theoretic
loss functions for deterministic GZSL model: a mutual information loss to
bridge seen data and target classes; an uncertainty-aware entropy constraint
loss to prevent overfitting when using seen data to learn the embedding of
target classes; a semantic preserving cross entropy loss to preserve the
semantic relation when mapping the semantic representations to the common
space. Simulation shows that, as a deterministic model, our proposed method
obtains state of the art results on GZSL benchmark datasets. We achieve 21%-64%
improvements over the baseline model -- deep calibration network (DCN) and for
the first time demonstrate a deterministic model can perform as well as
generative ones. Moreover, our proposed model is compatible with generative
models. Simulation studies show that by incorporating with f-CLSWGAN, we obtain
comparable results compared with advanced generative models.
- Abstract(参考訳): 汎用ゼロショット学習(GZSL)は、ターゲットクラスからのデータなしに、ソースクラスとターゲットクラスの両方を認識する必要があるため、ディープラーニングの技術的な課題である。
ソースクラスからのデータのみを訓練する場合、ソースクラスとターゲットクラスの意味関係を保つため、情報理論的な観点から、知識伝達と意味関係の定量化について論じる。
この目的のために、私たちは原型モデルに従い、関心の変数を確率ベクトルとしてフォーマットする。
提案した確率ベクトル表現を利用して、相互情報やエントロピーなどの情報測定を簡単な閉形式で効果的に評価することができる。
原型モデルを用いた場合,共通埋め込み空間と距離関数の選択について検討する。
次に,決定論的gzslモデルのための3つの情報理論的損失関数を提案する。橋渡しデータと対象クラスとの相互情報損失,参照データを用いた対象クラスの埋め込み学習時の過剰フィッティングを防止する不確実性認識エントロピー制約損失,意味表現を共通空間にマッピングする際に意味関係を保存するための意味保存クロスエントロピー損失である。
シミュレーションにより, 決定論的モデルとして, 提案手法がgzslベンチマークデータセット上での技術結果を得ることを示す。
ベースラインモデルよりも21%-64%の改善 – ディープキャリブレーションネットワーク(DCN) – を実現し,決定論的モデルが生成モデルと同等に機能できることを初めて実証した。
さらに,提案モデルは生成モデルと互換性がある。
シミュレーション研究により、f-CLSWGANを組み込むことで、先進的な生成モデルと比較した結果が得られることが示された。
関連論文リスト
- Effort: Efficient Orthogonal Modeling for Generalizable AI-Generated Image Detection [66.16595174895802]
既存のAI生成画像(AIGI)検出手法は、しばしば限定的な一般化性能に悩まされる。
本稿では、AIGI検出において、これまで見過ごされてきた重要な非対称性現象を同定する。
論文 参考訳(メタデータ) (2024-11-23T19:10:32Z) - Sub-graph Based Diffusion Model for Link Prediction [43.15741675617231]
拡散確率モデル(Denoising Diffusion Probabilistic Models, DDPM)は、例外的な品質を持つ同時代の生成モデルである。
本研究では,ベイズ式による確率推定過程を分解するために,専用設計を用いたリンク予測のための新しい生成モデルを構築した。
提案手法は,(1)再トレーニングを伴わないデータセット間の転送可能性,(2)限られたトレーニングデータに対する有望な一般化,(3)グラフ敵攻撃に対する堅牢性など,多くの利点を示す。
論文 参考訳(メタデータ) (2024-09-13T02:23:55Z) - Semi-supervised Regression Analysis with Model Misspecification and High-dimensional Data [8.619243141968886]
条件付き平均モデルにおける回帰係数を推定するための推論フレームワークを提案する。
提案手法は,正規化推定器を適応度スコア(PS)と結果回帰(OR)モデルの両方に用い,拡張逆確率重み付き(AIPW)法を開発した。
我々の理論的な知見は、広範囲なシミュレーション研究と実世界のデータ応用を通して検証される。
論文 参考訳(メタデータ) (2024-06-20T00:34:54Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Towards Better Modeling with Missing Data: A Contrastive Learning-based
Visual Analytics Perspective [7.577040836988683]
データ不足は機械学習(ML)モデリングの課題となる可能性がある。
現在のアプローチは、特徴計算とラベル予測に分類される。
本研究は、観測データに欠落した値でモデル化するコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-18T13:16:24Z) - GSMFlow: Generation Shifts Mitigating Flow for Generalized Zero-Shot
Learning [55.79997930181418]
Generalized Zero-Shot Learningは、目に見えないクラスから見えないクラスに意味的な知識を移すことで、目に見えないクラスと見えないクラスの両方から画像を認識することを目的としている。
生成モデルの利点を生かして、見学したクラスから学んだ知識に基づいて、現実的な見知らぬサンプルを幻覚させることは、有望な解決策である。
本研究では,複数の条件付きアフィン結合層からなるフローベース生成フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-05T04:04:37Z) - A Gating Model for Bias Calibration in Generalized Zero-shot Learning [18.32369721322249]
汎用ゼロショット学習(GZSL)は,補助情報のみを用いることで,見つからないクラスデータに一般化できるモデルを訓練することを目的とする。
GZSLの主な課題の1つは、トレーニング中に利用可能なクラスデータのみに過度に適合することに起因する、見かけたクラスに対するバイアス付きモデル予測である。
GZSLのための2ストリームオートエンコーダに基づくゲーティングモデルを提案する。
論文 参考訳(メタデータ) (2022-03-08T16:41:06Z) - Distributional Depth-Based Estimation of Object Articulation Models [21.046351215949525]
本研究では,奥行き画像から直接,調音モデルパラメータの分布を効率よく学習する手法を提案する。
私たちのコアコントリビューションには、剛体変換に対する分布の新しい表現が含まれています。
本稿では,カテゴリに依存しない調音モデル推定を行う新しい深層学習手法DUST-netを提案する。
論文 参考訳(メタデータ) (2021-08-12T17:44:51Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Firearm Detection via Convolutional Neural Networks: Comparing a
Semantic Segmentation Model Against End-to-End Solutions [68.8204255655161]
武器の脅威検出とライブビデオからの攻撃的な行動は、潜在的に致命的な事故の迅速検出と予防に使用できる。
これを実現する一つの方法は、人工知能と、特に画像分析のための機械学習を使用することです。
従来のモノリシックなエンド・ツー・エンドのディープラーニングモデルと、セマンティクスセグメンテーションによって火花を検知する単純なニューラルネットワークのアンサンブルに基づく前述したモデルを比較した。
論文 参考訳(メタデータ) (2020-12-17T15:19:29Z) - S^3-Rec: Self-Supervised Learning for Sequential Recommendation with
Mutual Information Maximization [104.87483578308526]
本稿では,シーケンスレコメンデーションのための自己改善学習のためのモデルS3-Recを提案する。
そこで本稿では,属性,項目,サブシーケンス,シーケンス間の相関関係を学習するために,4つの補助的自己教師対象を考案する。
6つの実世界のデータセットで実施された大規模な実験は、既存の最先端手法よりも提案手法が優れていることを示す。
論文 参考訳(メタデータ) (2020-08-18T11:44:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。