論文の概要: A Discriminative Bayesian Gaussian Process Latent Variable Model for
High-Dimensional Data
- arxiv url: http://arxiv.org/abs/2401.16497v1
- Date: Mon, 29 Jan 2024 19:11:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 17:14:53.647625
- Title: A Discriminative Bayesian Gaussian Process Latent Variable Model for
High-Dimensional Data
- Title(参考訳): 高次元データに対する識別的ベイズガウス過程潜時変動モデル
- Authors: Navid Ziaei, Behzad Nazari, Ali Yousefi
- Abstract要約: ガウス過程(GP)を利用して高次元データを特徴付ける新しい非パラメトリックモデリング手法を提案する。
このモデルはLDGD(Latent Discrimi Generative Decoder)と呼ばれ、多様体発見プロセスにおいてデータ(またはその特徴)と関連するラベル(カテゴリや刺激など)の両方を利用する。
LDGDはその多様体を正確に推定するだけでなく、予測ラベルの予測精度は最先端のアプローチを上回る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting meaningful information from high-dimensional data poses a
formidable modeling challenge, particularly when the data is obscured by noise
or represented through different modalities. In this research, we propose a
novel non-parametric modeling approach, leveraging the Gaussian Process (GP),
to characterize high-dimensional data by mapping it to a latent low-dimensional
manifold. This model, named the Latent Discriminative Generative Decoder
(LDGD), utilizes both the data (or its features) and associated labels (such as
category or stimulus) in the manifold discovery process. To infer the latent
variables, we derive a Bayesian solution, allowing LDGD to effectively capture
inherent uncertainties in the data while enhancing the model's predictive
accuracy and robustness. We demonstrate the application of LDGD on both
synthetic and benchmark datasets. Not only does LDGD infer the manifold
accurately, but its prediction accuracy in anticipating labels surpasses
state-of-the-art approaches. We have introduced inducing points to reduce the
computational complexity of Gaussian Processes (GPs) for large datasets. This
enhancement facilitates batch training, allowing for more efficient processing
and scalability in handling extensive data collections. Additionally, we
illustrate that LDGD achieves higher accuracy in predicting labels and operates
effectively with a limited training dataset, underscoring its efficiency and
effectiveness in scenarios where data availability is constrained. These
attributes set the stage for the development of non-parametric modeling
approaches in the analysis of high-dimensional data; especially in fields where
data are both high-dimensional and complex.
- Abstract(参考訳): 高次元データから有意義な情報を抽出することは、特にデータがノイズによって隠されたり、異なるモダリティによって表現された場合、非常に難しいモデリング課題となる。
本研究では,ガウス過程(gp)を応用し,高次元データを潜在低次元多様体にマッピングすることで特徴付ける,新しい非パラメトリックモデリング手法を提案する。
このモデルはLDGD(Latent Disriminative Generative Decoder)と呼ばれ、多様体発見プロセスにおいてデータ(またはその特徴)と関連するラベル(カテゴリや刺激など)の両方を利用する。
潜在変数を推定するためにベイズ解を導出し、ldgdはモデルの予測精度とロバスト性を高めつつ、データの固有の不確かさを効果的に捉えることができる。
合成データセットとベンチマークデータセットの両方にLDGDを適用することを実証する。
LDGDはその多様体を正確に推定するだけでなく、予測ラベルの予測精度は最先端のアプローチを上回る。
我々は,大規模データセットに対するガウス過程(GP)の計算複雑性を低減するための点の導入を行った。
この拡張により、バッチトレーニングが容易になり、広範なデータコレクションを処理する際の処理とスケーラビリティが向上する。
さらに, ldgdはラベル予測において高い精度を達成し, 限られたトレーニングデータセットで効率的に動作し, データの可用性が制約されるシナリオにおいてその効率と有効性を強調する。
これらの属性は、高次元データの解析において、特にデータが高次元と複素の両方である分野において、非パラメトリックモデリングアプローチの開発の舞台となった。
関連論文リスト
- LESS: Selecting Influential Data for Targeted Instruction Tuning [69.50855460630105]
本稿では,データの影響を推定し,命令データ選択のための低ランクグレーディエント類似度探索を行うアルゴリズムであるLESSを提案する。
LESS選択したデータの5%のトレーニングは、さまざまなダウンストリームタスクにわたる完全なデータセットでのトレーニングよりも優れています。
我々の方法は、意図した下流アプリケーションに必要な推論スキルを識別するために、表面的なフォームキューを超えています。
論文 参考訳(メタデータ) (2024-02-06T19:18:04Z) - Importance-Aware Adaptive Dataset Distillation [53.79746115426363]
ディープラーニングモデルの開発は、大規模データセットの可用性によって実現されている。
データセットの蒸留は、大きな元のデータセットから必須情報を保持するコンパクトなデータセットを合成することを目的としている。
本稿では, 蒸留性能を向上する重要適応型データセット蒸留(IADD)法を提案する。
論文 参考訳(メタデータ) (2024-01-29T03:29:39Z) - Deep Generative Modeling-based Data Augmentation with Demonstration
using the BFBT Benchmark Void Fraction Datasets [3.341975883864341]
本稿では、画像データ生成に広く用いられている深部生成モデル(DGM)の科学的データ拡張への応用について検討する。
トレーニングが完了すると、DGMはトレーニングデータに類似した合成データを生成し、データセットのサイズを大幅に拡大するために使用することができる。
論文 参考訳(メタデータ) (2023-08-19T22:19:41Z) - Improved Distribution Matching for Dataset Condensation [91.55972945798531]
本稿では,分布マッチングに基づく新しいデータセット凝縮法を提案する。
提案手法は,計算資源の少ない従来の最適化指向手法よりも優れている。
論文 参考訳(メタデータ) (2023-07-19T04:07:33Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Targeted Analysis of High-Risk States Using an Oriented Variational
Autoencoder [3.494548275937873]
可変オートエンコーダ(VAE)ニューラルネットワークは、電力系統状態を生成するために訓練することができる。
VAEの潜在空間符号の座標は、データの概念的特徴と相関することが示されている。
本稿では、遅延空間コードと生成されたデータとのリンクを制限するために、指向性変動オートエンコーダ(OVAE)を提案する。
論文 参考訳(メタデータ) (2023-03-20T19:34:21Z) - Minimizing the Accumulated Trajectory Error to Improve Dataset
Distillation [151.70234052015948]
本稿では,フラットな軌道を求める最適化アルゴリズムを提案する。
合成データに基づいてトレーニングされた重みは、平坦な軌道への正規化を伴う累積誤差摂動に対して頑健であることを示す。
本手法はFTD (Flat Trajectory Distillation) と呼ばれ, 勾配整合法の性能を最大4.7%向上させる。
論文 参考訳(メタデータ) (2022-11-20T15:49:11Z) - RENs: Relevance Encoding Networks [0.0]
本稿では,遅延空間に先行する自動相対性決定(ARD)を用いて,データ固有のボトルネック次元を学習する新しい確率的VOEベースのフレームワークであるrelevance encoding network (RENs)を提案する。
提案モデルは,サンプルの表現や生成品質を損なうことなく,関連性のあるボトルネック次元を学習することを示す。
論文 参考訳(メタデータ) (2022-05-25T21:53:48Z) - Scalable Regularised Joint Mixture Models [2.0686407686198263]
多くの応用において、データは異なる基底分布を持つ潜在群にまたがるという意味で不均一である。
我々は,(i)明示的多変量特徴分布,(ii)高次元回帰モデル,(iii)潜在群ラベルの連成学習を可能にする異種データに対するアプローチを提案する。
このアプローチは明らかに高次元において有効であり、計算効率のためのデータ削減と、特徴数が大きければ鍵信号を保持する再重み付けスキームを組み合わせる。
論文 参考訳(メタデータ) (2022-05-03T13:38:58Z) - PCENet: High Dimensional Surrogate Modeling for Learning Uncertainty [15.781915567005251]
本稿では,表現学習と不確実性定量化のための新しい代理モデルを提案する。
提案モデルでは、(潜在的に高次元の)データの次元的低減のためのニューラルネットワークアプローチと、データ分布を学習するための代理モデル手法を組み合わせる。
我々のモデルは,データの表現を学習し,(a)高次元データシステムにおける不確実性を推定し,(c)出力分布の高次モーメントを一致させることができる。
論文 参考訳(メタデータ) (2022-02-10T14:42:51Z) - Incorporating Causal Graphical Prior Knowledge into Predictive Modeling
via Simple Data Augmentation [92.96204497841032]
因果グラフ(CG)は、データ分散の背後にあるデータ生成プロセスの知識のコンパクトな表現である。
本研究では,条件付き独立性(CI)関係の事前知識を活用可能なモデルに依存しないデータ拡張手法を提案する。
本手法は,小データシステムにおける予測精度の向上に有効であることを実験的に示した。
論文 参考訳(メタデータ) (2021-02-27T06:13:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。