論文の概要: A Discriminative Bayesian Gaussian Process Latent Variable Model for
High-Dimensional Data
- arxiv url: http://arxiv.org/abs/2401.16497v1
- Date: Mon, 29 Jan 2024 19:11:03 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-31 17:14:53.647625
- Title: A Discriminative Bayesian Gaussian Process Latent Variable Model for
High-Dimensional Data
- Title(参考訳): 高次元データに対する識別的ベイズガウス過程潜時変動モデル
- Authors: Navid Ziaei, Behzad Nazari, Ali Yousefi
- Abstract要約: ガウス過程(GP)を利用して高次元データを特徴付ける新しい非パラメトリックモデリング手法を提案する。
このモデルはLDGD(Latent Discrimi Generative Decoder)と呼ばれ、多様体発見プロセスにおいてデータ(またはその特徴)と関連するラベル(カテゴリや刺激など)の両方を利用する。
LDGDはその多様体を正確に推定するだけでなく、予測ラベルの予測精度は最先端のアプローチを上回る。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting meaningful information from high-dimensional data poses a
formidable modeling challenge, particularly when the data is obscured by noise
or represented through different modalities. In this research, we propose a
novel non-parametric modeling approach, leveraging the Gaussian Process (GP),
to characterize high-dimensional data by mapping it to a latent low-dimensional
manifold. This model, named the Latent Discriminative Generative Decoder
(LDGD), utilizes both the data (or its features) and associated labels (such as
category or stimulus) in the manifold discovery process. To infer the latent
variables, we derive a Bayesian solution, allowing LDGD to effectively capture
inherent uncertainties in the data while enhancing the model's predictive
accuracy and robustness. We demonstrate the application of LDGD on both
synthetic and benchmark datasets. Not only does LDGD infer the manifold
accurately, but its prediction accuracy in anticipating labels surpasses
state-of-the-art approaches. We have introduced inducing points to reduce the
computational complexity of Gaussian Processes (GPs) for large datasets. This
enhancement facilitates batch training, allowing for more efficient processing
and scalability in handling extensive data collections. Additionally, we
illustrate that LDGD achieves higher accuracy in predicting labels and operates
effectively with a limited training dataset, underscoring its efficiency and
effectiveness in scenarios where data availability is constrained. These
attributes set the stage for the development of non-parametric modeling
approaches in the analysis of high-dimensional data; especially in fields where
data are both high-dimensional and complex.
- Abstract(参考訳): 高次元データから有意義な情報を抽出することは、特にデータがノイズによって隠されたり、異なるモダリティによって表現された場合、非常に難しいモデリング課題となる。
本研究では,ガウス過程(gp)を応用し,高次元データを潜在低次元多様体にマッピングすることで特徴付ける,新しい非パラメトリックモデリング手法を提案する。
このモデルはLDGD(Latent Disriminative Generative Decoder)と呼ばれ、多様体発見プロセスにおいてデータ(またはその特徴)と関連するラベル(カテゴリや刺激など)の両方を利用する。
潜在変数を推定するためにベイズ解を導出し、ldgdはモデルの予測精度とロバスト性を高めつつ、データの固有の不確かさを効果的に捉えることができる。
合成データセットとベンチマークデータセットの両方にLDGDを適用することを実証する。
LDGDはその多様体を正確に推定するだけでなく、予測ラベルの予測精度は最先端のアプローチを上回る。
我々は,大規模データセットに対するガウス過程(GP)の計算複雑性を低減するための点の導入を行った。
この拡張により、バッチトレーニングが容易になり、広範なデータコレクションを処理する際の処理とスケーラビリティが向上する。
さらに, ldgdはラベル予測において高い精度を達成し, 限られたトレーニングデータセットで効率的に動作し, データの可用性が制約されるシナリオにおいてその効率と有効性を強調する。
これらの属性は、高次元データの解析において、特にデータが高次元と複素の両方である分野において、非パラメトリックモデリングアプローチの開発の舞台となった。
関連論文リスト
- ADLDA: A Method to Reduce the Harm of Data Distribution Shift in Data Augmentation [11.887799310374174]
本研究では,データ分散シフトの負の影響を軽減することを目的とした新しいデータ拡張手法であるADLDAを紹介する。
実験により、ADLDAは複数のデータセットにわたるモデル性能を著しく向上させることが示された。
論文 参考訳(メタデータ) (2024-05-11T03:20:35Z) - Domain-Transferred Synthetic Data Generation for Improving Monocular Depth Estimation [9.812476193015488]
本稿では,3次元合成環境とCycleGANドメイン転送を用いたシミュレーションデータ生成手法を提案する。
本研究では,DenseDepth構造に基づく深度推定モデルを実データと模擬データの異なるトレーニングセットを用いて学習することにより,このデータ生成手法を,人気のNYUDepth V2データセットと比較する。
本稿では,Huskyロボットによる新たに収集した画像とLiDAR深度データを用いたモデルの性能評価を行い,GAN変換データを実世界のデータ,特に深度推定の有効な代替手段として有効であることを示す。
論文 参考訳(メタデータ) (2024-05-02T09:21:10Z) - Distribution-Aware Data Expansion with Diffusion Models [55.979857976023695]
本研究では,分散型拡散モデルに基づくトレーニングフリーなデータ拡張フレームワークであるDistDiffを提案する。
DistDiffは、オリジナルデータのみにトレーニングされたモデルと比較して、さまざまなデータセットの精度を一貫して向上させる。
論文 参考訳(メタデータ) (2024-03-11T14:07:53Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Importance-Aware Adaptive Dataset Distillation [53.79746115426363]
ディープラーニングモデルの開発は、大規模データセットの可用性によって実現されている。
データセットの蒸留は、大きな元のデータセットから必須情報を保持するコンパクトなデータセットを合成することを目的としている。
本稿では, 蒸留性能を向上する重要適応型データセット蒸留(IADD)法を提案する。
論文 参考訳(メタデータ) (2024-01-29T03:29:39Z) - LD-GAN: Low-Dimensional Generative Adversarial Network for Spectral
Image Generation with Variance Regularization [72.4394510913927]
ディープラーニング法はスペクトル画像(SI)計算タスクの最先端技術である。
GANは、データ分散から学習およびサンプリングすることで、多様な拡張を可能にする。
この種のデータの高次元性は、GANトレーニングの収束を妨げるため、GANベースのSI生成は困難である。
本稿では, オートエンコーダ訓練における低次元表現分散を制御し, GANで生成されたサンプルの多様性を高めるための統計正則化を提案する。
論文 参考訳(メタデータ) (2023-04-29T00:25:02Z) - VTAE: Variational Transformer Autoencoder with Manifolds Learning [144.0546653941249]
深層生成モデルは、多くの潜伏変数を通して非線形データ分布の学習に成功している。
ジェネレータの非線形性は、潜在空間がデータ空間の不満足な射影を示し、表現学習が不十分になることを意味する。
本研究では、測地学と正確な計算により、深部生成モデルの性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2023-04-03T13:13:19Z) - Minimizing the Accumulated Trajectory Error to Improve Dataset
Distillation [151.70234052015948]
本稿では,フラットな軌道を求める最適化アルゴリズムを提案する。
合成データに基づいてトレーニングされた重みは、平坦な軌道への正規化を伴う累積誤差摂動に対して頑健であることを示す。
本手法はFTD (Flat Trajectory Distillation) と呼ばれ, 勾配整合法の性能を最大4.7%向上させる。
論文 参考訳(メタデータ) (2022-11-20T15:49:11Z) - RENs: Relevance Encoding Networks [0.0]
本稿では,遅延空間に先行する自動相対性決定(ARD)を用いて,データ固有のボトルネック次元を学習する新しい確率的VOEベースのフレームワークであるrelevance encoding network (RENs)を提案する。
提案モデルは,サンプルの表現や生成品質を損なうことなく,関連性のあるボトルネック次元を学習することを示す。
論文 参考訳(メタデータ) (2022-05-25T21:53:48Z) - PCENet: High Dimensional Surrogate Modeling for Learning Uncertainty [15.781915567005251]
本稿では,表現学習と不確実性定量化のための新しい代理モデルを提案する。
提案モデルでは、(潜在的に高次元の)データの次元的低減のためのニューラルネットワークアプローチと、データ分布を学習するための代理モデル手法を組み合わせる。
我々のモデルは,データの表現を学習し,(a)高次元データシステムにおける不確実性を推定し,(c)出力分布の高次モーメントを一致させることができる。
論文 参考訳(メタデータ) (2022-02-10T14:42:51Z) - Multidimensional Scaling for Gene Sequence Data with Autoencoders [0.0]
本稿では、数百万の遺伝子配列を含むデータセットに容易にスケールできるオートエンコーダに基づく次元還元モデルを提案する。
提案モデルは現実世界の菌類遺伝子配列データセットを用いてDAMDSに対して評価される。
論文 参考訳(メタデータ) (2021-04-19T02:14:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。