論文の概要: Bayesian Low-Rank Interpolative Decomposition for Complex Datasets
- arxiv url: http://arxiv.org/abs/2205.14825v1
- Date: Mon, 30 May 2022 03:06:48 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-01 08:55:08.063942
- Title: Bayesian Low-Rank Interpolative Decomposition for Complex Datasets
- Title(参考訳): 複素データセットに対するベイズ低ランク補間分解
- Authors: Jun Lu
- Abstract要約: 本稿では,特徴選択,低ランク近似,データ中の隠れパターンの同定によく用いられる補間分解(ID)の確率モデルを提案する。
我々は,CCLE EC50,CCLE IC50,CTRP EC50,MovieLens 100Kデータセットなど,さまざまな実世界のデータセット上でモデルを評価した。
- 参考スコア(独自算出の注目度): 4.913248451323163
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we introduce a probabilistic model for learning interpolative
decomposition (ID), which is commonly used for feature selection, low-rank
approximation, and identifying hidden patterns in data, where the matrix
factors are latent variables associated with each data dimension. Prior
densities with support on the specified subspace are used to address the
constraint for the magnitude of the factored component of the observed matrix.
Bayesian inference procedure based on Gibbs sampling is employed. We evaluate
the model on a variety of real-world datasets including CCLE EC50, CCLE IC50,
CTRP EC50,and MovieLens 100K datasets with different sizes, and dimensions, and
show that the proposed Bayesian ID GBT and GBTN models lead to smaller
reconstructive errors compared to existing randomized approaches.
- Abstract(参考訳): 本稿では,特徴の選択,低ランク近似,データ内の隠れパターンの同定によく用いられる補間分解(interpolative decomposition:id)を学習するための確率モデルを提案する。
指定された部分空間に対する支持を持つ事前密度は、観測行列の因子成分の大きさの制約に対処するために用いられる。
ギブスサンプリングに基づくベイズ推定手法を用いる。
我々は,CCLE EC50,CCLE IC50,CTRP EC50,MovieLens 100Kデータセットなど,さまざまな実世界のデータセットに対するモデルの評価を行い,提案したベイズID GBT と GBTN モデルが,既存のランダム化手法と比較して再構成誤差を小さくすることを示した。
関連論文リスト
- Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Latent Semantic Consensus For Deterministic Geometric Model Fitting [109.44565542031384]
我々はLSC(Latent Semantic Consensus)と呼ばれる効果的な方法を提案する。
LSCは、モデルフィッティング問題をデータポイントとモデル仮説に基づく2つの潜在意味空間に定式化する。
LSCは、一般的な多構造モデルフィッティングのために、数ミリ秒以内で一貫した、信頼性の高いソリューションを提供することができる。
論文 参考訳(メタデータ) (2024-03-11T05:35:38Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Feature Selection via the Intervened Interpolative Decomposition and its
Application in Diversifying Quantitative Strategies [4.913248451323163]
本稿では,観測行列の各列がそれぞれの優先度や重要性を持つ補間分解(ID)を計算するための確率論的モデルを提案する。
提案したモデルを,中国A株10株を含む実世界のデータセット上で評価した。
論文 参考訳(メタデータ) (2022-09-29T03:36:56Z) - Robust Bayesian Nonnegative Matrix Factorization with Implicit
Regularizers [4.913248451323163]
非負行列因数分解(NMF)学習のための暗黙ノルム正規化を用いた確率モデルを導入する。
がんにおける薬物感受性のゲノムを含む実世界のいくつかのデータセットでモデルを評価した。
論文 参考訳(メタデータ) (2022-08-22T04:34:17Z) - Comparative Study of Inference Methods for Interpolative Decomposition [4.913248451323163]
補間分解(ID)学習のための自動関係決定(ARD)を用いた確率モデルを提案する。
CCLE $EC50$, CCLE $IC50$, Gene Body Methylation, promoteder Methylation datasets with different size, and dimensions。
論文 参考訳(メタデータ) (2022-06-29T11:37:05Z) - Flexible and Hierarchical Prior for Bayesian Nonnegative Matrix
Factorization [4.913248451323163]
非負行列分解(NMF)を学習するための確率モデルを導入する。
サイズや寸法の異なるMovieLens 100KやMovieLens 1Mなどの実世界のデータセットでモデルを評価した。
論文 参考訳(メタデータ) (2022-05-23T03:51:55Z) - Hierarchical Infinite Relational Model [3.731168012111833]
階層的無限リレーショナルモデル(HIRM)は、ノイズ、スパース、不均一リレーショナルデータのための新しい確率的生成モデルである。
ギブスサンプリングによるベイズ後部推論のための新しいアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-08-16T16:32:13Z) - Generalized Matrix Factorization: efficient algorithms for fitting
generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。
GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。
本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T04:28:19Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。