論文の概要: Cluster Weighted Model Based on TSNE algorithm for High-Dimensional Data
- arxiv url: http://arxiv.org/abs/2208.01579v1
- Date: Tue, 2 Aug 2022 16:34:11 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-03 13:02:50.494143
- Title: Cluster Weighted Model Based on TSNE algorithm for High-Dimensional Data
- Title(参考訳): 高次元データに対するTSNEアルゴリズムに基づくクラスタ重み付きモデル
- Authors: Kehinde Olobatuyi
- Abstract要約: 多くの機械学習モデルと同様に、クラスタ重み付けモデル(CWM)の精度と速度は、高次元データによって妨げられる。
混合モデルにおける「次元のコース」の影響を低減するための擬似手法に関する研究。
本研究では, 混合モデルが巨大な高次元データの存在下で成長するのには, 擬似的手法が不十分であることを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Similar to many Machine Learning models, both accuracy and speed of the
Cluster weighted models (CWMs) can be hampered by high-dimensional data,
leading to previous works on a parsimonious technique to reduce the effect of
"Curse of dimensionality" on mixture models. In this work, we review the
background study of the cluster weighted models (CWMs). We further show that
parsimonious technique is not sufficient for mixture models to thrive in the
presence of huge high-dimensional data. We discuss a heuristic for detecting
the hidden components by choosing the initial values of location parameters
using the default values in the "FlexCWM" R package. We introduce a
dimensionality reduction technique called T-distributed stochastic neighbor
embedding (TSNE) to enhance the parsimonious CWMs in high-dimensional space.
Originally, CWMs are suited for regression but for classification purposes, all
multi-class variables are transformed logarithmically with some noise. The
parameters of the model are obtained via expectation maximization algorithm.
The effectiveness of the discussed technique is demonstrated using real data
sets from different fields.
- Abstract(参考訳): 多くの機械学習モデルと同様に、クラスタ重み付けモデル(CWM)の精度と速度は高次元データによって妨げられるため、従来は「次元のコース」が混合モデルに与える影響を減らすための擬似手法が研究されていた。
本稿では,クラスタ重み付きモデル (CWM) の背景研究について概説する。
さらに,超高次元データの存在下で混合モデルが成長するには,分岐法が不十分であることを示す。
本稿では、"FlexCWM" Rパッケージのデフォルト値を用いて、位置パラメータの初期値を選択することで、隠れたコンポーネントを検出するヒューリスティックについて論じる。
我々は、高次元空間における擬似CWMを強化するために、TSNE(T-distributed stochastic neighbor embedded)と呼ばれる次元還元手法を導入する。
もともと、CWMは回帰に適していたが、分類の目的では、全てのマルチクラス変数は対数的に雑音で変換される。
モデルのパラメータは期待最大化アルゴリズムによって得られる。
本手法の有効性を,異なる分野の実際のデータセットを用いて示す。
関連論文リスト
- Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Data-freeWeight Compress and Denoise for Large Language Models [101.53420111286952]
パラメータ行列を圧縮する手法として,データフリーなジョイントランクk近似を提案する。
キャリブレーションデータなしで、元の性能の93.43%を維持しながら80%のパラメータのモデルプルーニングを実現する。
論文 参考訳(メタデータ) (2024-02-26T05:51:47Z) - Clustering based on Mixtures of Sparse Gaussian Processes [6.939768185086753]
低次元の組込み空間を使ってデータをクラスタする方法は、マシンラーニングにおいて依然として難しい問題である。
本稿では,クラスタリングと次元還元の両立を目的とした共同定式化を提案する。
我々のアルゴリズムはスパースガウス過程の混合に基づいており、スパースガウス過程混合クラスタリング(SGP-MIC)と呼ばれる。
論文 参考訳(メタデータ) (2023-03-23T20:44:36Z) - Hierarchical mixtures of Gaussians for combined dimensionality reduction
and clustering [5.819751855626331]
このような2段階モデルの族が、ガウスの階層混合(HMoG)と呼ばれる単一の階層モデルにどのように結合できるかを示す。
HMoGは次元縮小とクラスタリングの両方を同時に捕捉し、その性能は確率関数によって閉形式で定量化される。
HMoGを合成データおよびRNAシークエンシングデータに適用し、2段階モデルの限界を超える方法を示す。
論文 参考訳(メタデータ) (2022-06-10T02:03:18Z) - Dynamically-Scaled Deep Canonical Correlation Analysis [77.34726150561087]
カノニカル相関解析 (CCA) は, 2つのビューの特徴抽出手法である。
本稿では,入力依存の正準相関モデルをトレーニングするための新しい動的スケーリング手法を提案する。
論文 参考訳(メタデータ) (2022-03-23T12:52:49Z) - A Class of Two-Timescale Stochastic EM Algorithms for Nonconvex Latent
Variable Models [21.13011760066456]
expectation-Maximization (EM)アルゴリズムは、変数モデルを学習するための一般的な選択肢である。
本稿では,Two-Time Methodsと呼ばれる手法の一般クラスを提案する。
論文 参考訳(メタデータ) (2022-03-18T22:46:34Z) - Inverting brain grey matter models with likelihood-free inference: a
tool for trustable cytoarchitecture measurements [62.997667081978825]
脳の灰白質細胞構造の特徴は、体密度と体積に定量的に敏感であり、dMRIでは未解決の課題である。
我々は新しいフォワードモデル、特に新しい方程式系を提案し、比較的スパースなb殻を必要とする。
次に,提案手法を逆転させるため,確率自由推論 (LFI) として知られるベイズ解析から最新のツールを適用した。
論文 参考訳(メタデータ) (2021-11-15T09:08:27Z) - Bayesian multiscale deep generative model for the solution of
high-dimensional inverse problems [0.0]
深層確率的生成モデルに基づく新しいマルチスケールベイズ推論手法が導入された。
この方法は、安定性、効率、精度を示しながら、高次元パラメータ推定を可能にする。
論文 参考訳(メタデータ) (2021-02-04T11:47:21Z) - Autoregressive Score Matching [113.4502004812927]
自動回帰条件スコアモデル(AR-CSM)を提案する。
AR-CSMモデルでは、このデータ分布とモデル分布のばらつきを効率的に計算し、最適化することができ、高価なサンプリングや対向訓練を必要としない。
本研究では,合成データに対する密度推定,画像生成,画像復調,暗黙エンコーダを用いた潜在変数モデルの訓練に応用できることを示す。
論文 参考訳(メタデータ) (2020-10-24T07:01:24Z) - Generalized Matrix Factorization: efficient algorithms for fitting
generalized linear latent variable models to large data arrays [62.997667081978825]
一般化線形潜在変数モデル(GLLVM)は、そのような因子モデルを非ガウス応答に一般化する。
GLLVMのモデルパラメータを推定する現在のアルゴリズムは、集約的な計算を必要とし、大規模なデータセットにスケールしない。
本稿では,GLLVMを高次元データセットに適用するための新しい手法を提案する。
論文 参考訳(メタデータ) (2020-10-06T04:28:19Z) - Estimation of sparse Gaussian graphical models with hidden clustering
structure [8.258451067861932]
隠れクラスタリング構造を持つスパースガウス図形モデルを推定するモデルを提案する。
対称なガウス・シーデルに基づく乗算器の交互方向法を開発した。
合成データと実データの両方に関する数値実験により,本モデルの有効性が示された。
論文 参考訳(メタデータ) (2020-04-17T08:43:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。