論文の概要: Alternatives of Unsupervised Representations of Variables on the Latent Space
- arxiv url: http://arxiv.org/abs/2410.20172v1
- Date: Sat, 26 Oct 2024 13:06:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-29 12:21:50.288827
- Title: Alternatives of Unsupervised Representations of Variables on the Latent Space
- Title(参考訳): 潜在空間上の変数の教師なし表現の代替
- Authors: Alex Glushkovsky,
- Abstract要約: 本稿では,変分オートエンコーダ(β-VAE)を適用して,2次元潜在空間上の変数を表現するための教師なし機械学習の適用について述べる。
潜在空間上の変数を表現するために、5つの異なる方法が導入された。
β-VAEによる変数表現の28のアプローチが検討されている。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: The article addresses the application of unsupervised machine learning to represent variables on the 2D latent space by applying a variational autoencoder (beta-VAE). Representation of variables on low dimensional spaces allows for data visualization, disentanglement of variables based on underlying characteristics, finding of meaningful patterns and outliers, and supports interpretability. Five distinct methods have been introduced to represent variables on the latent space: (1) straightforward transposed, (2) univariate metadata of variables, such as variable statistics, empirical probability density and cumulative distribution functions, (3) adjacency matrices of different metrics, such as correlations, R2 values, Jaccard index, cosine similarity, and mutual information, (4) gradient mappings followed by spot cross product calculation, and (5) combined. Twenty-eight approaches of variable representations by beta-VAE have been considered. The pairwise spot cross product addresses relationships of gradients of two variables along latent space axes, such as orthogonal, confounded positive, confounded negative, and everything in between. The article addresses generalized representations of variables that cover both features and labels. Dealing with categorical variables, reinforced entanglement has been introduced to represent one-hot encoded categories. The article includes three examples: (1) synthetic data with known dependencies, (2) famous MNIST example of handwritten numbers, and (3) real-world multivariate time series of Canadian financial market interest rates. As a result, unsupervised representations of interest rates on the latent space correctly disentangled rates based on their type, such as bonds, T-bills, GICs, or conventional mortgages, positioned bonds and T-bills along a single curve, and ordered rates by their terms along that curve.
- Abstract(参考訳): この記事は、変分オートエンコーダ(beta-VAE)を適用することにより、2D潜在空間上の変数を表現するための教師なし機械学習の適用について論じる。
低次元空間における変数の表現は、データビジュアライゼーション、基礎となる特徴に基づく変数の切り離し、意味のあるパターンと外れ値の発見、解釈可能性のサポートを可能にする。
1) 直接変換, (2) 変数の単変量メタデータ, 変数統計, 経験的確率密度, 累積分布関数, (3) 相関係数, R2値, ジャカード指数, コサイン類似度, 相互情報, (4) 勾配写像, (5) の組み合わせ。
β-VAEによる変数表現の28のアプローチが検討されている。
ペアワイズ・クロス積は、直交、共起正、共起負、そしてその間にあるすべてのような、潜在空間軸に沿った2つの変数の勾配の関係に対処する。
この記事では、特徴とラベルの両方をカバーする変数の一般化表現に対処する。
分類変数を用いて、強化絡み合いは1ホットエンコードされたカテゴリを表すために導入された。
本論文は,(1)既知の依存関係を持つ合成データ,(2)手書き数字の有名なMNIST例,(3)カナダ金融市場金利の実世界多変量時系列の3つの例を含む。
結果として、潜在空間上の金利の教師なし表現は、結合、T-ビル、GIC、または従来の住宅ローンなど、それらのタイプに基づいて正しく歪められ、単一の曲線に沿って位置付けられた結合とT-ビルを配置し、その曲線に沿った条件でレートを順序付けする。
関連論文リスト
- Unsupervised Representation Learning from Sparse Transformation Analysis [79.94858534887801]
本稿では,潜在変数のスパース成分への変換を分解し,シーケンスデータから表現を学習することを提案する。
入力データは、まず潜伏活性化の分布として符号化され、その後確率フローモデルを用いて変換される。
論文 参考訳(メタデータ) (2024-10-07T23:53:25Z) - CAVIAR: Categorical-Variable Embeddings for Accurate and Robust Inference [0.2209921757303168]
社会科学の研究は、しばしば分類変数と結果の関係に頼っている。
本稿では,高次元空間における値を仮定するカテゴリ変数を埋め込む新しい手法であるCAVIARを紹介する。
論文 参考訳(メタデータ) (2024-04-07T14:47:07Z) - Robust Concept Erasure via Kernelized Rate-Distortion Maximization [38.19696482602788]
KRaM(Kernelized Rate-Distortion Maximizer)を提案する。
KRaMは、修正レート歪み関数を用いて指定された距離測度(ラベル付き概念で定義され消去される)と一致するように表現の変換に適合する。
KRaMは、データ表現からカテゴリ変数、連続変数、ベクトル値変数など、さまざまな種類の概念を効果的に消去する。
論文 参考訳(メタデータ) (2023-11-30T21:10:44Z) - Identifiable Latent Causal Content for Domain Adaptation under Latent Covariate Shift [82.14087963690561]
マルチソースドメイン適応(MSDA)は、ラベル付き対象ドメインのラベル予測関数を学習する際の課題に対処する。
本稿では,潜在コンテンツ変数と潜時スタイル変数とともに,ドメイン間の潜時雑音を導入し,複雑な因果生成モデルを提案する。
提案手法は、シミュレーションと実世界の両方のデータセットに対して、例外的な性能と有効性を示す。
論文 参考訳(メタデータ) (2022-08-30T11:25:15Z) - On the Strong Correlation Between Model Invariance and Generalization [54.812786542023325]
一般化は、見えないデータを分類するモデルの能力をキャプチャする。
不変性はデータの変換におけるモデル予測の一貫性を測定する。
データセット中心の視点から、あるモデルの精度と不変性は異なるテストセット上で線形に相関している。
論文 参考訳(メタデータ) (2022-07-14T17:08:25Z) - Linear Discriminant Analysis with High-dimensional Mixed Variables [10.774094462083843]
本稿では,混合変数を用いた高次元観測の分類手法を提案する。
データを指数関数的に多くのセルに分割するという課題を克服する。
推定精度と誤分類率に関する結果が確立される。
論文 参考訳(メタデータ) (2021-12-14T03:57:56Z) - Learning Conditional Invariance through Cycle Consistency [60.85059977904014]
本稿では,データセットの変動の有意義な要因と独立な要因を識別する新しい手法を提案する。
提案手法は,対象プロパティと残りの入力情報に対する2つの別個の潜在部分空間を含む。
我々は,より意味のある因子を同定し,よりスペーサーや解釈可能なモデルに導く合成および分子データについて実証する。
論文 参考訳(メタデータ) (2021-11-25T17:33:12Z) - Triplot: model agnostic measures and visualisations for variable
importance in predictive models that take into account the hierarchical
correlation structure [3.0036519884678894]
変数間の相関に関する情報を利用してモデル解析を支援する新しい手法を提案する。
ユーザが提案した変数群(アスペクト)と、自動的に決定される変数群(アスペクト)を解析する方法を紹介します。
また,可変グルーピングの階層構造を利用して高情報密度モデル可視化を行うtriplotという新しいタイプのモデル可視化手法を提案する。
論文 参考訳(メタデータ) (2021-04-07T21:29:03Z) - Tractable Inference in Credal Sentential Decision Diagrams [116.6516175350871]
確率感性決定図は、解離ゲートの入力が確率値によってアノテートされる論理回路である。
我々は、局所確率を質量関数のクレーダル集合に置き換えることができる確率の一般化である、クレーダル感性決定図を開発する。
まず,ノイズの多い7セグメント表示画像に基づく簡単なアプリケーションについて検討する。
論文 参考訳(メタデータ) (2020-08-19T16:04:34Z) - Learning Disentangled Representations with Latent Variation
Predictability [102.4163768995288]
本稿では,潜在不整合表現の変動予測可能性について述べる。
逆生成プロセス内では、潜時変動と対応する画像対の相互情報を最大化することにより、変動予測可能性を高める。
本研究では,潜在表現の絡み合いを測るために,基礎的構造的生成因子に依存しない評価指標を開発する。
論文 参考訳(メタデータ) (2020-07-25T08:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。