論文の概要: Graph Spectral Feature Learning for Mixed Data of Categorical and
Numerical Type
- arxiv url: http://arxiv.org/abs/2005.02817v1
- Date: Wed, 6 May 2020 13:36:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 05:14:02.920270
- Title: Graph Spectral Feature Learning for Mixed Data of Categorical and
Numerical Type
- Title(参考訳): カテゴリー型と数値型の混合データに対するグラフスペクトル特徴学習
- Authors: Saswata Sahoo and Souradip Chakraborty
- Abstract要約: 混合データ空間における単純な近傍クエリでは、数値変数と分類変数を別々に考えるのが標準的な方法である。
本研究では,変数の混合型間の確率的依存構造を非方向性グラフで明示的にモデル化する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 0.7106986689736827
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Feature learning in the presence of a mixed type of variables, numerical and
categorical types, is an important issue for related modeling problems. For
simple neighborhood queries under mixed data space, standard practice is to
consider numerical and categorical variables separately and combining them
based on some suitable distance functions. Alternatives, such as Kernel
learning or Principal Component do not explicitly consider the inter-dependence
structure among the mixed type of variables. In this work, we propose a novel
strategy to explicitly model the probabilistic dependence structure among the
mixed type of variables by an undirected graph. Spectral decomposition of the
graph Laplacian provides the desired feature transformation. The Eigen spectrum
of the transformed feature space shows increased separability and more
prominent clusterability among the observations. The main novelty of our paper
lies in capturing interactions of the mixed feature type in an unsupervised
framework using a graphical model. We numerically validate the implications of
the feature learning strategy
- Abstract(参考訳): 数値型と分類型の混合型が存在する場合の特徴学習は、関連するモデリング問題にとって重要な問題である。
混合データ空間における単純な近傍クエリでは、数値変数と分類変数を別々に考慮し、適当な距離関数に基づいて組み合わせる。
カーネル学習やプリンシパルコンポーネントといった代替手段は、変数の混合タイプの相互依存構造を明示的に考慮していない。
本研究では,非有向グラフを用いた混合型変数間の確率的依存構造を明示的にモデル化する新しい手法を提案する。
グラフのスペクトル分解 ラプラシアンは望ましい特徴変換を提供する。
変換された特徴空間の固有スペクトルは、観測中の分離性とより顕著なクラスター性を示す。
本稿の主な特徴は、グラフィカルモデルを用いて教師なしフレームワークにおける混合特徴型の相互作用を捉えることである。
特徴学習戦略がもたらす意味を数値的に検証する
関連論文リスト
- Improving Heterogeneous Graph Learning with Weighted Mixed-Curvature
Product Manifold [4.640835690336652]
グラフ表現学習において、入力グラフの複雑な幾何学構造、例えばノード間の隠れ関係は、埋め込み空間においてよく捉えられる。
標準ユークリッド埋め込み空間は、様々な構造のグラフを表現する能力に制限がある。
様々な構造を持つデータの忠実な埋め込みに対する有望な候補は、積多様体の埋め込み空間である。
論文 参考訳(メタデータ) (2023-07-10T12:20:50Z) - High-Dimensional Undirected Graphical Models for Arbitrary Mixed Data [2.2871867623460207]
多くのアプリケーションでは、データは異なるタイプの変数にまたがる。
最近の進歩は、バイナリ連続ケースにどのように取り組めるかを示しているが、一般的な混合変数型構造は依然として困難である。
完全混合型の変数を持つデータに対して,フレキシブルでスケーラブルな手法を提案する。
論文 参考訳(メタデータ) (2022-11-21T18:21:31Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - On the Strong Correlation Between Model Invariance and Generalization [54.812786542023325]
一般化は、見えないデータを分類するモデルの能力をキャプチャする。
不変性はデータの変換におけるモデル予測の一貫性を測定する。
データセット中心の視点から、あるモデルの精度と不変性は異なるテストセット上で線形に相関している。
論文 参考訳(メタデータ) (2022-07-14T17:08:25Z) - Linear Discriminant Analysis with High-dimensional Mixed Variables [10.774094462083843]
本稿では,混合変数を用いた高次元観測の分類手法を提案する。
データを指数関数的に多くのセルに分割するという課題を克服する。
推定精度と誤分類率に関する結果が確立される。
論文 参考訳(メタデータ) (2021-12-14T03:57:56Z) - Semi-Supervised Disentanglement of Class-Related and Class-Independent
Factors in VAE [4.533408938245526]
本稿では,データ変動のクラス関連要因とクラス非依存要因を両立できるフレームワークを提案する。
このフレームワークは,データからクラス関連因子を抽出するプロセスを改善するために,潜在空間における注意機構を利用する。
実験の結果,我々のフレームワークは,クラス関連要因とクラス非依存要因を分離し,解釈可能な特徴を学習していることがわかった。
論文 参考訳(メタデータ) (2021-02-01T15:05:24Z) - Hyperbolic Graph Embedding with Enhanced Semi-Implicit Variational
Inference [48.63194907060615]
半単純グラフ変分自動エンコーダを用いて,低次元グラフ潜在表現における高次統計量を取得する。
我々は、階層構造を示すグラフを効率的に表現するために、ポインケア埋め込みを通して潜在空間に双曲幾何学を組み込む。
論文 参考訳(メタデータ) (2020-10-31T05:48:34Z) - Learning Representation for Mixed Data Types with a Nonlinear Deep
Encoder-Decoder Framework [0.7106986689736827]
混合データ型に対するクロスドメイン情報を取得するための非線形Deep-Decoderフレームワークを提案する。
隠れた非線形単位の数値変数に関する情報を符号化する。
数値変数と分類変数の役割を切り替えるネットワークが開発されている。
論文 参考訳(メタデータ) (2020-09-21T06:29:49Z) - Out-of-distribution Generalization via Partial Feature Decorrelation [72.96261704851683]
本稿では,特徴分解ネットワークと対象画像分類モデルとを協調的に最適化する,PFDL(Partial Feature Deorrelation Learning)アルゴリズムを提案する。
実世界のデータセットを用いた実験により,OOD画像分類データセットにおけるバックボーンモデルの精度が向上することを示した。
論文 参考訳(メタデータ) (2020-07-30T05:48:48Z) - Structural Landmarking and Interaction Modelling: on Resolution Dilemmas
in Graph Classification [50.83222170524406]
解法ジレンマの統一概念に基づくグラフ分類における本質的難易度の研究」
構造ランドマークと相互作用モデリングのためのインダクティブニューラルネットワークモデルSLIM'を提案する。
論文 参考訳(メタデータ) (2020-06-29T01:01:42Z) - Bayesian Sparse Factor Analysis with Kernelized Observations [67.60224656603823]
多視点問題は潜在変数モデルに直面することができる。
高次元問題と非線形問題は伝統的にカーネルメソッドによって扱われる。
両アプローチを単一モデルにマージすることを提案する。
論文 参考訳(メタデータ) (2020-06-01T14:25:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。