論文の概要: IVGAE: Handling Incomplete Heterogeneous Data with a Variational Graph Autoencoder
- arxiv url: http://arxiv.org/abs/2511.22116v1
- Date: Thu, 27 Nov 2025 05:14:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-01 19:47:55.403501
- Title: IVGAE: Handling Incomplete Heterogeneous Data with a Variational Graph Autoencoder
- Title(参考訳): IVGAE: 変分グラフオートエンコーダによる不完全不均一データ処理
- Authors: Youran Zhou, Mohamed Reda Bouadjenek, Sunil Aryal%,
- Abstract要約: 非完全不均一データの堅牢な計算のための変分グラフオートエンコーダである textbfIVGAE を提案する。
IVGAEは、サンプル-機能関係を表す二部グラフを構築し、グラフ表現学習を構造的依存関係のモデル化に適用する。
16の実世界のデータセットの実験によると、IVGAEは、MCAR、MAR、MNARの欠落シナリオに対して、RMSEと下流F1の一貫性のある改善を実現している。
- 参考スコア(独自算出の注目度): 4.935498694293104
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Handling missing data remains a fundamental challenge in real-world tabular datasets, especially when data are heterogeneous with both numerical and categorical features. Existing imputation methods often fail to capture complex structural dependencies and handle heterogeneous data effectively. We present \textbf{IVGAE}, a Variational Graph Autoencoder framework for robust imputation of incomplete heterogeneous data. IVGAE constructs a bipartite graph to represent sample-feature relationships and applies graph representation learning to model structural dependencies. A key innovation is its \textit{dual-decoder architecture}, where one decoder reconstructs feature embeddings and the other models missingness patterns, providing structural priors aware of missing mechanisms. To better encode categorical variables, we introduce a Transformer-based heterogeneous embedding module that avoids high-dimensional one-hot encoding. Extensive experiments on 16 real-world datasets show that IVGAE achieves consistent improvements in RMSE and downstream F1 across MCAR, MAR, and MNAR missing scenarios under 30\% missing rates. Code and data are available at: https://github.com/echoid/IVGAE.
- Abstract(参考訳): 欠落したデータを扱うことは、特に数値的特徴とカテゴリー的特徴の両方で不均一なデータの場合、現実世界の表層データセットでは依然として根本的な課題である。
既存の計算手法は複雑な構造的依存関係を捕捉し、不均一なデータを効果的に扱うのに失敗することが多い。
不完全不均一データの堅牢な計算のための変分グラフオートエンコーダフレームワークである「textbf{IVGAE}」を提案する。
IVGAEは、サンプル-機能関係を表す二部グラフを構築し、グラフ表現学習を構造的依存関係のモデル化に適用する。
1つのデコーダが機能の埋め込みと他のモデルの欠如パターンを再構築し、構造的事前にメカニズムの欠如を認識させる。
分類変数をよりよくエンコードするために,高次元のワンホット符号化を回避するトランスフォーマーベースのヘテロジニアス埋め込みモジュールを導入する。
16の実世界のデータセットに対する大規模な実験により、IVGAEは、MCAR、MAR、MNARの欠落シナリオに対して、RMSEと下流F1の一貫性のある改善を実現している。
コードとデータは、https://github.com/echoid/IVGAE.comで入手できる。
関連論文リスト
- Heterogeneous Sheaf Neural Networks [17.664754528494132]
不均一グラフは、多くの実世界の応用における関係構造をモデル化するために一般的に用いられる。
グラフの基盤となるトポロジにおける不均一性をモデル化するために,細胞シーブを用いることを提案する。
HetSheafは、ヘテロジニアス層ニューラルネットワークの一般的なフレームワークであり、ヘテロジニアス層予測器のシリーズを紹介する。
論文 参考訳(メタデータ) (2024-09-12T13:38:08Z) - UGMAE: A Unified Framework for Graph Masked Autoencoders [67.75493040186859]
グラフマスク付きオートエンコーダのための統一フレームワークであるUGMAEを提案する。
まず,ノードの特異性を考慮した適応型特徴マスク生成器を開発した。
次に,階層型構造再構成と特徴再構成を併用し,総合的なグラフ情報を取得する。
論文 参考訳(メタデータ) (2024-02-12T19:39:26Z) - Fake It Till Make It: Federated Learning with Consensus-Oriented
Generation [52.82176415223988]
コンセンサス指向生成による連合学習(FedCOG)を提案する。
FedCOGは、補完的なデータ生成と知識蒸留に基づくモデルトレーニングという、クライアント側の2つの重要なコンポーネントで構成されています。
古典的および実世界のFLデータセットの実験は、FedCOGが一貫して最先端の手法より優れていることを示している。
論文 参考訳(メタデータ) (2023-12-10T18:49:59Z) - GraphMETRO: Mitigating Complex Graph Distribution Shifts via Mixture of Aligned Experts [75.51612253852002]
GraphMETROは、自然多様性をモデル化し、複雑な分散シフトをキャプチャするグラフニューラルネットワークアーキテクチャである。
GraphMETROはGOODベンチマークから4つのデータセットに対して最先端の結果を得る。
論文 参考訳(メタデータ) (2023-12-07T20:56:07Z) - GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。
提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。
第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文 参考訳(メタデータ) (2022-12-01T11:49:07Z) - Integrating Transformer and Autoencoder Techniques with Spectral Graph
Algorithms for the Prediction of Scarcely Labeled Molecular Data [2.8360662552057323]
この課題に対処するために、Merriman-Bence-Osher(MBO)テクニックを取り入れたグラフベースの3つのモデルを導入する。
具体的には、MBO方式のグラフベースの修正は、自家製のトランスフォーマーやオートエンコーダなどの最先端技術と統合されている。
提案したモデルは,5つのベンチマークデータセットを用いて検証する。
論文 参考訳(メタデータ) (2022-11-12T22:45:32Z) - EGG-GAE: scalable graph neural networks for tabular data imputation [8.775728170359024]
本稿では,データ計算に欠ける新しいEdGe生成グラフオートエンコーダ(EGG-GAE)を提案する。
EGG-GAEは、入力データのランダムにサンプリングされたミニバッチで動作し、各アーキテクチャ層におけるミニバッチ間の接続性を自動的に推測する。
論文 参考訳(メタデータ) (2022-10-19T10:26:17Z) - Variational Selective Autoencoder: Learning from Partially-Observed
Heterogeneous Data [45.23338389559936]
本研究では,部分観測された異種データから表現を学習するための変分選択型オートエンコーダ(VSAE)を提案する。
vsaeは、観測データ、観測されていないデータ、およびインプテーションマスクの合同分布をモデル化することで、異種データの潜在依存関係を学習する。
その結果、データ生成や計算を含むさまざまな下流タスクの統一モデルが実現される。
論文 参考訳(メタデータ) (2021-02-25T04:39:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。