論文の概要: DDFI: Diverse and Distribution-aware Missing Feature Imputation via Two-step Reconstruction
- arxiv url: http://arxiv.org/abs/2512.06356v2
- Date: Thu, 11 Dec 2025 09:53:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-12 14:11:15.100461
- Title: DDFI: Diverse and Distribution-aware Missing Feature Imputation via Two-step Reconstruction
- Title(参考訳): DDFI : 2段階再建による多変量および分布認識型欠失特徴量計算
- Authors: Yifan Song, Fenglin Yu, Yihong Luo, Xingjian Tao, Siya Qiu, Kai Han, Jing Tang,
- Abstract要約: DDFI (Diverse and Distribution-aware Missing Feature Imputation) は、分散型・分散型特徴量計算法である。
機能伝搬とグラフベースのMasked AutoEncoderを組み合わせる。
トランスダクティブな設定とインダクティブな設定の両方で、最先端のメソッドよりも優れています。
- 参考スコア(独自算出の注目度): 22.492502807174237
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Incomplete node features are ubiquitous in real-world scenarios, e.g., the attributes of web users may be partly private, which causes the performance of Graph Neural Networks (GNNs) to decline significantly. Feature propagation (FP) is a well-known method that performs well for imputation of missing node features on graphs, but it still has the following three issues: 1) it struggles with graphs that are not fully connected, 2) imputed features face the over-smoothing problem, and 3) FP is tailored for transductive tasks, overlooking the feature distribution shift in inductive tasks. To address these challenges, we introduce DDFI, a Diverse and Distribution-aware Missing Feature Imputation method that combines feature propagation with a graph-based Masked AutoEncoder (MAE) in a nontrivial manner. It first designs a simple yet effective algorithm, namely Co-Label Linking (CLL), that randomly connects nodes in the training set with the same label to enhance the performance on graphs with numerous connected components. Then we develop a novel two-step representation generation process at the inference stage. Specifically, instead of directly using FP-imputed features as input during inference, DDFI further reconstructs the features through the whole MAE to reduce feature distribution shift in the inductive tasks and enhance the diversity of node features. Meanwhile, since existing feature imputation methods for graphs only evaluate by simulating the missing scenes with manually masking the features, we collect a new dataset called Sailing from the records of voyages that contains naturally missing features to help better evaluate the effectiveness. Extensive experiments conducted on six public datasets and Sailing show that DDFI outperforms the state-of-the-art methods under both transductive and inductive settings.
- Abstract(参考訳): 不完全なノード機能は、例えばWebユーザの属性が部分的にプライベートである場合など、現実世界のシナリオではユビキタスであり、グラフニューラルネットワーク(GNN)のパフォーマンスが大幅に低下する。
FP(Feature propagation)は、グラフ上のノード機能の欠如を補うためのよく知られた手法であるが、それでも以下の3つの問題がある。
1)完全連結でないグラフに苦しむ。
2) 過度にスムースな問題に直面している不注意な特徴,
3)FPは帰納的タスクに適したもので,帰納的タスクの特徴分布の変化を見越す。
これらの課題に対処するために、DDFI(Diverse and Distribution-aware Missing Feature Imputation)を導入し、特徴伝播とグラフベースのMasked AutoEncoder(MAE)を非自明な方法で組み合わせた。
Co-Label Linking (CLL)と呼ばれる単純なアルゴリズムを最初に設計し、トレーニングセット内のノードを同じラベルでランダムに接続することで、多数の連結コンポーネントを持つグラフのパフォーマンスを向上させる。
そして、推論段階で新しい2段階表現生成プロセスを開発する。
具体的には、推論中にFP入力された機能を入力として直接使用する代わりに、DDFIはMAE全体を通して機能を再構築し、帰納的タスクにおける特徴分布シフトを減らし、ノード機能の多様性を高める。
一方、既存のグラフの特徴計算手法は、不足シーンを手動でマスキングすることでのみ評価するため、自然に欠落した特徴を含む航海記録からSailingと呼ばれる新しいデータセットを収集し、有効性を評価するのに役立つ。
6つの公開データセットとSailingで実施された大規模な実験によると、DDFIはトランスダクティブとインダクティブの両方で最先端の手法より優れている。
関連論文リスト
- Efficient Identity and Position Graph Embedding via Spectral-Based Random Feature Aggregation [37.25217644507099]
グラフニューラルネットワーク(GNN)は、機能集約機構を通じてグラフ構造をキャプチャする。
ほとんどのGNNベースのメソッドでは、キャプチャ可能なプロパティが不明確である。
本稿では,効率的なアイデンティティと位置埋め込みのためのランダム特徴集約(RFA)を提案する。
論文 参考訳(メタデータ) (2025-05-27T10:26:15Z) - Enhancing Missing Data Imputation through Combined Bipartite Graph and Complete Directed Graph [18.06658040186476]
BCGNN(Bipartite and Complete Directed Graph Neural Network)という新しいフレームワークを導入する。
BCGNN内では、観察と特徴は2つの異なるノードタイプとして区別され、観察された特徴の値はそれらをリンクする属性付きエッジに変換される。
並行して、完全な有向グラフセグメントは、機能間の複雑な相互依存性を網羅し、伝達する。
論文 参考訳(メタデータ) (2024-11-07T17:48:37Z) - A Pure Transformer Pretraining Framework on Text-attributed Graphs [50.833130854272774]
グラフ構造を先行として扱うことで,特徴中心の事前学習の視点を導入する。
我々のフレームワークであるGraph Sequence Pretraining with Transformer (GSPT)はランダムウォークを通してノードコンテキストをサンプリングする。
GSPTはノード分類とリンク予測の両方に容易に適応でき、様々なデータセットで有望な経験的成功を示す。
論文 参考訳(メタデータ) (2024-06-19T22:30:08Z) - Leveraging Graph Diffusion Models for Network Refinement Tasks [72.54590628084178]
本稿では,グラフ拡散に基づく新しいグラフ生成フレームワークSGDMを提案する。
我々のフレームワークはグラフ拡散モデルのスケーラビリティと忠実度を向上するだけでなく、逆プロセスを利用して新しい条件付き生成タスクを実行する。
論文 参考訳(メタデータ) (2023-11-29T18:02:29Z) - Confidence-Based Feature Imputation for Graphs with Partially Known
Features [11.96118246448543]
本稿では,各チャネルの特徴に割り当てられるノードの特徴に対して,チャネルの信頼性という新しい概念を導入する。
そこで我々は,未知のノードと最も近い既知のノードとの間のチャネル幅の短い経路距離を用いて疑似信頼度を設計する。
疑似自信に基づいて,チャネルワイドなノード間拡散とノードワイドなチャネル間伝播を行う特徴計算手法を提案する。
論文 参考訳(メタデータ) (2023-05-26T04:23:24Z) - Distributed Learning over Networks with Graph-Attention-Based
Personalization [49.90052709285814]
分散ディープラーニングのためのグラフベースパーソナライズアルゴリズム(GATTA)を提案する。
特に、各エージェントのパーソナライズされたモデルは、グローバルな部分とノード固有の部分で構成される。
グラフ内の各エージェントを1つのノードとして扱うことにより、ノード固有のパラメータを特徴として扱うことにより、グラフアテンション機構の利点を継承することができる。
論文 参考訳(メタデータ) (2023-05-22T13:48:30Z) - Counterfactual Intervention Feature Transfer for Visible-Infrared Person
Re-identification [69.45543438974963]
視覚赤外人物再識別タスク(VI-ReID)におけるグラフベースの手法は,2つの問題により,悪い一般化に悩まされている。
十分に訓練された入力特徴は、グラフトポロジーの学習を弱め、推論過程において十分に一般化されない。
本稿では,これらの問題に対処するためのCIFT法を提案する。
論文 参考訳(メタデータ) (2022-08-01T16:15:31Z) - Graph-adaptive Rectified Linear Unit for Graph Neural Networks [64.92221119723048]
グラフニューラルネットワーク(GNN)は、従来の畳み込みを非ユークリッドデータでの学習に拡張することで、目覚ましい成功を収めた。
本稿では,周辺情報を利用した新しいパラメトリックアクティベーション機能であるグラフ適応整流線形ユニット(GRELU)を提案する。
我々は,GNNのバックボーンと様々な下流タスクによって,プラグアンドプレイGRELU法が効率的かつ効果的であることを示す包括的実験を行った。
論文 参考訳(メタデータ) (2022-02-13T10:54:59Z) - FDGATII : Fast Dynamic Graph Attention with Initial Residual and
Identity Mapping [0.39373541926236766]
本稿では,注目機構が選択情報に注目する能力に触発された新しいグラフニューラルネットワークFDGATIIを提案する。
FDG ATII は設計において本質的に並列化可能であり、操作ではホイット効率がよい。
FDG ATII は GAT と GCN をベースとしたベンチマークにおいて,完全教師付きタスクの精度と性能に優れることを示す。
論文 参考訳(メタデータ) (2021-10-21T20:19:17Z) - Unveiling Anomalous Edges and Nominal Connectivity of Attributed
Networks [53.56901624204265]
本研究では、相補的な強さを持つ2つの異なる定式化を用いて、属性グラフの異常なエッジを明らかにする。
まず、グラフデータマトリックスを低ランクとスパースコンポーネントに分解することで、パフォーマンスを著しく向上させる。
第2は、乱れのないグラフを頑健に復元することにより、第1のスコープを広げ、異常識別性能を高める。
論文 参考訳(メタデータ) (2021-04-17T20:00:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。