論文の概要: Graph-Conditioned MLP for High-Dimensional Tabular Biomedical Data
- arxiv url: http://arxiv.org/abs/2211.06302v1
- Date: Fri, 11 Nov 2022 16:13:34 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-14 17:17:40.310398
- Title: Graph-Conditioned MLP for High-Dimensional Tabular Biomedical Data
- Title(参考訳): 高次元タブラルバイオメディカルデータのためのグラフ合成MLP
- Authors: Andrei Margeloiu, Nikola Simidjievski, Pietro Lio', Mateja Jamnik
- Abstract要約: ゲノム研究は通常、患者の小さなコホートを含む。
このようなデータセット上でニューラルネットワークをトレーニングすることは、通常不安定である。
本稿では,データセットのパラメータに先行する新しい手法であるGraph-Conditionedを提案する。
- 参考スコア(独自算出の注目度): 7.923088041693465
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Genome-wide studies leveraging recent high-throughput sequencing technologies
collect high-dimensional data. However, they usually include small cohorts of
patients, and the resulting tabular datasets suffer from the "curse of
dimensionality". Training neural networks on such datasets is typically
unstable, and the models overfit. One problem is that modern weight
initialisation strategies make simplistic assumptions unsuitable for small-size
datasets. We propose Graph-Conditioned MLP, a novel method to introduce priors
on the parameters of an MLP. Instead of randomly initialising the first layer,
we condition it directly on the training data. More specifically, we create a
graph for each feature in the dataset (e.g., a gene), where each node
represents a sample from the same dataset (e.g., a patient). We then use Graph
Neural Networks (GNNs) to learn embeddings from these graphs and use the
embeddings to initialise the MLP's parameters. Our approach opens the prospect
of introducing additional biological knowledge when constructing the graphs. We
present early results on 7 classification tasks from gene expression data and
show that GC-MLP outperforms an MLP.
- Abstract(参考訳): 近年の高スループットシークエンシング技術を活用したゲノムワイド研究は高次元データを収集する。
しかし、それらは通常患者の小さなコホートを含み、結果として得られる表のデータセットは「次元の曲線」に悩まされる。
このようなデータセット上でニューラルネットワークをトレーニングすることは、通常不安定であり、モデルは過度に適合する。
一つの問題は、現代の重み初期化戦略が、小さなデータセットには適さない単純な仮定を単純化することである。
MLPのパラメータに先行する新しい手法であるGraph-Conditioned MLPを提案する。
最初のレイヤをランダムに初期化する代わりに、トレーニングデータに直接設定します。
具体的には、データセット内の各機能(例えば、遺伝子)のグラフを作成し、各ノードが同じデータセット(例えば、患者)からのサンプルを表します。
次に、グラフニューラルネットワーク(GNN)を使用して、これらのグラフから埋め込みを学び、埋め込みを使用してMLPのパラメータを初期化する。
提案手法は, グラフ構築時に生物学的知識を付加する可能性を開く。
遺伝子発現データから7つの分類タスクの早期結果を示し,GC-MLPがMLPより優れていることを示す。
関連論文リスト
- Ensemble Learning for Graph Neural Networks [28.3650473174488]
グラフニューラルネットワーク(GNN)は、グラフ構造化データから学習するための様々な分野で成功している。
本稿では,GNNの性能とロバスト性向上のためのアンサンブル学習手法の適用について検討する。
論文 参考訳(メタデータ) (2023-10-22T03:55:13Z) - Interpretable Graph Neural Networks for Tabular Data [18.30325076881234]
IGNNetは学習アルゴリズムを制約し、解釈可能なモデルを生成する。
IGNNetは最先端の機械学習アルゴリズムに匹敵するパフォーマンスを示している。
論文 参考訳(メタデータ) (2023-08-17T12:35:02Z) - Joint Edge-Model Sparse Learning is Provably Efficient for Graph Neural
Networks [89.28881869440433]
本稿では,グラフニューラルネットワーク(GNN)における結合エッジモデルスパース学習の理論的特徴について述べる。
解析学的には、重要なノードをサンプリングし、最小のマグニチュードでプルーニングニューロンをサンプリングすることで、サンプルの複雑さを減らし、テスト精度を損なうことなく収束を改善することができる。
論文 参考訳(メタデータ) (2023-02-06T16:54:20Z) - EGRC-Net: Embedding-induced Graph Refinement Clustering Network [66.44293190793294]
埋め込みによるグラフリファインメントクラスタリングネットワーク (EGRC-Net) という新しいグラフクラスタリングネットワークを提案する。
EGRC-Netは学習した埋め込みを利用して初期グラフを適応的に洗練し、クラスタリング性能を向上させる。
提案手法はいくつかの最先端手法より一貫して優れている。
論文 参考訳(メタデータ) (2022-11-19T09:08:43Z) - A Robust Stacking Framework for Training Deep Graph Models with
Multifaceted Node Features [61.92791503017341]
数値ノード特徴とグラフ構造を入力とするグラフニューラルネットワーク(GNN)は,グラフデータを用いた各種教師付き学習タスクにおいて,優れた性能を示した。
IID(non-graph)データをGNNに簡単に組み込むことはできない。
本稿では、グラフ認識の伝播をIDデータに意図した任意のモデルで融合するロバストな積み重ねフレームワークを提案する。
論文 参考訳(メタデータ) (2022-06-16T22:46:33Z) - An Introduction to Robust Graph Convolutional Networks [71.68610791161355]
本論文では, 誤りのある単一ビューあるいは複数ビューのデータに対して, 新たなロバストグラフ畳み込みニューラルネットワークを提案する。
従来のグラフ畳み込みネットワークにAutoencodersを介して余分なレイヤを組み込むことで、典型的なエラーモデルを明示的に特徴付けおよび処理します。
論文 参考訳(メタデータ) (2021-03-27T04:47:59Z) - Learning to Drop: Robust Graph Neural Network via Topological Denoising [50.81722989898142]
グラフニューラルネットワーク(GNN)のロバスト性および一般化性能を向上させるために,パラメータ化トポロジカルデノイングネットワークであるPTDNetを提案する。
PTDNetは、パラメータ化されたネットワークでスパーシファイドグラフ内のエッジ数をペナル化することで、タスク非関連エッジを創出する。
PTDNetはGNNの性能を著しく向上させ,さらにノイズの多いデータセットでは性能が向上することを示す。
論文 参考訳(メタデータ) (2020-11-13T18:53:21Z) - EdgeNets:Edge Varying Graph Neural Networks [179.99395949679547]
本稿では、EdgeNetの概念を通じて、最先端グラフニューラルネットワーク(GNN)を統一する一般的なフレームワークを提案する。
EdgeNetはGNNアーキテクチャであり、異なるノードが異なるパラメータを使って異なる隣人の情報を測定することができる。
これは、ノードが実行でき、既存のグラフ畳み込みニューラルネットワーク(GCNN)とグラフアテンションネットワーク(GAT)の1つの定式化の下で包含できる一般的な線形で局所的な操作である。
論文 参考訳(メタデータ) (2020-01-21T15:51:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。