論文の概要: Multi-dataset and Transfer Learning Using Gene Expression Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2503.20400v1
- Date: Wed, 26 Mar 2025 10:23:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-03-27 13:18:12.475760
- Title: Multi-dataset and Transfer Learning Using Gene Expression Knowledge Graphs
- Title(参考訳): 遺伝子発現知識グラフを用いたマルチデータセットと移動学習
- Authors: Rita T. Sousa, Heiko Paulheim,
- Abstract要約: 遺伝子発現データセットは、遺伝子調節機構、生化学的経路、細胞機能に関する洞察を提供する。
遺伝子発現データは貴重な洞察を与えることができるが、式データセットの患者数が限られているため、課題が生じる。
本研究は、複数の遺伝子発現データセットとドメイン固有の知識を統合することで、これらの課題に対処する新しい手法を提案する。
- 参考スコア(独自算出の注目度): 1.8722948221596285
- License:
- Abstract: Gene expression datasets offer insights into gene regulation mechanisms, biochemical pathways, and cellular functions. Additionally, comparing gene expression profiles between disease and control patients can deepen the understanding of disease pathology. Therefore, machine learning has been used to process gene expression data, with patient diagnosis emerging as one of the most popular applications. Although gene expression data can provide valuable insights, challenges arise because the number of patients in expression datasets is usually limited, and the data from different datasets with different gene expressions cannot be easily combined. This work proposes a novel methodology to address these challenges by integrating multiple gene expression datasets and domain-specific knowledge using knowledge graphs, a unique tool for biomedical data integration. Then, vector representations are produced using knowledge graph embedding techniques, which are used as inputs for a graph neural network and a multi-layer perceptron. We evaluate the efficacy of our methodology in three settings: single-dataset learning, multi-dataset learning, and transfer learning. The experimental results show that combining gene expression datasets and domain-specific knowledge improves patient diagnosis in all three settings.
- Abstract(参考訳): 遺伝子発現データセットは、遺伝子調節機構、生化学的経路、細胞機能に関する洞察を提供する。
さらに、疾患とコントロール患者の遺伝子発現プロファイルを比較することで、疾患の病態の理解を深めることができる。
そのため、機械学習は遺伝子発現データを処理するために使われており、患者診断は最も一般的な応用の1つとして現れている。
遺伝子発現データは貴重な洞察を提供することができるが、表現データセットの患者数は通常は限られており、異なる遺伝子発現を持つ異なるデータセットからのデータが簡単に結合できないため、課題が生じる。
バイオメディカルデータ統合のためのユニークなツールである知識グラフを用いて、複数の遺伝子発現データセットとドメイン固有の知識を統合することにより、これらの課題に対処する新しい手法を提案する。
次に、グラフニューラルネットワークと多層パーセプトロンの入力として使用される知識グラフ埋め込み技術を用いてベクトル表現を生成する。
提案手法の有効性は, シングルデータセット学習, マルチデータセット学習, トランスファー学習の3つの設定で評価する。
実験結果から,遺伝子発現データセットとドメイン固有知識を組み合わせることで,3つの設定で患者の診断が向上することが示された。
関連論文リスト
- Weighted Diversified Sampling for Efficient Data-Driven Single-Cell Gene-Gene Interaction Discovery [56.622854875204645]
本稿では,遺伝子・遺伝子相互作用の探索に先進的なトランスフォーマーモデルを活用する,データ駆動型計算ツールを活用した革新的なアプローチを提案する。
新たな重み付き多様化サンプリングアルゴリズムは、データセットのたった2パスで、各データサンプルの多様性スコアを算出する。
論文 参考訳(メタデータ) (2024-10-21T03:35:23Z) - Integrating Heterogeneous Gene Expression Data through Knowledge Graphs for Improving Diabetes Prediction [1.8722948221596285]
本稿では、複数の遺伝子発現データセットとドメイン固有の知識を統合する新しいアプローチを提案する。
その後、KG埋め込み法を使用してベクトル表現を生成し、分類器の入力として機能する。
論文 参考訳(メタデータ) (2024-04-23T12:24:53Z) - GENER: A Parallel Layer Deep Learning Network To Detect Gene-Gene
Interactions From Gene Expression Data [0.7660368798066375]
本稿では,遺伝子発現データを用いた遺伝子関係の同定専用に設計された並列層深層学習ネットワークを提案する。
本モデルでは,BioGRIDとDREAM5の組み合わせによる平均AUROCスコア0.834を達成し,遺伝子間相互作用を予測する競合手法よりも優れていた。
論文 参考訳(メタデータ) (2023-10-05T15:45:53Z) - MuSe-GNN: Learning Unified Gene Representation From Multimodal
Biological Graph Data [22.938437500266847]
マルチモーダル類似性学習グラフニューラルネットワークという新しいモデルを提案する。
マルチモーダル機械学習とディープグラフニューラルネットワークを組み合わせて、単一セルシークエンシングと空間転写データから遺伝子発現を学習する。
本モデルでは, 遺伝子機能, 組織機能, 疾患, 種進化の解析のために, 統合された遺伝子表現を効率よく生成する。
論文 参考訳(メタデータ) (2023-09-29T13:33:53Z) - Genetic InfoMax: Exploring Mutual Information Maximization in
High-Dimensional Imaging Genetics Studies [50.11449968854487]
遺伝子ワイド・アソシエーション(GWAS)は、遺伝的変異と特定の形質の関係を同定するために用いられる。
画像遺伝学の表現学習は、GWASによって引き起こされる固有の課題により、ほとんど探索されていない。
本稿では,GWAS の具体的な課題に対処するために,トランスモーダル学習フレームワーク Genetic InfoMax (GIM) を提案する。
論文 参考訳(メタデータ) (2023-09-26T03:59:21Z) - Incomplete Multimodal Learning for Complex Brain Disorders Prediction [65.95783479249745]
本稿では,変換器と生成対向ネットワークを用いた不完全なマルチモーダルデータ統合手法を提案する。
アルツハイマー病神経画像イニシアチブコホートを用いたマルチモーダルイメージングによる認知変性と疾患予後の予測に本手法を適用した。
論文 参考訳(メタデータ) (2023-05-25T16:29:16Z) - Machine Learning Methods for Cancer Classification Using Gene Expression
Data: A Review [77.34726150561087]
がんは心臓血管疾患の2番目の死因である。
遺伝子発現は癌の早期発見において基本的な役割を担っている。
本研究は,機械学習を用いた癌分類における遺伝子発現解析の最近の進歩を概説する。
論文 参考訳(メタデータ) (2023-01-28T15:03:03Z) - Self-Supervised Graph Representation Learning for Neuronal Morphologies [75.38832711445421]
ラベルのないデータセットから3次元神経形態の低次元表現を学習するためのデータ駆動型アプローチであるGraphDINOを提案する。
2つの異なる種と複数の脳領域において、この方法では、専門家による手動の特徴に基づく分類と同程度に形態学的細胞型クラスタリングが得られることを示す。
提案手法は,大規模データセットにおける新しい形態的特徴や細胞型の発見を可能にする可能性がある。
論文 参考訳(メタデータ) (2021-12-23T12:17:47Z) - SimpleChrome: Encoding of Combinatorial Effects for Predicting Gene
Expression [8.326669256957352]
遺伝子のヒストン修飾表現を学習するディープラーニングモデルであるSimpleChromeを紹介します。
このモデルから得られた特徴により、遺伝子間相互作用の潜在効果と標的遺伝子の発現に対する直接遺伝子調節をよりよく理解することができます。
論文 参考訳(メタデータ) (2020-12-15T23:30:36Z) - Using ontology embeddings for structural inductive bias in gene
expression data analysis [6.587739898387445]
がん患者の遺伝子発現レベルに基づいて、診断、生存分析、治療計画を改善することができる。
本稿では,遺伝子発現データから患者の分類作業を行う機械学習システムに,遺伝子に関する生物学的知識を取り入れることを提案する。
論文 参考訳(メタデータ) (2020-11-22T12:13:29Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。