論文の概要: Implications of Topological Imbalance for Representation Learning on
Biomedical Knowledge Graphs
- arxiv url: http://arxiv.org/abs/2112.06567v1
- Date: Mon, 13 Dec 2021 11:20:36 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-14 16:31:05.785495
- Title: Implications of Topological Imbalance for Representation Learning on
Biomedical Knowledge Graphs
- Title(参考訳): 生物医学的知識グラフにおける表現学習における位相的不均衡の意義
- Authors: Stephen Bonner, Ufuk Kirik, Ola Engkvist, Jian Tang, Ian P Barrett
- Abstract要約: 知識グラフ埋め込みモデルが構造的不均衡によってどのように影響を受けるかを示す。
グラフトポロジを摂動させて、ランダムで生物学的に無意味な情報によって遺伝子ランクを人工的に変化させる方法を示す。
- 参考スコア(独自算出の注目度): 16.566710222582618
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Improving on the standard of care for diseases is predicated on better
treatments, which in turn relies on finding and developing new drugs. However,
drug discovery is a complex and costly process. Adoption of methods from
machine learning has given rise to creation of drug discovery knowledge graphs
which utilize the inherent interconnected nature of the domain. Graph-based
data modelling, combined with knowledge graph embeddings provide a more
intuitive representation of the domain and are suitable for inference tasks
such as predicting missing links. One such example would be producing ranked
lists of likely associated genes for a given disease, often referred to as
target discovery. It is thus critical that these predictions are not only
pertinent but also biologically meaningful. However, knowledge graphs can be
biased either directly due to the underlying data sources that are integrated
or due to modeling choices in the construction of the graph, one consequence of
which is that certain entities can get topologically overrepresented. We show
how knowledge graph embedding models can be affected by this structural
imbalance, resulting in densely connected entities being highly ranked no
matter the context. We provide support for this observation across different
datasets, models and predictive tasks. Further, we show how the graph topology
can be perturbed to artificially alter the rank of a gene via random,
biologically meaningless information. This suggests that such models can be
more influenced by the frequency of entities rather than biological information
encoded in the relations, creating issues when entity frequency is not a true
reflection of underlying data. Our results highlight the importance of data
modeling choices and emphasizes the need for practitioners to be mindful of
these issues when interpreting model outputs and during knowledge graph
composition.
- Abstract(参考訳): 疾患の治療基準の改善は、より良い治療を前提としており、新しい薬物の発見と開発に依存している。
しかし、薬物発見は複雑でコストのかかるプロセスである。
機械学習からの手法の採用は、ドメインの固有の相互接続性を利用する薬物発見知識グラフの作成につながった。
グラフベースのデータモデリングと知識グラフ埋め込みはドメインのより直感的な表現を提供し、欠落したリンクの予測のような推論タスクに適している。
そのような例の1つは、特定の疾患に関連する可能性のある遺伝子のランクリストを作成し、しばしば標的発見と呼ばれる。
したがって、これらの予測は関連するだけでなく生物学的にも有意義である。
しかしながら、ナレッジグラフは、統合された基盤となるデータソースによって直接バイアスされるか、あるいはグラフの構築におけるモデリングの選択によって偏り、その結果としてあるエンティティが位相的に過剰に表現される可能性がある。
本研究では,この構造的不均衡によって知識グラフ埋め込みモデルがどのように影響を受けるかを示す。
この観察をさまざまなデータセット、モデル、予測タスクにわたってサポートしています。
さらに、このグラフトポロジが、ランダムで生物学的に無意味な情報によって、遺伝子ランクを人工的に変更できることを示す。
このことは、そのようなモデルは、関係にエンコードされた生物学的情報よりも、エンティティの頻度に影響され、エンティティの頻度が基礎となるデータの真の反映ではない場合に問題を引き起こすことを示唆する。
本研究は,データモデリング選択の重要性を強調し,モデルアウトプットと知識グラフ合成の間において,これらの問題に留意することの必要性を強調する。
関連論文リスト
- Learning to refine domain knowledge for biological network inference [2.209921757303168]
摂動実験により、生物学者は興味のある変数間の因果関係を発見することができる。
これらのデータの空間性と高次元性は因果構造学習アルゴリズムに重大な課題をもたらす。
そこで本研究では,データ観測に基づくドメイン知識の補修アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-18T12:53:23Z) - Tertiary Lymphoid Structures Generation through Graph-based Diffusion [54.37503714313661]
本研究では,最先端のグラフベース拡散モデルを用いて生物学的に意味のある細胞グラフを生成する。
本研究では, グラフ拡散モデルを用いて, 3次リンパ構造(TLS)の分布を正確に学習できることを示す。
論文 参考訳(メタデータ) (2023-10-10T14:37:17Z) - A Comparative Study of Population-Graph Construction Methods and Graph
Neural Networks for Brain Age Regression [48.97251676778599]
医用画像では、人口グラフが有望な結果を示しており、主に分類作業に向けられている。
人口グラフの抽出は非自明な作業であり、グラフニューラルネットワーク(GNN)の性能に大きな影響を及ぼす可能性がある
本研究では,有意義なグラフ構築の重要性を強調し,異なる集団グラフ構築手法による実験を行う。
論文 参考訳(メタデータ) (2023-09-26T10:30:45Z) - Probing Graph Representations [77.7361299039905]
グラフ表現でキャプチャされた意味のある情報の量を定量化するために、探索フレームワークを使用します。
本研究は, グラフモデルにおける帰納的バイアスを理解するための探索の可能性を示すものである。
グラフベースモデルを評価する上で有用な診断ツールとして,探索を提唱する。
論文 参考訳(メタデータ) (2023-03-07T14:58:18Z) - Analysis of Drug repurposing Knowledge graphs for Covid-19 [0.0]
本研究は、薬物再資源知識グラフ(DRKG)を用いた新型コロナウイルスの候補薬剤のセットを提案する。
DRKGは、大量のオープンソースバイオメディカル知識を用いて構築された生物学的知識グラフである。
ノードと関係埋め込みは知識グラフ埋め込みモデルとニューラルネットワークおよび注意関連モデルを用いて学習される。
論文 参考訳(メタデータ) (2022-12-07T19:14:17Z) - Graph-in-Graph (GiG): Learning interpretable latent graphs in
non-Euclidean domain for biological and healthcare applications [52.65389473899139]
グラフは、医療領域において、非ユークリッドな非ユークリッドデータをユビキタスに表現し、分析するための強力なツールである。
近年の研究では、入力データサンプル間の関係を考慮すると、下流タスクに正の正の正則化効果があることが示されている。
タンパク質分類と脳イメージングのためのニューラルネットワークアーキテクチャであるGraph-in-Graph(GiG)を提案する。
論文 参考訳(メタデータ) (2022-04-01T10:01:37Z) - Biomedical Knowledge Graph Refinement and Completion using Graph
Representation Learning and Top-K Similarity Measure [1.4660617536303606]
本研究は,統合生物医学知識グラフ chem2bio2rd の離散表現の学習を実証する。
学習した埋め込みベクトル間の単純なトップKコサイン類似度尺度を用いて知識グラフの補完と洗練を行う。
論文 参考訳(メタデータ) (2020-12-18T22:19:57Z) - Out-of-Sample Representation Learning for Multi-Relational Graphs [8.956321788625894]
非分散知識グラフに対するアウトオブサンプル表現学習問題について検討する。
このタスクのためのベンチマークデータセットを作成し、いくつかのモデルとベースラインを開発し、提案したモデルとベースラインの実証分析と比較を提供する。
論文 参考訳(メタデータ) (2020-04-28T00:53:01Z) - A Heterogeneous Graph with Factual, Temporal and Logical Knowledge for
Question Answering Over Dynamic Contexts [81.4757750425247]
動的テキスト環境における質問応答について検討する。
構築したグラフ上にグラフニューラルネットワークを構築し,エンドツーエンドでモデルをトレーニングする。
論文 参考訳(メタデータ) (2020-04-25T04:53:54Z) - Dynamic Graph Correlation Learning for Disease Diagnosis with Incomplete
Labels [66.57101219176275]
胸部X線画像上の疾患診断は,多ラベル分類の課題である。
本稿では,異なる疾患間の相互依存を調査する新たな視点を提示する病的診断グラフ畳み込みネットワーク(DD-GCN)を提案する。
本手法は,相関学習のための動的隣接行列を用いた特徴写像上のグラフを初めて構築する手法である。
論文 参考訳(メタデータ) (2020-02-26T17:10:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。