論文の概要: Understanding the Performance of Knowledge Graph Embeddings in Drug
Discovery
- arxiv url: http://arxiv.org/abs/2105.10488v1
- Date: Mon, 17 May 2021 11:39:54 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-25 03:08:17.638414
- Title: Understanding the Performance of Knowledge Graph Embeddings in Drug
Discovery
- Title(参考訳): 薬物発見における知識グラフ埋め込みの性能理解
- Authors: Stephen Bonner and Ian P Barrett and Cheng Ye and Rowan Swiers and Ola
Engkvist and William L Hamilton
- Abstract要約: 知識グラフ(KG)と関連する知識グラフ埋め込み(KGE)モデルは、最近、薬物発見の文脈で研究され始めている。
本研究では, 薬物発見指向KGにおけるKGEモデルの予測性能について, 何千回もの実験を通して検討した。
結果から,これらの要因が性能に重大な影響を与え,モデルランキングにも影響を及ぼす可能性が示唆された。
- 参考スコア(独自算出の注目度): 14.839673015887275
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Knowledge Graphs (KG) and associated Knowledge Graph Embedding (KGE) models
have recently begun to be explored in the context of drug discovery and have
the potential to assist in key challenges such as target identification. In the
drug discovery domain, KGs can be employed as part of a process which can
result in lab-based experiments being performed, or impact on other decisions,
incurring significant time and financial costs and most importantly, ultimately
influencing patient healthcare. For KGE models to have impact in this domain, a
better understanding of not only of performance, but also the various factors
which determine it, is required.
In this study we investigate, over the course of many thousands of
experiments, the predictive performance of five KGE models on two public drug
discovery-oriented KGs. Our goal is not to focus on the best overall model or
configuration, instead we take a deeper look at how performance can be affected
by changes in the training setup, choice of hyperparameters, model parameter
initialisation seed and different splits of the datasets. Our results highlight
that these factors have significant impact on performance and can even affect
the ranking of models. Indeed these factors should be reported along with model
architectures to ensure complete reproducibility and fair comparisons of future
work, and we argue this is critical for the acceptance of use, and impact of
KGEs in a biomedical setting. To aid reproducibility of our own work, we
release all experimentation code.
- Abstract(参考訳): 知識グラフ(KG)と関連する知識グラフ埋め込み(KGE)モデルは、最近、薬物発見の文脈で研究され始めており、ターゲット識別などの重要な課題に対処する可能性がある。
薬物発見領域では、KGは、ラボベースの実験が行われ、あるいは他の決定に影響を与え、かなりの時間と金銭的コスト、そして最も重要なことは、最終的に患者医療に影響を与えるプロセスの一部として使用できる。
KGEモデルがこの領域に影響を及ぼすためには、パフォーマンスだけでなく、それを決定するさまざまな要因についてもより深く理解する必要がある。
本研究では,2つの薬品発見指向kgs上での5kgeモデルの予測性能について,数千の実験を通して検討した。
私たちの目標は、最高のモデルや設定に集中するのではなく、トレーニング設定の変更、ハイパーパラメータの選択、モデルパラメータの初期化シード、データセットのさまざまな分割によるパフォーマンスへの影響について、より深く検討することにあります。
結果から,これらの要因が性能に重大な影響を与え,モデルランキングにも影響を及ぼす可能性が示唆された。
実際、これらの要因をモデルアーキテクチャとともに報告して、将来の作業の再現性と公正な比較を確実にするべきである。
自分たちの作業の再現性を支援するため、実験コードをすべてリリースします。
関連論文リスト
- Explaining Human Activity Recognition with SHAP: Validating Insights with Perturbation and Quantitative Measures [0.1398098625978622]
本稿では SHapley Additive exPlanations を用いてグラフ畳み込みネットワーク(GCN)の意思決定プロセスを説明する。
我々は、脳性麻痺(CP)分類のための2つの実世界のデータセットと、広く使われているNTU RGB+D 60行動認識データセットについて、SHAPを用いて説明する。
どちらのデータセットでも、SHAPによって重要視されるボディキーポイントが、正確性、特異性、感度の指標に最も大きな影響を与えることが示されている。
論文 参考訳(メタデータ) (2024-11-06T07:28:57Z) - Data-Centric Long-Tailed Image Recognition [49.90107582624604]
ロングテールモデルは高品質なデータに対する強い需要を示している。
データ中心のアプローチは、モデルパフォーマンスを改善するために、データの量と品質の両方を強化することを目的としています。
現在、情報強化の有効性を説明するメカニズムに関する研究が不足している。
論文 参考訳(メタデータ) (2023-11-03T06:34:37Z) - Sensitivity, Performance, Robustness: Deconstructing the Effect of
Sociodemographic Prompting [64.80538055623842]
社会デマトグラフィープロンプトは、特定の社会デマトグラフィープロファイルを持つ人間が与える答えに向けて、プロンプトベースのモデルの出力を操縦する技術である。
ソシオデマトグラフィー情報はモデル予測に影響を及ぼし、主観的NLPタスクにおけるゼロショット学習を改善するのに有用であることを示す。
論文 参考訳(メタデータ) (2023-09-13T15:42:06Z) - Benchmarking Heterogeneous Treatment Effect Models through the Lens of
Interpretability [82.29775890542967]
治療のパーソナライズされた効果を見積もるのは複雑だが、普及している問題である。
ヘテロジニアス処理効果推定に関する機械学習文献の最近の進歩は、洗練されたが不透明なツールの多くを生み出した。
我々は、ポストホックな特徴重要度法を用いて、モデルの予測に影響を及ぼす特徴を特定する。
論文 参考訳(メタデータ) (2022-06-16T17:59:05Z) - An Empirical Investigation of Commonsense Self-Supervision with
Knowledge Graphs [67.23285413610243]
大規模知識グラフから抽出した情報に基づく自己監督は、言語モデルの一般化を改善することが示されている。
本研究では,言語モデルに適用可能な合成データを生成するための知識サンプリング戦略とサイズの影響について検討する。
論文 参考訳(メタデータ) (2022-05-21T19:49:04Z) - Data Augmentation for Electrocardiograms [2.8498944632323755]
本研究では,データスカース心電図予測問題の性能向上にデータ拡張法が有効かどうかを検討する。
本稿では,タスクごとに最適化されたフレキシブルな拡張ポリシーを定義する新しい方法であるTaskAugを紹介する。
実験では、TaskAugが以前の作業と競合するか、改善していることがわかった。
論文 参考訳(メタデータ) (2022-04-09T02:19:55Z) - Variational Auto-Encoder Architectures that Excel at Causal Inference [26.731576721694648]
観測データから因果効果を推定することは、多くの種類の決定を下す上で重要である。
この課題に対処する1つのアプローチは、データの基礎となる要素の分解された表現を学習することである。
本稿では,変分オートエンコーダの最近の進歩を基盤とした生成的アプローチを提案する。
論文 参考訳(メタデータ) (2021-11-11T22:37:43Z) - An Empirical Study on Neural Keyphrase Generation [32.98420137439619]
近年、神経キーフレーズ生成(KPG)が盛んに行われている。
KPGタスクのモデル性能は、深層学習研究の進展とともに大幅に向上した。
論文 参考訳(メタデータ) (2020-09-22T00:11:32Z) - Causal Inference using Gaussian Processes with Structured Latent
Confounders [9.8164690355257]
本稿では,この構造を持つ助成金を半パラメトリックにモデル化し,因果効果の評価を改善する方法について述べる。
鍵となる革新は階層的ベイズモデル、構造化潜在共同設立者(GP-SLC)を持つガウス過程、楕円スライスサンプリングに基づくモンテカルロ推論アルゴリズムである。
論文 参考訳(メタデータ) (2020-07-14T15:45:28Z) - Influence Functions in Deep Learning Are Fragile [52.31375893260445]
影響関数は、テスト時間予測におけるサンプルの効果を近似する。
影響評価は浅いネットワークでは かなり正確です
ヘッセン正則化は、高品質な影響推定を得るために重要である。
論文 参考訳(メタデータ) (2020-06-25T18:25:59Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。