論文の概要: DebiasedDTA: Model Debiasing to Boost Drug -- Target Affinity Prediction
- arxiv url: http://arxiv.org/abs/2107.05556v1
- Date: Sun, 4 Jul 2021 19:21:37 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-18 15:51:09.132311
- Title: DebiasedDTA: Model Debiasing to Boost Drug -- Target Affinity Prediction
- Title(参考訳): debiaseddta: 薬物増加のためのモデルデバイアス -- ターゲットアフィニティ予測
- Authors: R{\i}za \"Oz\c{c}elik, Alperen Ba\u{g}, Berk At{\i}l, Arzucan
\"Ozg\"ur, Elif \"Ozk{\i}r{\i}ml{\i}
- Abstract要約: DebiasedDTAは、新しい生体分子の親和性予測を促進するために、データセットバイアスを回避する最初のモデル脱バイアス手法である。
以上の結果から,DebiasedDTAは新規生体分子間の相互作用を予測しながらモデルを向上させることができることがわかった。
実験により、DebiasedDTAは異なる入力構造とモデル構造のDTA予測モデルを増大させることができることが示された。
- 参考スコア(独自算出の注目度): 0.10499611180329804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Motivation: Computational models that accurately identify high-affinity
protein-compound pairs can accelerate drug discovery pipelines. These models
aim to learn binding mechanics through drug-target interaction datasets and use
the learned knowledge while predicting the affinity of any protein-compound
pair. However, the datasets they rely on bear misleading patterns that bias
models towards memorizing dataset-specific biomolecule properties, instead of
learning binding mechanics. Insufficiently focused on the binding mechanics,
the resulting models struggle while predicting the drug-target affinities
(DTA), especially between de novo biomolecules. Here we present DebiasedDTA,
the first model debiasing approach that avoids dataset biases in order to boost
the affinity prediction on novel biomolecules. DebiasedDTA uses ensemble
learning and weight sample adaptation for bias identification and avoidance and
is applicable to almost all existing DTA prediction models. Results: The
results show that DebiasedDTA can boost models while predicting the
interactions between novel biomolecules. Known biomolecules also benefit from
the performance boost, though the boost is amplified as the test biomolecules
become more dissimilar to the training set. The experiments also show that
DebiasedDTA can augment the DTA prediction models of different input and model
structures and can avoid biases of different sources. Availability: The source
code, the models, and the data sets are available at
https://github.com/boun-tabi/debiaseddta-reproduce Contact:
arzucan.ozgur@boun.edu.tr, elif.ozkirimli@roche.com
- Abstract(参考訳): モチベーション:高親和性タンパク質結合ペアを正確に同定する計算モデルは、薬物発見パイプラインを加速することができる。
これらのモデルは、薬物と標的の相互作用データセットを通して結合力学を学習し、タンパク質と結合したペアの親和性を予測しながら学習知識を使用する。
しかし、それらのデータセットは、学習バインディングのメカニズムではなく、データセット固有の生体分子特性を記憶するモデルに偏る誤解を招くパターンに依存している。
結合機構に十分焦点を合わせず、結果として得られたモデルは薬物標的親和性(dta、de novo biomolecules)を予測するのに苦労した。
本稿では,新しい生体分子の親和性予測を促進するために,データセットバイアスを回避する最初のモデルデバイアス手法であるdebiaseddtaを提案する。
DebiasedDTAは、バイアス識別と回避のためにアンサンブル学習と重みサンプル適応を使用し、既存のほとんどのDTA予測モデルに適用できる。
結果:debiaseddtaは,新しい生体分子間の相互作用を予測しながら,モデルを強化できることが示された。
既知の生体分子も性能向上の恩恵を受けるが、テスト生体分子がトレーニングセットとより異なっているため、その向上は増幅される。
実験はまた、DebiasedDTAが異なる入力構造とモデル構造のDTA予測モデルを増強し、異なるソースのバイアスを回避することができることを示した。
可用性: ソースコード、モデル、データセットはhttps://github.com/boun-tabi/debiaseddta-reproduce Contact: arzucan.ozgur@boun.edu.tr, elif.ozkirimli@roche.comで入手できる。
関連論文リスト
- Extracting Training Data from Unconditional Diffusion Models [76.85077961718875]
拡散確率モデル(DPM)は、生成人工知能(AI)の主流モデルとして採用されている。
本研究の目的は,1) 理論解析のための記憶量,2) 情報ラベルとランダムラベルを用いた条件記憶量,3) 記憶量測定のための2つのより良い評価指標を用いて,DPMにおける記憶量の理論的理解を確立することである。
提案手法は,理論解析に基づいて,SIDE (textbfSurrogate condItional Data extract) と呼ばれる新しいデータ抽出手法を提案する。
論文 参考訳(メタデータ) (2024-06-18T16:20:12Z) - Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals [91.59906995214209]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - Associative Learning Mechanism for Drug-Target Interaction Prediction [6.107658437700639]
薬物-標的親和性(DTA)は薬物-標的相互作用(DTI)の強さを表す
従来の手法では、DTA予測プロセスの解釈可能性に欠けていた。
本稿では,対話型学習と自動エンコーダ機構を備えたDTA予測手法を提案する。
論文 参考訳(メタデータ) (2022-05-24T14:25:28Z) - Pseudo Bias-Balanced Learning for Debiased Chest X-ray Classification [57.53567756716656]
本研究では, バイアスラベルを正確に把握せず, 脱バイアス胸部X線診断モデルの開発について検討した。
本稿では,まずサンプルごとのバイアスラベルをキャプチャし,予測する新しいアルゴリズム,擬似バイアスバランス学習を提案する。
提案手法は他の最先端手法よりも一貫した改善を実現した。
論文 参考訳(メタデータ) (2022-03-18T11:02:18Z) - Bayesian neural network with pretrained protein embedding enhances
prediction accuracy of drug-protein interaction [3.499870393443268]
ディープラーニングのアプローチは、人間による試行錯誤なしに薬物とタンパク質の相互作用を予測できる。
本稿では,小さなラベル付きデータセットで優れた性能を示すディープラーニングフレームワークを構築するための2つの手法を提案する。
論文 参考訳(メタデータ) (2020-12-15T10:24:34Z) - GEFA: Early Fusion Approach in Drug-Target Affinity Prediction [28.695523040015164]
本稿では,結合効果により対象表現の変化に対処するアテンション機構を備えた新しいグラフイングラフニューラルネットワークを提案する。
薬物は原子のグラフとしてモデル化され、残基-ドラッグ複合体の大きなグラフのノードとして機能する。
また、文脈化されたタンパク質表現を学習する最近の取り組みにより、事前訓練されたタンパク質表現を使用する。
論文 参考訳(メタデータ) (2020-09-25T11:54:15Z) - Towards Robustifying NLI Models Against Lexical Dataset Biases [94.79704960296108]
本稿では、語彙的データセットバイアスに対するモデル強化のための、データレベルとモデルレベルのデバイアス法の両方について検討する。
まず、データ拡張と拡張によってデータセットをデバイアスするが、この方法でモデルバイアスを完全に除去することはできないことを示す。
第2のアプローチでは、バーオブワードのサブモデルを使用して、バイアスを悪用する可能性のある機能をキャプチャし、元のモデルがこれらのバイアス付き機能を学ぶのを防ぐ。
論文 参考訳(メタデータ) (2020-05-10T17:56:10Z) - Debiasing Skin Lesion Datasets and Models? Not So Fast [17.668005682385175]
データリスク学習のバイアスから学んだモデルは、同じデータから。
モデルが現実世界の状況では見つからない急激な相関関係を学習すると、医療上の決定などの重要なタスクへの展開は破滅的なものになる。
将来有望な研究を示唆する興味深い結果にもかかわらず、現在の脱バイアス法は、スキン・レジオンモデルのバイアス問題を解決する準備ができていないことが判明した。
論文 参考訳(メタデータ) (2020-04-23T21:07:49Z) - Enzyme promiscuity prediction using hierarchy-informed multi-label
classification [6.6828647808002595]
本稿では,983個の異なる酵素が問合せ分子と相互作用しうるかを予測するための機械学習モデルを提案し,評価する。
いくつかの相互作用は自然選択に起因し、酵素の天然基質を含む。
しかし、相互作用の大部分は非天然基質を含んでおり、プロミスキュラスな酵素活性を反映している。
論文 参考訳(メタデータ) (2020-02-18T01:39:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。