論文の概要: A semi-supervised learning framework for quantitative structure-activity
regression modelling
- arxiv url: http://arxiv.org/abs/2001.01924v1
- Date: Tue, 7 Jan 2020 07:56:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-13 21:12:26.765406
- Title: A semi-supervised learning framework for quantitative structure-activity
regression modelling
- Title(参考訳): 定量的構造活性回帰モデリングのための半教師付き学習枠組み
- Authors: Oliver P Watson, Isidro Cortes-Ciriano, James A Watson
- Abstract要約: 本研究では, テスト化合物とトレーニングデータとの類似性を考慮した予測を行い, レポート選択バイアスの調整を行うことが可能であることを示す。
この手法について,GlaxoSmithKline が報告した大規模化合物の集合に関する公開構造活性データを用いて述べる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Supervised learning models, also known as quantitative structure-activity
regression (QSAR) models, are increasingly used in assisting the process of
preclinical, small molecule drug discovery. The models are trained on data
consisting of a finite dimensional representation of molecular structures and
their corresponding target specific activities. These models can then be used
to predict the activity of previously unmeasured novel compounds. In this work
we address two problems related to this approach. The first is to estimate the
extent to which the quality of the model predictions degrades for compounds
very different from the compounds in the training data. The second is to adjust
for the screening dependent selection bias inherent in many training data sets.
In the most extreme cases, only compounds which pass an activity-dependent
screening are reported. By using a semi-supervised learning framework, we show
that it is possible to make predictions which take into account the similarity
of the testing compounds to those in the training data and adjust for the
reporting selection bias. We illustrate this approach using publicly available
structure-activity data on a large set of compounds reported by GlaxoSmithKline
(the Tres Cantos AntiMalarial Set) to inhibit in vitro P. falciparum growth.
- Abstract(参考訳): 教師付き学習モデル、または量的構造活性回帰モデル(qsarモデル)は、前臨床的小分子薬物発見の過程を補助するためにますます使われている。
モデルは、分子構造の有限次元表現とその対応する標的特定活性からなるデータに基づいて訓練される。
これらのモデルを用いて、未測定の新規化合物の活性を予測することができる。
この研究では、このアプローチに関連する2つの問題に対処する。
第一は、モデル予測の品質がトレーニングデータ中の化合物と非常に異なる化合物に対して劣化する程度を推定することである。
2つ目は、多くのトレーニングデータセットに固有のスクリーニング依存選択バイアスを調整することである。
最も極端な場合、活性依存スクリーニングを通過する化合物のみが報告される。
半教師付き学習フレームワークを用いて,テスト化合物とトレーニングデータの類似性を考慮した予測と,報告選択バイアスの調整が可能であることを示す。
本手法は,GlaxoSmithKline (The Tres Cantos AntiMalarial Set) が報告した大規模化合物の公開構造活性データを用いて,in vitroでのP. falciparum成長を抑制する。
関連論文リスト
- SMILES-Mamba: Chemical Mamba Foundation Models for Drug ADMET Prediction [16.189335444981353]
小分子の薬物の吸収、分布、代謝、排出、毒性を予測することは安全性と有効性を確保するために重要である。
本稿では,ラベル付きデータとラベル付きデータの両方を活用する2段階モデルを提案する。
その結果,SMILES-Mambaは22のADMETデータセットの競合性能を示し,14のタスクで最高スコアを達成した。
論文 参考訳(メタデータ) (2024-08-11T04:53:12Z) - Seeing Unseen: Discover Novel Biomedical Concepts via
Geometry-Constrained Probabilistic Modeling [53.7117640028211]
同定された問題を解決するために,幾何制約付き確率的モデリング処理を提案する。
構成された埋め込み空間のレイアウトに適切な制約を課すために、重要な幾何学的性質のスイートを組み込む。
スペクトルグラフ理論法は、潜在的な新規クラスの数を推定するために考案された。
論文 参考訳(メタデータ) (2024-03-02T00:56:05Z) - Measuring and Improving Attentiveness to Partial Inputs with Counterfactuals [91.59906995214209]
我々は,新しい評価手法であるCAT(Facterfactual Attentiveness Test)を提案する。
CATは、入力の一部を別の例から別の例に置き換えることで、予測を変更する注意深いモデルを期待することで、反事実を使用する。
実験データの精度が向上する一方, GPT3 は実演回数の増加により注意力の低下がみられた。
論文 参考訳(メタデータ) (2023-11-16T06:27:35Z) - Unlearning Spurious Correlations in Chest X-ray Classification [4.039245878626345]
我々は、Covid-19胸部X線データセットを用いてディープラーニングモデルをトレーニングする。
このデータセットが、意図しない境界領域によって、どのようにして急激な相関をもたらすかを示す。
XBLは、モデル説明を利用して、対話的に引き起こされる突発的相関を利用して、解釈可能性を超えたディープラーニングアプローチである。
論文 参考訳(メタデータ) (2023-08-02T12:59:10Z) - Stubborn Lexical Bias in Data and Models [50.79738900885665]
我々は、データに基づいてトレーニングされたモデルに、データのスプリアスパターンが現れるかどうかを調べるために、新しい統計手法を用いる。
トレーニングデータに*reweight*に最適化アプローチを適用し、数千のスプリアス相関を低減します。
驚くべきことに、この方法ではトレーニングデータの語彙バイアスを低減できますが、トレーニングされたモデルで対応するバイアスの強い証拠がまだ見つかっていません。
論文 参考訳(メタデータ) (2023-06-03T20:12:27Z) - Drug Synergistic Combinations Predictions via Large-Scale Pre-Training
and Graph Structure Learning [82.93806087715507]
薬物併用療法は、より有効で安全性の低い疾患治療のための確立された戦略である。
ディープラーニングモデルは、シナジスティックな組み合わせを発見する効率的な方法として登場した。
我々のフレームワークは、他のディープラーニングベースの手法と比較して最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-01-14T15:07:43Z) - MolE: a molecular foundation model for drug discovery [0.2802437011072858]
MolEは分子基盤モデルであり、DeBERTaアーキテクチャを分子グラフに適応させる。
Therapeutic Data Commons に含まれる 22 の ADMET タスクのうち 9 つのタスクに対して, 微調整プリトレーニングした MolE が最先端の結果を得ることを示す。
論文 参考訳(メタデータ) (2022-11-03T21:22:05Z) - Meaningful machine learning models and machine-learned pharmacophores
from fragment screening campaigns [0.0]
機械学習モデルは50以上のフラグメントスクリーニングキャンペーンから派生しています。
MLモデルがバインドを成功させる上で重要であると考えるものについて、物理的に解釈可能で検証可能な表現を提供する。
MLモデルが提案する重要な分子構造と,手動で割り当てた分子構造との間には,よく一致している。
論文 参考訳(メタデータ) (2022-03-25T18:08:55Z) - Select-ProtoNet: Learning to Select for Few-Shot Disease Subtype
Prediction [55.94378672172967]
本研究は, 類似患者のサブグループを同定し, 数発の疾患のサブタイプ予測問題に焦点を当てた。
新しいモデルを開発するためにメタラーニング技術を導入し、関連する臨床課題から共通の経験や知識を抽出する。
我々の新しいモデルは、単純だが効果的なメタ学習マシンであるPrototypeal Networkと呼ばれる、慎重に設計されたメタラーナーに基づいて構築されている。
論文 参考訳(メタデータ) (2020-09-02T02:50:30Z) - Ensemble Transfer Learning for the Prediction of Anti-Cancer Drug
Response [49.86828302591469]
本稿では,抗がん剤感受性の予測にトランスファーラーニングを適用した。
我々は、ソースデータセット上で予測モデルをトレーニングし、ターゲットデータセット上でそれを洗練する古典的な転送学習フレームワークを適用した。
アンサンブル転送学習パイプラインは、LightGBMと異なるアーキテクチャを持つ2つのディープニューラルネットワーク(DNN)モデルを使用して実装されている。
論文 参考訳(メタデータ) (2020-05-13T20:29:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。