論文の概要: Adaptive Invariance for Molecule Property Prediction
- arxiv url: http://arxiv.org/abs/2005.03004v1
- Date: Tue, 5 May 2020 19:47:20 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-06 13:50:24.518652
- Title: Adaptive Invariance for Molecule Property Prediction
- Title(参考訳): 分子特性予測のための適応不変性
- Authors: Wengong Jin, Regina Barzilay, Tommi Jaakkola
- Abstract要約: 異種データを超えた一般化や外挿が可能な予測器を学習するための新しい手法を提案する。
提案手法は,最近提案された不変リスク最小化に基づいて拡張する。
我々の予測器は最先端の伝達学習手法をかなりの差で上回っている。
- 参考スコア(独自算出の注目度): 38.637412590671865
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Effective property prediction methods can help accelerate the search for
COVID-19 antivirals either through accurate in-silico screens or by effectively
guiding on-going at-scale experimental efforts. However, existing prediction
tools have limited ability to accommodate scarce or fragmented training data
currently available. In this paper, we introduce a novel approach to learn
predictors that can generalize or extrapolate beyond the heterogeneous data.
Our method builds on and extends recently proposed invariant risk minimization,
adaptively forcing the predictor to avoid nuisance variation. We achieve this
by continually exercising and manipulating latent representations of molecules
to highlight undesirable variation to the predictor. To test the method we use
a combination of three data sources: SARS-CoV-2 antiviral screening data,
molecular fragments that bind to SARS-CoV-2 main protease and large screening
data for SARS-CoV-1. Our predictor outperforms state-of-the-art transfer
learning methods by significant margin. We also report the top 20 predictions
of our model on Broad drug repurposing hub.
- Abstract(参考訳): 効果的な特性予測手法は、正確なインシリコスクリーンを通して、または大規模な実験を効果的に誘導することによって、covid-19アンチウイルスの探索を加速するのに役立つ。
しかし、既存の予測ツールは、現在利用可能なトレーニングデータの不足や断片化に対応する能力に制限がある。
本稿では,異種データを超えた一般化や外挿が可能な予測器の学習手法を提案する。
提案手法は,最近提案された不変リスク最小化に基づいて,予測器にニュアンス変動を回避させる。
我々は,分子の潜在表現を継続的に操作し,予測器に対する望ましくない変動を強調することでこれを達成する。
この方法をテストするために,SARS-CoV-2アンチウイルススクリーニングデータ,SARS-CoV-2メインプロテアーゼに結合する分子断片,SARS-CoV-1の大規模スクリーニングデータという3つのデータソースの組み合わせを用いる。
我々の予測器は最先端の伝達学習手法をかなりの差で上回る。
また,Broad drug repurposing hubにおけるモデル上位20の予測について報告する。
関連論文リスト
- Permutation invariant multi-output Gaussian Processes for drug combination prediction in cancer [2.1145050293719745]
がんにおける線量応答予測は、機械学習における活発な応用分野である。
目標は、実験的な設計をガイドしたり、治療決定を知らせるために使用できる正確な予測モデルを開発することである。
論文 参考訳(メタデータ) (2024-06-28T18:28:38Z) - MedDiffusion: Boosting Health Risk Prediction via Diffusion-based Data
Augmentation [58.93221876843639]
本稿では,MedDiffusion という,エンドツーエンドの拡散に基づくリスク予測モデルを提案する。
トレーニング中に合成患者データを作成し、サンプルスペースを拡大することで、リスク予測性能を向上させる。
ステップワイズ・アテンション・メカニズムを用いて患者の来訪者間の隠れた関係を識別し、高品質なデータを生成する上で最も重要な情報をモデルが自動的に保持することを可能にする。
論文 参考訳(メタデータ) (2023-10-04T01:36:30Z) - Objective-Agnostic Enhancement of Molecule Properties via Multi-Stage
VAE [1.3597551064547502]
変異オートエンコーダ(VAE)は医薬品発見の一般的な方法であり、その性能を改善するために様々なアーキテクチャやパイプラインが提案されている。
VAEアプローチは、データが高次元の周囲空間に埋め込まれた低次元多様体上にあるとき、多様体の回復不良に悩まされることが知られている。
本稿では, 合成データセット上での多様体回復を向上する多段階VAEアプローチを創薬分野に適用することを検討する。
論文 参考訳(メタデータ) (2023-08-24T20:22:22Z) - ALMERIA: Boosting pairwise molecular contrasts with scalable methods [0.0]
ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。
大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。
分子活性予測の最先端性能を示す実験を行った。
論文 参考訳(メタデータ) (2023-04-28T16:27:06Z) - Improving the Adversarial Robustness of NLP Models by Information
Bottleneck [112.44039792098579]
非破壊機能は敵によって容易に操作でき、NLPモデルを騙すことができる。
本研究では,情報ボトルネック理論を用いて,タスク固有のロバストな特徴を捕捉し,非ロバストな特徴を除去する可能性を検討する。
情報ボトルネックに基づく手法を用いてトレーニングしたモデルでは,ロバストな精度で大幅な改善が達成できることを示す。
論文 参考訳(メタデータ) (2022-06-11T12:12:20Z) - Taming Overconfident Prediction on Unlabeled Data from Hindsight [50.9088560433925]
ラベルのないデータに対する予測の不確実性を最小化することは、半教師付き学習において優れた性能を達成するための鍵となる要素である。
本稿では,アダプティブシャーニング(Adaptive Sharpening, ADS)と呼ばれる2つのメカニズムを提案する。
ADSは、プラグインにすることで最先端のSSLメソッドを大幅に改善する。
論文 参考訳(メタデータ) (2021-12-15T15:17:02Z) - Predicting the Binding of SARS-CoV-2 Peptides to the Major
Histocompatibility Complex with Recurrent Neural Networks [0.40040974874482094]
我々は、繰り返しニューラルネットワークに基づく概念的にシンプルな予測アルゴリズムであるUSMPepを適応し、拡張する。
最近リリースされたSARS-CoV-2データセットの性能をバインディング安定性測定で評価します。
論文 参考訳(メタデータ) (2021-04-16T17:16:35Z) - Bootstrapping Your Own Positive Sample: Contrastive Learning With
Electronic Health Record Data [62.29031007761901]
本稿では,新しいコントラスト型正規化臨床分類モデルを提案する。
EHRデータに特化した2つのユニークなポジティブサンプリング戦略を紹介します。
私たちのフレームワークは、現実世界のCOVID-19 EHRデータの死亡リスクを予測するために、競争の激しい実験結果をもたらします。
論文 参考訳(メタデータ) (2021-04-07T06:02:04Z) - STELAR: Spatio-temporal Tensor Factorization with Latent Epidemiological
Regularization [76.57716281104938]
我々は,多くの地域の流行傾向を同時に予測するテンソル法を開発した。
stelarは離散時間差分方程式のシステムを通じて潜在時間正規化を組み込むことで長期予測を可能にする。
我々は、カウンティレベルと州レベルのCOVID-19データの両方を用いて実験を行い、このモデルが流行の興味深い潜伏パターンを識別できることを示します。
論文 参考訳(メタデータ) (2020-12-08T21:21:47Z) - Deep Learning Models for Early Detection and Prediction of the spread of
Novel Coronavirus (COVID-19) [4.213555705835109]
SARS-CoV2は世界的な普及を続けており、パンデミックとなっている。
新型コロナウイルスの感染拡大を予測するために、機械学習技術を開発する必要がある。
論文 参考訳(メタデータ) (2020-07-29T10:14:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。