論文の概要: ALMERIA: Boosting pairwise molecular contrasts with scalable methods
- arxiv url: http://arxiv.org/abs/2305.13254v1
- Date: Fri, 28 Apr 2023 16:27:06 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-28 05:21:39.429259
- Title: ALMERIA: Boosting pairwise molecular contrasts with scalable methods
- Title(参考訳): ALMERIA: スケーラブルな手法によるペアワイズ分子コントラストの増強
- Authors: Rafael Mena-Yedra, Juana L. Redondo, Horacio P\'erez-S\'anchez, Pilar
M. Ortigosa
- Abstract要約: ALMERIAは、一対の分子コントラストに基づく化合物の類似性と活性予測を推定するためのツールである。
大量のデータを利用するスケーラブルなソフトウェアと手法を使って実装されている。
分子活性予測の最先端性能を示す実験を行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Searching for potential active compounds in large databases is a necessary
step to reduce time and costs in modern drug discovery pipelines. Such virtual
screening methods seek to provide predictions that allow the search space to be
narrowed down. Although cheminformatics has made great progress in exploiting
the potential of available big data, caution is needed to avoid introducing
bias and provide useful predictions with new compounds. In this work, we
propose the decision-support tool ALMERIA (Advanced Ligand Multiconformational
Exploration with Robust Interpretable Artificial Intelligence) for estimating
compound similarities and activity prediction based on pairwise molecular
contrasts while considering their conformation variability. The methodology
covers the entire pipeline from data preparation to model selection and
hyperparameter optimization. It has been implemented using scalable software
and methods to exploit large volumes of data -- in the order of several
terabytes -- , offering a very quick response even for a large batch of
queries. The implementation and experiments have been performed in a
distributed computer cluster using a benchmark, the public access DUD-E
database. In addition to cross-validation, detailed data split criteria have
been used to evaluate the models on different data partitions to assess their
true generalization ability with new compounds. Experiments show
state-of-the-art performance for molecular activity prediction (ROC AUC:
$0.99$, $0.96$, $0.87$), proving that the chosen data representation and
modeling have good properties to generalize. Molecular conformations --
prediction performance and sensitivity analysis -- have also been evaluated.
Finally, an interpretability analysis has been performed using the SHAP method.
- Abstract(参考訳): 大規模データベースにおける潜在的活性化合物の探索は、現代の薬物発見パイプラインの時間とコストを削減するための必要なステップである。
このような仮想スクリーニング手法は、探索空間を狭めるような予測を提供する。
cheminformaticsは利用可能なビッグデータの可能性を活用するために大きな進歩を遂げているが、バイアスの導入を避け、新しい化合物で有用な予測を提供するために注意が必要である。
本研究では,コンフォメーション変動を考慮した分子コントラストに基づく複合的類似性と活動予測を推定するための意思決定支援ツールalmeria(advanced ligand multiconformational exploration with robust interpretable artificial intelligence)を提案する。
この方法論は、データ準備からモデル選択、ハイパーパラメータ最適化まで、パイプライン全体をカバーする。
スケーラブルなソフトウェアとメソッドを使って、数テラバイトのオーダーで、大量のデータを利用するように実装されている。
実装と実験は、ベンチマークであるパブリックアクセスDUD-Eデータベースを用いて分散コンピュータクラスタで実施されている。
クロスバリデーションに加えて、異なるデータパーティションのモデルを評価するために詳細なデータ分割基準を使用して、それらの真の一般化能力を新しい化合物で評価している。
実験では、分子活性予測(ROC AUC: $0.99$, $0.96$, $0.87$)の最先端性能を示し、選択したデータ表現とモデリングが一般化する良い性質を持つことを示した。
分子コンフォメーション(予測性能と感度解析)も評価されている。
最後に,SHAP法を用いて解釈可能性解析を行った。
関連論文リスト
- Diffusion posterior sampling for simulation-based inference in tall data settings [53.17563688225137]
シミュレーションベース推論(SBI)は、入力パラメータを所定の観測に関連付ける後部分布を近似することができる。
本研究では、モデルのパラメータをより正確に推測するために、複数の観測値が利用できる、背の高いデータ拡張について考察する。
提案手法を,最近提案した各種数値実験の競合手法と比較し,数値安定性と計算コストの観点から,その優位性を実証した。
論文 参考訳(メタデータ) (2024-04-11T09:23:36Z) - Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - Objective-Agnostic Enhancement of Molecule Properties via Multi-Stage
VAE [1.3597551064547502]
変異オートエンコーダ(VAE)は医薬品発見の一般的な方法であり、その性能を改善するために様々なアーキテクチャやパイプラインが提案されている。
VAEアプローチは、データが高次元の周囲空間に埋め込まれた低次元多様体上にあるとき、多様体の回復不良に悩まされることが知られている。
本稿では, 合成データセット上での多様体回復を向上する多段階VAEアプローチを創薬分野に適用することを検討する。
論文 参考訳(メタデータ) (2023-08-24T20:22:22Z) - Machine Learning Small Molecule Properties in Drug Discovery [44.62264781248437]
我々は, 結合親和性, 溶解性, ADMET (吸収, 分布, 代謝, 排出, 毒性) を含む幅広い特性について検討する。
化学指紋やグラフベースニューラルネットワークなど,既存の一般的な記述子や埋め込みについて論じる。
最後に、モデル予測の理解を提供する技術、特に薬物発見における重要な意思決定について評価する。
論文 参考訳(メタデータ) (2023-08-02T22:18:41Z) - A Federated Learning-based Industrial Health Prognostics for
Heterogeneous Edge Devices using Matched Feature Extraction [16.337207503536384]
本稿では,特徴類似性マッチングパラメータアグリゲーションアルゴリズムを用いたFL型健康予後モデルを提案する。
提案手法は, 健康状態推定と生活寿命推定において, 44.5%, 39.3%の精度向上を達成できることを示す。
論文 参考訳(メタデータ) (2023-05-13T07:20:31Z) - ASPEST: Bridging the Gap Between Active Learning and Selective
Prediction [56.001808843574395]
選択予測は、不確実な場合の予測を棄却する信頼性のあるモデルを学ぶことを目的としている。
アクティブラーニングは、最も有意義な例を問うことで、ラベリングの全体、すなわち人間の依存度を下げることを目的としている。
本研究では,移動対象領域からより情報のあるサンプルを検索することを目的とした,新たな学習パラダイムである能動的選択予測を導入する。
論文 参考訳(メタデータ) (2023-04-07T23:51:07Z) - Proposing Novel Extrapolative Compounds by Nested Variational
Autoencoders [0.685316573653194]
著者らは2つの変分オートエンコーダ(VAE)をネストした深部生成モデルを提案した。
外部VAEは大規模公開データを用いて化合物の構造的特徴を学習し,内部VAEは小規模実験データから外部VAEの潜伏変数と特性との関係を学習する。
その結果, この損失関数は, 高性能な候補を生成する確率の向上に寄与することが示唆された。
論文 参考訳(メタデータ) (2023-02-06T04:12:12Z) - Integrating Transformer and Autoencoder Techniques with Spectral Graph
Algorithms for the Prediction of Scarcely Labeled Molecular Data [2.8360662552057323]
この課題に対処するために、Merriman-Bence-Osher(MBO)テクニックを取り入れたグラフベースの3つのモデルを導入する。
具体的には、MBO方式のグラフベースの修正は、自家製のトランスフォーマーやオートエンコーダなどの最先端技術と統合されている。
提案したモデルは,5つのベンチマークデータセットを用いて検証する。
論文 参考訳(メタデータ) (2022-11-12T22:45:32Z) - Differentiable Agent-based Epidemiology [71.81552021144589]
GradABM(GradABM)は、エージェントベースのモデリングのためのスケーラブルで微分可能な設計で、勾配に基づく学習と自動微分が可能である。
GradABMは、コモディティハードウェア上で数秒で数百万の人口をシミュレートし、ディープニューラルネットワークと統合し、異種データソースを取り込みます。
論文 参考訳(メタデータ) (2022-07-20T07:32:02Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - DecAug: Augmenting HOI Detection via Decomposition [54.65572599920679]
現在のアルゴリズムでは、データセット内のトレーニングサンプルやカテゴリの不均衡が不足している。
本稿では,HOI検出のためのDECAugと呼ばれる効率的かつ効率的なデータ拡張手法を提案する。
実験の結果,V-COCOおよびHICODETデータセットの3.3mAPと1.6mAPの改善が得られた。
論文 参考訳(メタデータ) (2020-10-02T13:59:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。