論文の概要: A Gaussian Process Model for Ordinal Data with Applications to Chemoinformatics
- arxiv url: http://arxiv.org/abs/2405.09989v2
- Date: Mon, 25 Nov 2024 15:10:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-26 14:14:32.828834
- Title: A Gaussian Process Model for Ordinal Data with Applications to Chemoinformatics
- Title(参考訳): 正規データに対するガウス過程モデルとケモインフォマティクスへの応用
- Authors: Arron Gosnell, Evangelos Evangelou,
- Abstract要約: 化学実験の結果を予測するための条件付きガウス過程モデルを提案する。
我々のモデルの新しい側面は、核がスケーリングパラメータを含み、化学空間の要素間の相関の強さを制御することである。
本稿では,化学発見の容易化と化合物の有効性に対する重要な特徴の同定のための遺伝的アルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: With the proliferation of screening tools for chemical testing, it is now possible to create vast databases of chemicals easily. However, rigorous statistical methodologies employed to analyse these databases are in their infancy, and further development to facilitate chemical discovery is imperative. In this paper, we present conditional Gaussian process models to predict ordinal outcomes from chemical experiments, where the inputs are chemical compounds. We implement the Tanimoto distance, a metric on the chemical space, within the covariance of the Gaussian processes to capture correlated effects in the chemical space. A novel aspect of our model is that the kernel contains a scaling parameter, a feature not previously examined in the literature, that controls the strength of the correlation between elements of the chemical space. Using molecular fingerprints, a numerical representation of a compound's location within the chemical space, we find that accounting for correlation amongst chemical compounds improves predictive performance over the uncorrelated model, where effects are assumed to be independent. Moreover, we present a genetic algorithm for the facilitation of chemical discovery and identification of important features to the compound's efficacy, based on two criteria derived from the proposed model. Simulation studies are conducted to demonstrate the suitability of the proposed methods. Our model is demonstrated on a hazard classification problem of organic solvents.
- Abstract(参考訳): 化学検査のためのスクリーニングツールの普及により、膨大な量の化学物質のデータベースを容易に作成できるようになった。
しかし、これらのデータベースを解析するために用いられる厳密な統計手法は、その初期段階にあり、化学発見を促進するためのさらなる開発が不可欠である。
本稿では,化学実験の結果を予測する条件付きガウス過程モデルを提案する。
我々は、化学空間における相関効果を捉えるために、ガウス過程の共分散の中で、化学空間の計量である谷本距離を実装した。
提案手法の新たな特徴は, カーネルが化学空間の要素間の相関関係の強さを制御できるスケーリングパラメータを含むことである。
化学空間内における化合物の位置の数値的な表現である分子指紋を用いて,化学物質間の相関を考慮すれば,非相関モデルよりも予測性能が向上することがわかった。
さらに,提案モデルから得られた2つの基準に基づいて,化学発見の容易化と化合物の有効性に対する重要な特徴の同定を行う遺伝的アルゴリズムを提案する。
提案手法の妥当性を実証するためにシミュレーション研究を行った。
有機溶媒のハザード分類問題に本モデルを適用した。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - A Unified Approach to Inferring Chemical Compounds with the Desired Aqueous Solubility [5.763661159910719]
水溶性(AS)は、医薬品の発見と材料設計において重要な役割を果たす重要な物理化学的性質である。
本稿では,単純な決定論的グラフ理論記述子に基づいて,化学化合物を所望のASで予測し,推定するための新しい統一的アプローチについて報告する。
論文 参考訳(メタデータ) (2024-09-06T14:20:38Z) - ScholarChemQA: Unveiling the Power of Language Models in Chemical Research Question Answering [54.80411755871931]
質問回答(QA)は、言語モデルの推論と知識の深さを効果的に評価する。
化学QAは、複雑な化学情報を理解しやすい形式に効果的に翻訳することで、教育と研究の両方において重要な役割を担っている。
このデータセットは、不均衡なデータ分散や、潜在的に有用である可能性のあるかなりの量の未ラベルデータを含む、典型的な現実世界の課題を反映している。
収集したデータを完全に活用して,化学的な問題に効果的に答えるQAMatchモデルを提案する。
論文 参考訳(メタデータ) (2024-07-24T01:46:55Z) - Active Causal Learning for Decoding Chemical Complexities with Targeted Interventions [0.0]
そこで本研究では,戦略的サンプリングを通じて原因・影響関係を識別する能動的学習手法を提案する。
この方法は、より大きな化学空間の最も多くの情報を符号化できるデータセットの最小サブセットを特定する。
その後、同定された因果関係を利用して体系的な介入を行い、モデルがこれまで遭遇していなかった化学空間における設計タスクを最適化する。
論文 参考訳(メタデータ) (2024-04-05T17:15:48Z) - Beyond Chemical Language: A Multimodal Approach to Enhance Molecular
Property Prediction [2.1202329976106924]
本稿では,化学言語表現と物理化学的特徴を組み合わせた分子特性予測のための新しい多モーダル言語モデルを提案する。
提案手法であるMultiMODAL-MOLFORMERは,特定の標的特性に対する直接因果効果に基づいて物理化学的特徴を同定する因果多段階特徴選択法を用いている。
ケミカル言語ベースのMOLFORMERやグラフニューラルネットワークなど,既存の最先端アルゴリズムと比較して,優れた性能を示す。
論文 参考訳(メタデータ) (2023-06-22T13:28:59Z) - ChemVise: Maximizing Out-of-Distribution Chemical Detection with the
Novel Application of Zero-Shot Learning [60.02503434201552]
本研究は,簡単な学習セットから複雑な露光の学習近似を提案する。
合成センサ応答に対するこのアプローチは, 分布外の化学分析物の検出を驚くほど改善することを示した。
論文 参考訳(メタデータ) (2023-02-09T20:19:57Z) - Generative structured normalizing flow Gaussian processes applied to
spectroscopic data [4.0773490083614075]
物理科学では、限られた訓練データは将来の観測データを適切に特徴づけることができない。
特に外挿を依頼される場合、モデルが不確実性を適切に示すことは重要である。
火星探査機キュリオシティに搭載されたChemCam装置のレーザ誘起分解分光データに関する方法論を実証した。
論文 参考訳(メタデータ) (2022-12-14T23:57:46Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Semi-Supervised GCN for learning Molecular Structure-Activity
Relationships [4.468952886990851]
そこで本稿では,半教師付き学習を用いたグラフ-グラフ間ニューラルネットワークの学習手法を提案する。
最終目標として、我々のアプローチは、アクティビティ崖、リード最適化、デノボドラッグデザインといった問題に対処するための貴重なツールとなる可能性がある。
論文 参考訳(メタデータ) (2022-01-25T09:09:43Z) - Retrosynthesis Prediction with Conditional Graph Logic Network [118.70437805407728]
コンピュータ支援のレトロシンセシスは、化学と計算機科学の双方から新たな関心を集めている。
本稿では,グラフニューラルネットワーク上に構築された条件付きグラフィカルモデルであるConditional Graph Logic Networkを用いて,この課題に対する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2020-01-06T05:36:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。