論文の概要: Discovery of structure-property relations for molecules via
hypothesis-driven active learning over the chemical space
- arxiv url: http://arxiv.org/abs/2301.02665v2
- Date: Mon, 8 May 2023 20:05:41 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-10 20:27:41.167343
- Title: Discovery of structure-property relations for molecules via
hypothesis-driven active learning over the chemical space
- Title(参考訳): 化学空間上の仮説駆動型能動学習による分子の構造-親和関係の発見
- Authors: Ayana Ghosh, Sergei V. Kalinin and Maxim A. Ziatdinov
- Abstract要約: 本稿では,仮説学習に基づく化学空間上の能動的学習のための新しいアプローチを提案する。
我々は,データサブセットの小さな部分集合に基づいて,関心の構造と機能の関係性に関する仮説を構築した。
このアプローチでは、SISSOやアクティブラーニングといったシンボリックレグレッションメソッドの要素をひとつのフレームワークに統合する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Discovery of the molecular candidates for applications in drug targets,
biomolecular systems, catalysts, photovoltaics, organic electronics, and
batteries, necessitates development of machine learning algorithms capable of
rapid exploration of the chemical spaces targeting the desired functionalities.
Here we introduce a novel approach for the active learning over the chemical
spaces based on hypothesis learning. We construct the hypotheses on the
possible relationships between structures and functionalities of interest based
on a small subset of data and introduce them as (probabilistic) mean functions
for the Gaussian process. This approach combines the elements from the symbolic
regression methods such as SISSO and active learning into a single framework.
The primary focus of constructing this framework is to approximate physical
laws in an active learning regime toward a more robust predictive performance,
as traditional evaluation on hold-out sets in machine learning doesn't account
for out-of-distribution effects and may lead to a complete failure on unseen
chemical space. Here, we demonstrate it for the QM9 dataset, but it can be
applied more broadly to datasets from both domains of molecular and solid-state
materials sciences.
- Abstract(参考訳): 薬物標的、生体分子系、触媒、光電気、有機エレクトロニクス、電池の分子候補の発見は、望まれる機能性をターゲットとした化学空間の迅速な探索が可能な機械学習アルゴリズムの開発を必要とする。
本稿では,仮説学習に基づく化学空間上のアクティブラーニングのための新しいアプローチを提案する。
我々は、データの小さな部分集合に基づいて、興味の構造と機能の間の可能な関係に関する仮説を構築し、それをガウス過程の(確率的な)平均関数として導入する。
このアプローチはSISSOやアクティブラーニングといったシンボリック回帰手法の要素をひとつのフレームワークに統合する。
このフレームワークを構築する主な目的は、より堅牢な予測性能に向けてアクティブな学習環境における物理法則を近似することであり、機械学習におけるホールドアウトセットに対する従来の評価は分散効果を考慮せず、目に見えない化学空間の完全な失敗に繋がる可能性がある。
ここでは、qm9データセットについて実証するが、分子科学と固体材料科学の両方の分野のデータセットに広く適用することができる。
関連論文リスト
- Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。
この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文 参考訳(メタデータ) (2024-11-03T01:56:15Z) - Active Causal Learning for Decoding Chemical Complexities with Targeted Interventions [0.0]
そこで本研究では,戦略的サンプリングを通じて原因・影響関係を識別する能動的学習手法を提案する。
この方法は、より大きな化学空間の最も多くの情報を符号化できるデータセットの最小サブセットを特定する。
その後、同定された因果関係を利用して体系的な介入を行い、モデルがこれまで遭遇していなかった化学空間における設計タスクを最適化する。
論文 参考訳(メタデータ) (2024-04-05T17:15:48Z) - Active Deep Kernel Learning of Molecular Functionalities: Realizing
Dynamic Structural Embeddings [0.26716003713321473]
本稿では,Deep Kernel Learning (DKL) を用いた分子探索における能動的学習手法について検討する。
DKLは構造と性質を関連付けることによってより全体論的視点を提供し、分子機能に優先順位をつける潜在空間を創出する。
特定の化合物を取り巻く排除領域の形成は、基盤となる機能を持つ未発見領域を示す。
論文 参考訳(メタデータ) (2024-03-02T15:34:31Z) - From molecules to scaffolds to functional groups: building context-dependent molecular representation via multi-channel learning [10.025809630976065]
本稿では,より堅牢で一般化可能な化学知識を学習する,新しい事前学習フレームワークを提案する。
提案手法は,種々の分子特性ベンチマークにおける競合性能を示す。
論文 参考訳(メタデータ) (2023-11-05T23:47:52Z) - Unsupervised Learning of Molecular Embeddings for Enhanced Clustering
and Emergent Properties for Chemical Compounds [2.6803933204362336]
SMILESデータに基づく化合物の検出とクラスタリングのための様々な手法を提案する。
埋め込みデータを用いて化合物のグラフィカルな構造を解析し, しきい値を満たすためにベクトル探索を用いる。
また、GPT3.5を用いたベクトルデータベースに格納された自然言語記述埋め込みを用い、ベースモデルより優れていた。
論文 参考訳(メタデータ) (2023-10-25T18:00:24Z) - Towards Predicting Equilibrium Distributions for Molecular Systems with
Deep Learning [60.02391969049972]
本稿では,分子系の平衡分布を予測するために,分散グラフマー(DiG)と呼ばれる新しいディープラーニングフレームワークを導入する。
DiGはディープニューラルネットワークを用いて分子系の記述子に条件付き平衡分布に単純な分布を変換する。
論文 参考訳(メタデータ) (2023-06-08T17:12:08Z) - Implicit Geometry and Interaction Embeddings Improve Few-Shot Molecular
Property Prediction [53.06671763877109]
我々は, 複雑な分子特性を符号化した分子埋め込みを開発し, 数発の分子特性予測の性能を向上させる。
我々の手法は大量の合成データ、すなわち分子ドッキング計算の結果を利用する。
複数の分子特性予測ベンチマークでは、埋め込み空間からのトレーニングにより、マルチタスク、MAML、プロトタイプラーニング性能が大幅に向上する。
論文 参考訳(メタデータ) (2023-02-04T01:32:40Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Transferring Chemical and Energetic Knowledge Between Molecular Systems
with Machine Learning [5.27145343046974]
本稿では,単純な分子システムから得られた知識をより複雑なものに伝達するための新しい手法を提案する。
我々は、高低自由エネルギー状態の分類に焦点をあてる。
以上の結果より, トリアラニンからデカアラニン系への移行学習において, 0.92 の顕著な AUC が得られた。
論文 参考訳(メタデータ) (2022-05-06T16:21:00Z) - Federated Learning of Molecular Properties in a Heterogeneous Setting [79.00211946597845]
これらの課題に対処するために、フェデレーションヘテロジニアス分子学習を導入する。
フェデレートラーニングにより、エンドユーザは、独立したクライアント上に分散されたトレーニングデータを保存しながら、グローバルモデルを協調的に構築できる。
FedChemは、化学におけるAI改善のための新しいタイプのコラボレーションを可能にする必要がある。
論文 参考訳(メタデータ) (2021-09-15T12:49:13Z) - ASGN: An Active Semi-supervised Graph Neural Network for Molecular
Property Prediction [61.33144688400446]
本稿では,ラベル付き分子とラベルなし分子の両方を組み込んだ,アクティブ半教師付きグラフニューラルネットワーク(ASGN)を提案する。
教師モデルでは,分子構造や分子分布から情報を共同で活用する汎用表現を学習するための,新しい半教師付き学習手法を提案する。
最後に,分子多様性の観点から,フレームワーク学習全体を通して情報的データを選択するための新しい能動的学習戦略を提案する。
論文 参考訳(メタデータ) (2020-07-07T04:22:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。