論文の概要: High-throughput discovery of chemical structure-polarity relationships
combining automation and machine learning techniques
- arxiv url: http://arxiv.org/abs/2202.05962v1
- Date: Sat, 12 Feb 2022 03:00:36 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-17 16:21:32.282000
- Title: High-throughput discovery of chemical structure-polarity relationships
combining automation and machine learning techniques
- Title(参考訳): 自動化と機械学習を組み合わせた化学構造・極性関係の高速発見
- Authors: Hao Xu, Jinglong Lin, Qianyi Liu, Yuntian Chen, Jianning Zhang, Yang
Yang, Michael C. Young, Yan Xu, Dongxiao Zhang, Fanyang Mo
- Abstract要約: 薄層クロマトグラフィー解析のための自動実験システムについて述べる。
機械学習(ML)法は、有機化合物の構造とその極性に関連する代理モデルを構築するために用いられる。
訓練されたMLモデルは、高い精度で有機化合物のRf値曲線を予測することができる。
- 参考スコア(独自算出の注目度): 7.26943259958504
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: As an essential attribute of organic compounds, polarity has a profound
influence on many molecular properties such as solubility and phase transition
temperature. Thin layer chromatography (TLC) represents a commonly used
technique for polarity measurement. However, current TLC analysis presents
several problems, including the need for a large number of attempts to obtain
suitable conditions, as well as irreproducibility due to non-standardization.
Herein, we describe an automated experiment system for TLC analysis. This
system is designed to conduct TLC analysis automatically, facilitating
high-throughput experimentation by collecting large experimental data under
standardized conditions. Using these datasets, machine learning (ML) methods
are employed to construct surrogate models correlating organic compounds'
structures and their polarity using retardation factor (Rf). The trained ML
models are able to predict the Rf value curve of organic compounds with high
accuracy. Furthermore, the constitutive relationship between the compound and
its polarity can also be discovered through these modeling methods, and the
underlying mechanism is rationalized through adsorption theories. The trained
ML models not only reduce the need for empirical optimization currently
required for TLC analysis, but also provide general guidelines for the
selection of conditions, making TLC an easily accessible tool for the broad
scientific community.
- Abstract(参考訳): 有機化合物の重要な性質として、極性は溶解度や相転移温度などの多くの分子特性に大きく影響する。
薄層クロマトグラフィー(tlc)は、極性測定に一般的に用いられる技術である。
しかし、現在のTLC分析では、適切な条件を得るための多くの試みの必要性や、非標準化による不再現性など、いくつかの問題がある。
本稿では,TLC解析のための自動実験システムについて述べる。
このシステムはTLC解析を自動で行うように設計されており、標準化された条件下で大規模な実験データを収集することで高スループット実験を容易にする。
これらのデータセットを用いて、機械学習(ML)手法を用いて、有機化合物の構造とその極性に関連する代理モデルを構築する。
訓練されたMLモデルは、高い精度で有機化合物のRf値曲線を予測することができる。
さらに、これらのモデリング手法により化合物と極性との間の構成的関係も発見でき、基礎となるメカニズムは吸着理論によって合理化される。
訓練されたMLモデルは、TLC分析に現在必要な経験的最適化の必要性を減らすだけでなく、条件の選択に関する一般的なガイドラインを提供する。
関連論文リスト
- Text-Guided Multi-Property Molecular Optimization with a Diffusion Language Model [77.50732023411811]
変換器を用いた拡散言語モデル(TransDLM)を用いたテキスト誘導多目的分子最適化手法を提案する。
TransDLMは標準化された化学命名法を分子の意味表現として利用し、プロパティ要求をテキスト記述に暗黙的に埋め込む。
提案手法は, 分子構造類似性を最適化し, ベンチマークデータセットの化学的特性を向上するための最先端手法を超越した手法である。
論文 参考訳(メタデータ) (2024-10-17T14:30:27Z) - A Unified Approach to Inferring Chemical Compounds with the Desired Aqueous Solubility [5.763661159910719]
水溶性(AS)は、医薬品の発見と材料設計において重要な役割を果たす重要な物理化学的性質である。
本稿では,単純な決定論的グラフ理論記述子に基づいて,化学化合物を所望のASで予測し,推定するための新しい統一的アプローチについて報告する。
論文 参考訳(メタデータ) (2024-09-06T14:20:38Z) - YZS-model: A Predictive Model for Organic Drug Solubility Based on Graph Convolutional Networks and Transformer-Attention [9.018408514318631]
伝統的な手法は複雑な分子構造を見逃し、不正確な結果をもたらすことが多い。
本稿では,グラフ畳み込みネットワーク(GCN),トランスフォーマーアーキテクチャ,Long Short-Term Memory(LSTM)ネットワークを統合するディープラーニングフレームワークであるYZS-Modelを紹介する。
YZS-Modelは、R2$ 0.59、RMSE$ 0.57を達成し、ベンチマークモデルを上回った。
論文 参考訳(メタデータ) (2024-06-27T12:40:29Z) - Adaptive Fuzzy C-Means with Graph Embedding [84.47075244116782]
ファジィクラスタリングアルゴリズムは、大まかに2つの主要なグループに分類できる: ファジィC平均法(FCM)と混合モデルに基づく方法。
本稿では,FCMを用いたクラスタリングモデルを提案する。
論文 参考訳(メタデータ) (2024-05-22T08:15:50Z) - Multi-task learning for molecular electronic structure approaching coupled-cluster accuracy [9.81014501502049]
金標準CCSD(T)計算をトレーニングデータとして,有機分子の電子構造を統一した機械学習手法を開発した。
炭化水素分子を用いたモデルでは, 計算コストと様々な量子化学特性の予測精度において, 広範に用いられているハイブリッド関数と二重ハイブリッド関数でDFTより優れていた。
論文 参考訳(メタデータ) (2024-05-09T19:51:27Z) - Empowering Machines to Think Like Chemists: Unveiling Molecular
Structure-Polarity Relationships with Hierarchical Symbolic Regression [1.6986628849901197]
階層型ニューラルネットワークとシンボル回帰を組み合わせた非教師付き階層型シンボル回帰(UHiSR)を導入する。
UHiSRは化学直観的な極性指数を自動的に蒸留し、分子構造とクロマトグラフィーの挙動を結びつける解釈可能な方程式を発見する。
論文 参考訳(メタデータ) (2024-01-25T02:48:44Z) - Local manifold learning and its link to domain-based physics knowledge [53.15471241298841]
多くの反応系では、熱化学状態空間は低次元多様体(LDM)に近く進化すると仮定される。
局所的データクラスタ(ローカルPCA)に適用されたPCAは,熱化学状態空間の固有パラメータ化を検出することができることを示す。
論文 参考訳(メタデータ) (2022-07-01T09:06:25Z) - Accurate Machine Learned Quantum-Mechanical Force Fields for
Biomolecular Simulations [51.68332623405432]
分子動力学(MD)シミュレーションは、化学的および生物学的プロセスに関する原子論的な洞察を可能にする。
近年,MDシミュレーションの代替手段として機械学習力場(MLFF)が出現している。
本研究は、大規模分子シミュレーションのための正確なMLFFを構築するための一般的なアプローチを提案する。
論文 参考訳(メタデータ) (2022-05-17T13:08:28Z) - Molecular Attributes Transfer from Non-Parallel Data [57.010952598634944]
分子最適化をスタイル伝達問題として定式化し、非並列データの2つのグループ間の内部差を自動的に学習できる新しい生成モデルを提案する。
毒性修飾と合成性向上という2つの分子最適化タスクの実験により,本モデルがいくつかの最先端手法を著しく上回ることを示した。
論文 参考訳(メタデータ) (2021-11-30T06:10:22Z) - CASTELO: Clustered Atom Subtypes aidEd Lead Optimization -- a combined
machine learning and molecular modeling method [2.8381402107366034]
我々は、リード最適化ワークフローを自動化する機械学習と分子モデリングを組み合わせたアプローチを提案する。
本手法は, 薬剤の有効性向上に有効な, ホットスポットの新規なヒントを提供する。
論文 参考訳(メタデータ) (2020-11-27T15:41:00Z) - Optimizing Molecules using Efficient Queries from Property Evaluations [66.66290256377376]
汎用的なクエリベースの分子最適化フレームワークであるQMOを提案する。
QMOは効率的なクエリに基づいて入力分子の所望の特性を改善する。
QMOは, 有機分子を最適化するベンチマークタスクにおいて, 既存の手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-11-03T18:51:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。