Fugu-MT 論文翻訳(概要): Structure to Property: Chemical Element Embeddings and a Deep Learning Approach for Accurate Prediction of Chemical Properties

論文の概要: Structure to Property: Chemical Element Embeddings and a Deep Learning Approach for Accurate Prediction of Chemical Properties

arxiv url: http://arxiv.org/abs/2309.09355v1
Date: Sun, 17 Sep 2023 19:41:32 GMT
ステータス: 翻訳完了
システム内更新日: 2023-09-19 16:03:40.656358
Title: Structure to Property: Chemical Element Embeddings and a Deep Learning Approach for Accurate Prediction of Chemical Properties
Title（参考訳）: 物性構造:化学要素埋め込みと化学特性の正確な予測のための深層学習アプローチ
Authors: Shokirbek Shermukhamedov, Dilorom Mamurjonova, Michael Probst
Abstract要約: 本稿では,多層エンコーダやデコーダアーキテクチャなどのディープラーニング技術に基づく新しい機械学習モデルを提案する。有機および無機化合物を含む各種入力データに適用することで,本手法がもたらす機会を実証する。この研究で使用されるモデルは高い予測力を示し、洗練された機械学習で実現可能な進歩を裏付けるものである。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The application of machine learning (ML) techniques in computational chemistry has led to significant advances in predicting molecular properties, accelerating drug discovery, and material design. ML models can extract hidden patterns and relationships from complex and large datasets, allowing for the prediction of various chemical properties with high accuracy. The use of such methods has enabled the discovery of molecules and materials that were previously difficult to identify. This paper introduces a new ML model based on deep learning techniques, such as a multilayer encoder and decoder architecture, for classification tasks. We demonstrate the opportunities offered by our approach by applying it to various types of input data, including organic and inorganic compounds. In particular, we developed and tested the model using the Matbench and Moleculenet benchmarks, which include crystal properties and drug design-related benchmarks. We also conduct a comprehensive analysis of vector representations of chemical compounds, shedding light on the underlying patterns in molecular data. The models used in this work exhibit a high degree of predictive power, underscoring the progress that can be made with refined machine learning when applied to molecular and material datasets. For instance, on the Tox21 dataset, we achieved an average accuracy of 96%, surpassing the previous best result by 10%. Our code is publicly available at https://github.com/dmamur/elembert.
Abstract（参考訳）: 機械学習(ML)技術の計算化学への応用は、分子特性の予測、薬物発見の加速、材料設計において大きな進歩をもたらした。 mlモデルは、複雑なデータセットや大規模データセットから隠れたパターンや関係を抽出でき、高い精度で様々な化学的特性を予測できる。このような方法を用いることで、それまで同定が困難だった分子や材料の発見が可能となった。本稿では,階層化タスクのための多層エンコーダやデコーダアーキテクチャなど,ディープラーニング技術に基づく新しいmlモデルを提案する。有機および無機化合物を含む各種入力データに適用することで,本手法がもたらす機会を実証する。特に, 結晶特性と薬物設計関連ベンチマークを含むMatebench と Moleculenet ベンチマークを用いて, モデルの開発と試験を行った。また, 化合物のベクトル表現の包括的解析を行い, 分子データの基盤となるパターンに光を当てる。この研究で使用されるモデルは高い予測力を示し、分子および材料データセットに適用した場合に、洗練された機械学習で達成できる進歩を裏付ける。例えば、tox21データセットでは、平均精度96%を達成し、以前の最高の結果を10%上回っています。私たちのコードはhttps://github.com/dmamur/elembert.comで公開されています。

関連論文リスト

FlexMS is a flexible framework for benchmarking deep learning-based mass spectrum prediction tools in metabolomics [22.314786276794717]
化学分子の同定と性質予測は、薬物発見と物質科学の発展において重要な役割を担っている。深層学習モデルは分子構造スペクトルを予測できるが、全体的な評価は難しい。我々の貢献は、質量スペクトル予測における多様なモデルアーキテクチャの構築と評価のためのベンチマークフレームワークFlexMSの作成である。
論文参考訳（メタデータ） (2026-02-26T10:05:01Z)
Agentic reinforcement learning empowers next-generation chemical language models for molecular design and synthesis [51.83339196548892]
ChemCraftは、知識ストレージから化学推論を分離する新しいフレームワークである。 ChemCraftは最小の推論コストで優れたパフォーマンスを実現する。この研究は、AI支援化学のコスト効率とプライバシ保護のパラダイムを確立する。
論文参考訳（メタデータ） (2026-01-25T04:23:34Z)
Unveiling Latent Knowledge in Chemistry Language Models through Sparse Autoencoders [42.033443425253644]
我々はスパースオートエンコーダ技術を拡張して化学言語モデル内の解釈可能な特徴を明らかにし,検討する。以上の結果から,これらのモデルが化学概念の豊かな風景をエンコードしていることが判明した。我々のアプローチは、化学にフォーカスしたAIシステムにおける潜在知識を明らかにするための一般的なフレームワークを提供する。
論文参考訳（メタデータ） (2025-12-08T22:20:01Z)
Foundation Models for Discovery and Exploration in Chemical Space [57.97784111110166]
MISTは、大規模なラベルなしデータセットに基づいて訓練された分子基盤モデルのファミリーである。我々は、これらのモデルが化学空間をまたいだ現実世界の問題を解決する能力を実証する。
論文参考訳（メタデータ） (2025-10-20T17:56:01Z)
Material Property Prediction with Element Attribute Knowledge Graphs and Multimodal Representation Learning [8.523289773617503]
要素特性知識グラフを構築し、埋め込みモデルを用いて、要素属性を知識グラフ内にエンコードする。マルチモーダル融合フレームワークであるESNetは、要素特性特徴と結晶構造特徴を統合し、ジョイントマルチモーダル表現を生成する。これは結晶材料の性能を予測するためのより包括的な視点を提供する。
論文参考訳（メタデータ） (2024-11-13T08:07:21Z)
Pre-trained Molecular Language Models with Random Functional Group Masking [54.900360309677794]
SMILESをベースとしたアンダーリネム分子アンダーリネム言語アンダーリネムモデルを提案し,特定の分子原子に対応するSMILESサブシーケンスをランダムにマスキングする。この技術は、モデルに分子構造や特性をよりよく推測させ、予測能力を高めることを目的としている。
論文参考訳（メタデータ） (2024-11-03T01:56:15Z)
A Large Encoder-Decoder Family of Foundation Models For Chemical Language [1.1073864511426255]
本稿では,PubChemから得られた9100万個のSMILESサンプルを事前学習した大規模エンコーダ・デコーダ化学基礎モデルを提案する。複数のベンチマークデータセットにまたがる実験は、様々なタスクに対して最先端の結果を提供する際に提案したモデルのキャパシティを検証する。
論文参考訳（メタデータ） (2024-07-24T20:30:39Z)
ScholarChemQA: Unveiling the Power of Language Models in Chemical Research Question Answering [54.80411755871931]
質問回答(QA)は、言語モデルの推論と知識の深さを効果的に評価する。化学QAは、複雑な化学情報を理解しやすい形式に効果的に翻訳することで、教育と研究の両方において重要な役割を担っている。このデータセットは、不均衡なデータ分散や、潜在的に有用である可能性のあるかなりの量の未ラベルデータを含む、典型的な現実世界の課題を反映している。収集したデータを完全に活用して,化学的な問題に効果的に答えるQAMatchモデルを提案する。
論文参考訳（メタデータ） (2024-07-24T01:46:55Z)
MoleculeCLA: Rethinking Molecular Benchmark via Computational Ligand-Target Binding Analysis [18.940529282539842]
約140,000個の小分子からなる大規模かつ高精度な分子表現データセットを構築した。我々のデータセットは、モデルの開発と設計をガイドするために、重要な物理化学的解釈性を提供します。このデータセットは、分子表現学習のためのより正確で信頼性の高いベンチマークとして機能すると考えています。
論文参考訳（メタデータ） (2024-06-13T02:50:23Z)
Unsupervised Learning of Molecular Embeddings for Enhanced Clustering and Emergent Properties for Chemical Compounds [2.6803933204362336]
SMILESデータに基づく化合物の検出とクラスタリングのための様々な手法を提案する。埋め込みデータを用いて化合物のグラフィカルな構造を解析し, しきい値を満たすためにベクトル探索を用いる。また、GPT3.5を用いたベクトルデータベースに格納された自然言語記述埋め込みを用い、ベースモデルより優れていた。
論文参考訳（メタデータ） (2023-10-25T18:00:24Z)
Towards out-of-distribution generalizable predictions of chemical kinetics properties [61.15970601264632]
Out-Of-Distribution (OOD) の運動特性予測は一般化可能である必要がある。本稿では,OODの運動特性予測を3つのレベル(構造,条件,機構)に分類する。我々は、OOD設定における反応予測のための最先端MLアプローチと、速度論的特性予測問題における最先端グラフOOD手法をベンチマークするために、包括的なデータセットを作成する。
論文参考訳（メタデータ） (2023-10-04T20:36:41Z)
MolGrapher: Graph-based Visual Recognition of Chemical Structures [50.13749978547401]
化学構造を視覚的に認識するためにMolGrapherを導入する。すべての候補原子と結合をノードとして扱い、それらをグラフ化する。グラフニューラルネットワークを用いてグラフ内の原子と結合ノードを分類する。
論文参考訳（メタデータ） (2023-08-23T16:16:11Z)
QH9: A Quantum Hamiltonian Prediction Benchmark for QM9 Molecules [69.25826391912368]
QH9と呼ばれる新しい量子ハミルトンデータセットを生成し、999または2998の分子動力学軌道に対して正確なハミルトン行列を提供する。現在の機械学習モデルでは、任意の分子に対するハミルトン行列を予測する能力がある。
論文参考訳（メタデータ） (2023-06-15T23:39:07Z)
Bi-level Contrastive Learning for Knowledge-Enhanced Molecule Representations [68.32093648671496]
分子に固有の二重レベル構造を考慮に入れたGODEを導入する。分子は固有のグラフ構造を持ち、より広い分子知識グラフ内のノードとして機能する。異なるグラフ構造上の2つのGNNを事前学習することにより、GODEは対応する知識グラフサブ構造と分子構造を効果的に融合させる。
論文参考訳（メタデータ） (2023-06-02T15:49:45Z)
Atomic and Subgraph-aware Bilateral Aggregation for Molecular Representation Learning [57.670845619155195]
我々は、原子とサブグラフを意識したバイラテラルアグリゲーション(ASBA)と呼ばれる分子表現学習の新しいモデルを導入する。 ASBAは、両方の種類の情報を統合することで、以前の原子単位とサブグラフ単位のモデルの限界に対処する。本手法は,分子特性予測のための表現をより包括的に学習する方法を提供する。
論文参考訳（メタデータ） (2023-05-22T00:56:00Z)
Machine learning with persistent homology and chemical word embeddings improves prediction accuracy and interpretability in metal-organic frameworks [0.07874708385247352]
材料の構造と化学の複雑な表現をキャプチャする記述子を自動的に生成するエンド・ツー・エンドの機械学習モデルを提案する。物質系から直接、幾何学的および化学的情報をカプセル化する。提案手法は, 対象物間での精度, 転送可能性の両面において, 一般的に用いられている手作業による特徴量から構築したモデルに比べ, かなり改善されている。
論文参考訳（メタデータ） (2020-10-01T16:31:46Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。