論文の概要: Representations and Strategies for Transferable Machine Learning Models
in Chemical Discovery
- arxiv url: http://arxiv.org/abs/2106.10768v1
- Date: Sun, 20 Jun 2021 22:34:04 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-22 15:06:43.758771
- Title: Representations and Strategies for Transferable Machine Learning Models
in Chemical Discovery
- Title(参考訳): 化学発見における伝達可能な機械学習モデルの表現と戦略
- Authors: Daniel R. Harper, Aditya Nandy, Naveen Arunachalam, Chenru Duan, Jon
Paul Janet, and Heather J. Kulik
- Abstract要約: 本稿では,周期表の1行から大量のデータを学習したモデルを,追加行から少量のデータポイントで生成するトランスファー学習手法を提案する。
モデル性能を安定的に向上させるために,この伝達学習戦略とともに,eRACの相乗的価値を示す。
- 参考スコア(独自算出の注目度): 0.7695660509846216
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Strategies for machine-learning(ML)-accelerated discovery that are general
across materials composition spaces are essential, but demonstrations of ML
have been primarily limited to narrow composition variations. By addressing the
scarcity of data in promising regions of chemical space for challenging targets
like open-shell transition-metal complexes, general representations and
transferable ML models that leverage known relationships in existing data will
accelerate discovery. Over a large set (ca. 1000) of isovalent transition-metal
complexes, we quantify evident relationships for different properties (i.e.,
spin-splitting and ligand dissociation) between rows of the periodic table
(i.e., 3d/4d metals and 2p/3p ligands). We demonstrate an extension to
graph-based revised autocorrelation (RAC) representation (i.e., eRAC) that
incorporates the effective nuclear charge alongside the nuclear charge
heuristic that otherwise overestimates dissimilarity of isovalent complexes. To
address the common challenge of discovery in a new space where data is limited,
we introduce a transfer learning approach in which we seed models trained on a
large amount of data from one row of the periodic table with a small number of
data points from the additional row. We demonstrate the synergistic value of
the eRACs alongside this transfer learning strategy to consistently improve
model performance. Analysis of these models highlights how the approach
succeeds by reordering the distances between complexes to be more consistent
with the periodic table, a property we expect to be broadly useful for other
materials domains.
- Abstract(参考訳): 材料合成空間にまたがる一般的な機械学習(ML)加速発見の戦略は不可欠であるが、MLの実証は主に狭い構成のバリエーションに限られている。
オープンシェル遷移金属錯体のような挑戦的なターゲットのために、化学空間の有望な領域におけるデータの不足に対処することによって、既存のデータの既知の関係を利用する一般的な表現や転送可能なMLモデルが発見を加速する。
a large set (ca)。
等価遷移金属錯体の1000) 周期表の列(すなわち3d/4d金属と2p/3p配位子)間の異なる性質(スピンスプリッティングと配位子解離)の明らかな関係を定量化する。
グラフに基づく修正自己相関(RAC)表現の拡張(eRAC)を示す。これは核電荷ヒューリスティックとともに有効核電荷を組み込むもので、そうでなければ同価錯体の相似性を過大評価する。
データの制限が限定された新しい空間における発見の共通課題に対処するために,周期表の1行から大量のデータに基づいてトレーニングされたモデルを,追加行から少数のデータポイントでシードする転送学習手法を提案する。
モデル性能を安定的に向上させるために,この伝達学習戦略とともにeRACの相乗的価値を示す。
これらのモデルの解析は、錯体間の距離を周期表とより整合的に並べ替えることによって、アプローチがどのように成功するかを明らかにする。
関連論文リスト
- Learning Divergence Fields for Shift-Robust Graph Representations [73.11818515795761]
本研究では,相互依存データに対する問題に対して,学習可能な分散場を持つ幾何学的拡散モデルを提案する。
因果推論によって新たな学習目標が導出され、ドメイン間で無神経な相互依存の一般化可能なパターンを学習するためのモデルが導出される。
論文 参考訳(メタデータ) (2024-06-07T14:29:21Z) - Enhanced sampling of robust molecular datasets with uncertainty-based
collective variables [0.0]
化学関連データポイントの取得を導くために,不確実性を集合変数(CV)として活用する手法を提案する。
このアプローチでは、1つのモデルからのガウス混合モデルに基づく不確実性測定を、偏りのある分子動力学シミュレーションのためのCVとして採用する。
論文 参考訳(メタデータ) (2024-02-06T06:42:51Z) - SC-MAD: Mixtures of Higher-order Networks for Data Augmentation [36.33265644447091]
単純複体は、グラフニューラルネットワーク(GNN)の単純複体モデルへの一般化にインスピレーションを与えた。
本稿では, 線形および非線形混合機構による単純錯体のデータ増大について述べる。
理論的には、合成単純錯体は、同型密度に関して、既存のデータ間で相互に相互作用することを示した。
論文 参考訳(メタデータ) (2023-09-14T06:25:39Z) - Learning Multiscale Consistency for Self-supervised Electron Microscopy
Instance Segmentation [48.267001230607306]
本稿では,EMボリュームのマルチスケール一貫性を高める事前学習フレームワークを提案する。
当社のアプローチでは,強力なデータ拡張と弱いデータ拡張を統合することで,Siameseネットワークアーキテクチャを活用している。
効果的にボクセルと機能の一貫性をキャプチャし、EM分析のための転送可能な表現を学習する。
論文 参考訳(メタデータ) (2023-08-19T05:49:13Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z) - Low-cost machine learning approach to the prediction of transition metal
phosphor excited state properties [0.4306143768014156]
光活性イリジウム錯体は、光から光触媒への応用から広く関心を集めている。
我々は、低コスト機械学習(ML)モデルを用いて、イリジウム錯体の励起状態特性を予測する。
論文 参考訳(メタデータ) (2022-09-18T16:24:07Z) - Improving Molecular Representation Learning with Metric
Learning-enhanced Optimal Transport [49.237577649802034]
分子レグレッション問題に対する一般化能力を高めるために,MROTと呼ばれる新しい最適輸送ベースアルゴリズムを開発した。
MROTは最先端のモデルよりも優れており、新しい物質の発見を加速する有望な可能性を示している。
論文 参考訳(メタデータ) (2022-02-13T04:56:18Z) - Deciphering Cryptic Behavior in Bimetallic Transition Metal Complexes
with Machine Learning [0.856335408411906]
我々は, 金属-金属結合の程度を予測するために, 330個の構造的特徴を持つヘテロビメタルのサブセット上で回帰モデルを訓練した。
我々の研究は、有理二金属設計の指針を提供し、形式比を含む特性は、ある期間から別の期間に転移可能であることを示唆している。
論文 参考訳(メタデータ) (2021-07-29T19:01:56Z) - Materials Representation and Transfer Learning for Multi-Property
Prediction [22.068267502715404]
材料科学における機械学習の採用は、急速に材料特性の予測に変化をもたらした。
機械学習の最近の進歩の完全な資本化を制限するハードルには、複数の要素の基本的な相互作用を学ぶ方法の限定的な開発が含まれる。
我々は,材料組成のみを用いて(i)予測をシームレスに統合する階層的相関学習フレームワーク,(ii)多目的回帰における対象特性間の相関関係の学習と活用,および(iii)生成的伝達学習による接尾辞領域からの学習データを活用する階層的相関学習フレームワークを導入する。
論文 参考訳(メタデータ) (2021-06-04T03:00:34Z) - Graph Neural Network for Hamiltonian-Based Material Property Prediction [56.94118357003096]
無機材料のバンドギャップを予測できるいくつかの異なるグラフ畳み込みネットワークを提示し、比較する。
モデルは、それぞれの軌道自体の情報と相互の相互作用の2つの異なる特徴を組み込むように開発されている。
その結果,クロスバリデーションにより予測精度が期待できることがわかった。
論文 参考訳(メタデータ) (2020-05-27T13:32:10Z) - Inverse Learning of Symmetries [71.62109774068064]
2つの潜在部分空間からなるモデルで対称性変換を学ぶ。
我々のアプローチは、情報ボトルネックと連続的な相互情報正規化器の組み合わせに基づいています。
我々のモデルは, 人工的および分子的データセットにおける最先端の手法より優れている。
論文 参考訳(メタデータ) (2020-02-07T13:48:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。