論文の概要: Machine learning to tame divergent density functional approximations: a
new path to consensus materials design principles
- arxiv url: http://arxiv.org/abs/2106.13109v1
- Date: Thu, 24 Jun 2021 15:43:57 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-25 14:46:26.754823
- Title: Machine learning to tame divergent density functional approximations: a
new path to consensus materials design principles
- Title(参考訳): 密度汎関数近似をテームする機械学習--コンセンサス材料設計の原理への新たな道
- Authors: Chenru Duan, Shuxin Chen, Michael G. Taylor, Fang Liu, and Heather J.
Kulik
- Abstract要約: 複数の家族と「群」にまたがる23の代表的DFAから、迅速に資産予測を得るアプローチを導入する。
DFA毎に独立したMLモデルをトレーニングし、特徴重要度における収束傾向を観察する。
ANNが予測するDFA特性のコンセンサスを求めることにより、これらの計算鉛化合物と文学的な化合物との対応性を改善する。
- 参考スコア(独自算出の注目度): 4.700621178941319
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Computational virtual high-throughput screening (VHTS) with density
functional theory (DFT) and machine-learning (ML)-acceleration is essential in
rapid materials discovery. By necessity, efficient DFT-based workflows are
carried out with a single density functional approximation (DFA). Nevertheless,
properties evaluated with different DFAs can be expected to disagree for the
cases with challenging electronic structure (e.g., open shell transition metal
complexes, TMCs) for which rapid screening is most needed and accurate
benchmarks are often unavailable. To quantify the effect of DFA bias, we
introduce an approach to rapidly obtain property predictions from 23
representative DFAs spanning multiple families and "rungs" (e.g., semi-local to
double hybrid) and basis sets on over 2,000 TMCs. Although computed properties
(e.g., spin-state ordering and frontier orbital gap) naturally differ by DFA,
high linear correlations persist across all DFAs. We train independent ML
models for each DFA and observe convergent trends in feature importance; these
features thus provide DFA-invariant, universal design rules. We devise a
strategy to train ML models informed by all 23 DFAs and use them to predict
properties (e.g., spin-splitting energy) of over 182k TMCs. By requiring
consensus of the ANN-predicted DFA properties, we improve correspondence of
these computational lead compounds with literature-mined, experimental
compounds over the single-DFA approach typically employed. Both feature
analysis and consensus-based ML provide efficient, alternative paths to
overcome accuracy limitations of practical DFT.
- Abstract(参考訳): 高速材料発見には,密度汎関数理論 (DFT) と機械学習 (ML) の加速による仮想高スループットスクリーニング (VHTS) が不可欠である。
必要により、単一の密度汎関数近似(DFA)を用いて効率的なDFTベースのワークフローを実行する。
しかしながら、異なるdfaで評価された特性は、高速スクリーニングが最も必要であり、正確なベンチマークがしばしば利用できない電子構造(例えば、開殻遷移金属錯体、tmcs)において異なうことが期待できる。
DFAバイアスの効果を定量化するために、我々は、複数の家族と「群」にまたがる23の代表的DFA(例えば、半局所から二重ハイブリッド)と2000以上のMCCの基底セットから、迅速に特性予測を得るアプローチを導入する。
計算特性(例えばスピン状態秩序とフロンティア軌道ギャップ)はDFAによって自然に異なるが、高線形相関は全てのDFAにわたって持続する。
DFA毎に独立したMLモデルをトレーニングし、特徴重要度における収束傾向を観察する。
我々は、23のDFAすべてから情報を得たMLモデルを訓練し、182k以上のTMCの特性(例えばスピン分割エネルギー)を予測する戦略を考案した。
ANNが予測するDFA特性のコンセンサスを必要とすることにより、典型的に用いられる単一DFAアプローチに対して、これらの計算鉛化合物と文学的な化合物との対応性を改善する。
特徴分析とコンセンサスに基づくMLは、実用的なDFTの精度制限を克服するために、効率的で代替的なパスを提供する。
関連論文リスト
- Multi-task learning for molecular electronic structure approaching coupled-cluster accuracy [9.81014501502049]
金標準CCSD(T)計算をトレーニングデータとして,有機分子の電子構造を統一した機械学習手法を開発した。
炭化水素分子を用いたモデルでは, 計算コストと様々な量子化学特性の予測精度において, 広範に用いられているハイブリッド関数と二重ハイブリッド関数でDFTより優れていた。
論文 参考訳(メタデータ) (2024-05-09T19:51:27Z) - Intuition-aware Mixture-of-Rank-1-Experts for Parameter Efficient Finetuning [50.73666458313015]
大規模言語モデル(LLM)はマルチメディアアプリケーションで複数のタスクを実行する上で大きな可能性を証明している。
MoEは、効率的なタスクデカップリングのためのスパースアーキテクチャによる有望なソリューションとして登場した。
Intuition-MoR1Eは14のパブリックデータセットで優れた効率と2.15%の全体的な精度向上を実現している。
論文 参考訳(メタデータ) (2024-04-13T12:14:58Z) - Test-Time Adaptation Induces Stronger Accuracy and Agreement-on-the-Line [65.14099135546594]
最近のテスト時間適応 (TTA) 法は, モデルに非常に弱い相関関係を示すシフトであっても, ACL と AGL の傾向を大幅に強化する。
この結果から,TTAとAGLに基づく推定手法を組み合わせることで,より広い分布シフトの集合に対する高精度なモデルOOD性能を推定できることが示唆された。
論文 参考訳(メタデータ) (2023-10-07T23:21:25Z) - Prototype-based Aleatoric Uncertainty Quantification for Cross-modal
Retrieval [139.21955930418815]
クロスモーダル検索手法は、共通表現空間を共同学習することにより、視覚と言語モダリティの類似性関係を構築する。
しかし、この予測は、低品質なデータ、例えば、腐敗した画像、速いペースの動画、詳細でないテキストによって引き起こされるアレタリック不確実性のために、しばしば信頼性が低い。
本稿では, 原型に基づくAleatoric Uncertainity Quantification (PAU) フレームワークを提案する。
論文 参考訳(メタデータ) (2023-09-29T09:41:19Z) - Physics Inspired Hybrid Attention for SAR Target Recognition [61.01086031364307]
本稿では,物理にヒントを得たハイブリットアテンション(PIHA)機構と,この問題に対処するためのOFA評価プロトコルを提案する。
PIHAは、物理的情報の高レベルなセマンティクスを活用して、ターゲットの局所的なセマンティクスを認識した特徴群を活性化し、誘導する。
提案手法は,ASCパラメータが同じ12のテストシナリオにおいて,他の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2023-09-27T14:39:41Z) - Grad DFT: a software library for machine learning enhanced density
functional theory [0.0]
密度汎関数理論(DFT)は、計算量子化学と材料科学の基盤となっている。
最近の研究は、機械学習がDFTの能力をいかに拡張できるかを探求し始めている。
我々は、完全に差別化可能なJAXベースのDFTライブラリであるGrad DFTを紹介し、高速なプロトタイピングと機械学習による交換相関エネルギー関数の実験を可能にする。
論文 参考訳(メタデータ) (2023-09-23T00:25:06Z) - Mitigating the Alignment Tax of RLHF [76.4300447532456]
強化学習(Reinforcement Learning)とヒューマンフィードバック(Human Feedback)の下のLLMの調整は、事前訓練された能力(アライメント税(アライメント税)としても知られる)を忘れてしまう可能性がある。
最小アライメント税を課しながらアライメント性能を最大化するためのモデル平均化を提案する。
我々は,OpenLLaMA-3B上でのRLHFアルゴリズムによるHMAの性能評価を行い,さらにMistral-7Bまで拡張した。
論文 参考訳(メタデータ) (2023-09-12T14:16:54Z) - Accurate machine learning force fields via experimental and simulation
data fusion [0.0]
機械学習(ML)ベースの力場は、量子レベルの精度で古典的原子間ポテンシャルのスケールにまたがる能力のために、ますます関心が高まりつつある。
ここでは、密度汎関数理論(DFT)計算と実験的に測定された力学特性と格子パラメータの両方を活用して、チタンのMLポテンシャルを訓練する。
融合したデータ学習戦略は、全ての対象目標を同時に満たすことができ、結果として、単一のソースデータで訓練されたモデルと比較して高い精度の分子モデルが得られることを実証する。
論文 参考訳(メタデータ) (2023-08-17T18:22:19Z) - A Transferable Recommender Approach for Selecting the Best Density
Functional Approximations in Chemical Discovery [0.4063872661554894]
単一の密度関数近似を普遍的精度で同定することはなく、DFTから生成されたデータの質が不確実になる。
我々は,金標準に対して最小の誤差でDFAを選択するDFAレコメンデータを構築した。
提案手法は, DFAの最高性能を予測し, 化学的発見に優れた精度(約2kcal/mol)が得られる。
論文 参考訳(メタデータ) (2022-07-21T20:45:57Z) - Putting Density Functional Theory to the Test in
Machine-Learning-Accelerated Materials Discovery [2.7810723668216575]
従来のDFTベース機械学習(ML)で典型的なものを超える精度、効率、アプローチに必要な進歩について述べる。
DFTが高スループットのスクリーンで所定のデータポイントを信頼するには、一連のテストに合格しなければならない。
DFTが高スループットのスクリーンで所定のデータポイントを信頼するには、一連のテストに合格しなければならない。
論文 参考訳(メタデータ) (2022-05-06T00:34:50Z) - Pseudo-Spherical Contrastive Divergence [119.28384561517292]
エネルギーベースモデルの最大学習確率を一般化するために,擬球面コントラスト分散(PS-CD)を提案する。
PS-CDは難解な分割関数を避け、学習目的の一般化されたファミリーを提供する。
論文 参考訳(メタデータ) (2021-11-01T09:17:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。