論文の概要: Role of Structural and Conformational Diversity for Machine Learning
Potentials
- arxiv url: http://arxiv.org/abs/2311.00862v1
- Date: Mon, 30 Oct 2023 19:33:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-03 15:27:14.798724
- Title: Role of Structural and Conformational Diversity for Machine Learning
Potentials
- Title(参考訳): 機械学習ポテンシャルにおける構造的・コンフォメーション的多様性の役割
- Authors: Nikhil Shenoy, Prudencio Tossou, Emmanuel Noutahi, Hadrien Mary,
Dominique Beaini, Jiarui Ding
- Abstract要約: 量子力学におけるデータバイアスとモデル一般化の関係について検討する。
この結果から,一般化指標の微妙なパターンが明らかになった。
これらの知見は、QMデータ生成のための貴重な洞察とガイドラインを提供する。
- 参考スコア(独自算出の注目度): 4.608732256350959
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the field of Machine Learning Interatomic Potentials (MLIPs),
understanding the intricate relationship between data biases, specifically
conformational and structural diversity, and model generalization is critical
in improving the quality of Quantum Mechanics (QM) data generation efforts. We
investigate these dynamics through two distinct experiments: a fixed budget
one, where the dataset size remains constant, and a fixed molecular set one,
which focuses on fixed structural diversity while varying conformational
diversity. Our results reveal nuanced patterns in generalization metrics.
Notably, for optimal structural and conformational generalization, a careful
balance between structural and conformational diversity is required, but
existing QM datasets do not meet that trade-off. Additionally, our results
highlight the limitation of the MLIP models at generalizing beyond their
training distribution, emphasizing the importance of defining applicability
domain during model deployment. These findings provide valuable insights and
guidelines for QM data generation efforts.
- Abstract(参考訳): 機械学習の原子間ポテンシャル(mlips)の分野では、データバイアス、特にコンフォメーションと構造的多様性の間の複雑な関係を理解し、モデル一般化は量子力学(qm)データ生成作業の品質向上に不可欠である。
この2つの異なる実験により、データセットサイズが一定である固定的予算1と、構造的多様性を変化させつつ、固定的な構造的多様性に焦点をあてた固定的分子集合1とを探索する。
その結果,一般化指標におけるニュアンスパターンが明らかになった。
特に、最適構造とコンフォーメーションの一般化には、構造とコンフォーメーションの多様性の慎重なバランスが必要であるが、既存のQMデータセットはそのトレードオフを満たしていない。
さらに,モデル展開における適用可能性ドメイン定義の重要性を強調しながら,トレーニング分布を超えて一般化するmlipモデルの限界を強調する。
これらの知見は、QMデータ生成のための貴重な洞察とガイドラインを提供する。
関連論文リスト
- Physical Consistency Bridges Heterogeneous Data in Molecular Multi-Task Learning [79.75718786477638]
我々は、それらを接続する物理法則が存在する分子的タスクの専門性を生かし、整合性トレーニングアプローチを設計する。
より正確なエネルギーデータにより、構造予測の精度が向上することを示した。
また、整合性トレーニングは、構造予測を改善するために、力と非平衡構造データを直接活用できることがわかった。
論文 参考訳(メタデータ) (2024-10-14T03:11:33Z) - Differentiation and Specialization of Attention Heads via the Refined Local Learning Coefficient [0.49478969093606673]
特異学習理論に基づくモデル複雑性の尺度である局所学習係数 (LLC) の洗練された変種を導入する。
本研究では,トランスフォーマー言語モデルにおける内部構造の開発について検討する。
論文 参考訳(メタデータ) (2024-10-03T20:51:02Z) - Learning Divergence Fields for Shift-Robust Graph Representations [73.11818515795761]
本研究では,相互依存データに対する問題に対して,学習可能な分散場を持つ幾何学的拡散モデルを提案する。
因果推論によって新たな学習目標が導出され、ドメイン間で無神経な相互依存の一般化可能なパターンを学習するためのモデルが導出される。
論文 参考訳(メタデータ) (2024-06-07T14:29:21Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - DA-VEGAN: Differentiably Augmenting VAE-GAN for microstructure
reconstruction from extremely small data sets [110.60233593474796]
DA-VEGANは2つの中心的なイノベーションを持つモデルである。
$beta$-variational autoencoderはハイブリッドGANアーキテクチャに組み込まれている。
このアーキテクチャに特化して、独自の差別化可能なデータ拡張スキームが開発されている。
論文 参考訳(メタデータ) (2023-02-17T08:49:09Z) - DIFFormer: Scalable (Graph) Transformers Induced by Energy Constrained
Diffusion [66.21290235237808]
本稿では,データセットからのインスタンスのバッチを進化状態にエンコードするエネルギー制約拡散モデルを提案する。
任意のインスタンス対間の対拡散強度に対する閉形式最適推定を示唆する厳密な理論を提供する。
各種タスクにおいて優れた性能を有する汎用エンコーダバックボーンとして,本モデルの適用性を示す実験を行った。
論文 参考訳(メタデータ) (2023-01-23T15:18:54Z) - Dynamic Latent Separation for Deep Learning [67.62190501599176]
機械学習の中核的な問題は、複雑なデータに対するモデル予測のための表現力のある潜在変数を学習することである。
本稿では,表現性を向上し,部分的解釈を提供し,特定のアプリケーションに限定されないアプローチを開発する。
論文 参考訳(メタデータ) (2022-10-07T17:56:53Z) - Evolution TANN and the discovery of the internal variables and evolution
equations in solid mechanics [0.0]
材料表現をインクリメンタルな定式化から切り離す新しい手法を提案する。
熱力学に基づくニューラルネットワーク(TANN)と内部変数の理論にインスパイアされた進化 TANN(eTANN)は、連続時間である。
提案手法の主な特徴は、通常の微分方程式の形で内部変数の進化方程式の発見である。
論文 参考訳(メタデータ) (2022-09-27T09:25:55Z) - Scalable Gaussian Processes for Data-Driven Design using Big Data with
Categorical Factors [14.337297795182181]
ガウス過程(GP)は、大きなデータセット、カテゴリ入力、および複数の応答を調節するのに困難である。
本稿では,変分推論によって得られた潜伏変数と関数を用いて,上記の課題を同時に解決するGPモデルを提案する。
本手法は三元系酸化物材料の機械学習と多スケール対応機構のトポロジー最適化に有用である。
論文 参考訳(メタデータ) (2021-06-26T02:17:23Z) - Learning Structured Latent Factors from Dependent Data:A Generative
Model Framework from Information-Theoretic Perspective [18.88255368184596]
本稿では,潜在空間における様々な基盤構造を持つ生成モデル学習のための新しいフレームワークを提案する。
我々のモデルは、様々なタイプの望まれる構造を反映した意味論的に意味のある潜在因子の集合を学習するための原則化されたアプローチを提供する。
論文 参考訳(メタデータ) (2020-07-21T06:59:29Z) - Data-Driven Topology Optimization with Multiclass Microstructures using
Latent Variable Gaussian Process [18.17435834037483]
メタマテリアルの微細構造ライブラリーのための多応答潜在変数ガウス過程 (LVGP) モデルを開発した。
MR-LVGPモデルでは、混合変数の応答に対する集合的影響に基づいて、混合変数を連続的な設計空間に埋め込む。
マイクロ構造, マクロ構造に対する一貫した負荷伝達経路により, マルチクラスのマイクロ構造を考えることで, 性能の向上が期待できることを示す。
論文 参考訳(メタデータ) (2020-06-27T03:55:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。