論文の概要: BenchML: an extensible pipelining framework for benchmarking
representations of materials and molecules at scale
- arxiv url: http://arxiv.org/abs/2112.02287v1
- Date: Sat, 4 Dec 2021 09:07:16 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-07 18:27:32.140751
- Title: BenchML: an extensible pipelining framework for benchmarking
representations of materials and molecules at scale
- Title(参考訳): BenchML:大規模材料および分子の表現をベンチマークするための拡張可能なパイプライニングフレームワーク
- Authors: Carl Poelking, Felix A. Faber, Bingqing Cheng
- Abstract要約: 物質や分子のデータセットに対して化学系の表現をベンチマークする機械学習フレームワークを提案する。
モデル複雑性を単純な回帰スキームに制限することで、生の記述子の性能を評価するのが原則である。
結果として得られるモデルは、将来のメソッド開発を知らせるベースラインとして意図されている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We introduce a machine-learning (ML) framework for high-throughput
benchmarking of diverse representations of chemical systems against datasets of
materials and molecules. The guiding principle underlying the benchmarking
approach is to evaluate raw descriptor performance by limiting model complexity
to simple regression schemes while enforcing best ML practices, allowing for
unbiased hyperparameter optimization, and assessing learning progress through
learning curves along series of synchronized train-test splits. The resulting
models are intended as baselines that can inform future method development,
next to indicating how easily a given dataset can be learnt. Through a
comparative analysis of the training outcome across a diverse set of
physicochemical, topological and geometric representations, we glean insight
into the relative merits of these representations as well as their
interrelatedness.
- Abstract(参考訳): 材料や分子のデータセットに対する化学システムの多種多様な表現の高スループットベンチマークのための機械学習(ml)フレームワークを提案する。
ベンチマーク手法の根底にある原則は、モデル複雑性を単純な回帰スキームに制限し、最高のMLプラクティスを適用し、バイアスのないハイパーパラメータ最適化を可能にし、一連の同期列車-テスト分割に沿って学習曲線による学習進捗を評価することで、生の記述子のパフォーマンスを評価することである。
得られたモデルは、与えられたデータセットがどれだけ簡単に学習できるかを示すために、将来のメソッド開発を知らせるベースラインとして意図されています。
様々な物理化学的,位相的,幾何学的表現のトレーニング結果の比較分析を通じて,これらの表現の相対的メリットと相互関係性について考察する。
関連論文リスト
- SymbolicAI: A framework for logic-based approaches combining generative
models and solvers [10.558183419341514]
SymbolicAIは、生成プロセスにおける概念学習とフロー管理に論理ベースのアプローチを採用する、汎用的でモジュール化されたフレームワークである。
我々は,大規模言語モデル(LLM)を,自然言語命令と形式言語命令の両方に基づいてタスクを実行する意味的解決器として扱う。
論文 参考訳(メタデータ) (2024-02-01T18:50:50Z) - Online Variational Sequential Monte Carlo [56.16884466478886]
我々は,計算効率が高く正確なモデルパラメータ推定とベイジアン潜在状態推定を提供する変分連続モンテカルロ法(VSMC)を構築した。
オンラインVSMCは、パラメータ推定と粒子提案適応の両方を効率よく、完全にオンザフライで実行することができる。
論文 参考訳(メタデータ) (2023-12-19T21:45:38Z) - On Training Implicit Meta-Learning With Applications to Inductive
Weighing in Consistency Regularization [0.0]
暗黙的メタラーニング(IML)では、特にヘシアン(Hessian)の計算に2ドル(約2,200円)の勾配を必要とする。
ヘッセンの様々な近似が提案されたが、計算コスト、安定性、解の一般化、推定精度の体系的な比較はほとんど見過ごされてしまった。
本稿では,ドメイン固有の特徴を抽出するために,信頼ネットワークをトレーニングすることで,有用画像のアップウェイトや配布外サンプルのダウンウェイトを学べることを示す。
論文 参考訳(メタデータ) (2023-10-28T15:50:03Z) - Discovering Interpretable Physical Models using Symbolic Regression and
Discrete Exterior Calculus [55.2480439325792]
本稿では,記号回帰(SR)と離散指数計算(DEC)を組み合わせて物理モデルの自動発見を行うフレームワークを提案する。
DECは、SRの物理問題への最先端の応用を越えている、場の理論の離散的な類似に対して、ビルディングブロックを提供する。
実験データから連続体物理の3つのモデルを再発見し,本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-10-10T13:23:05Z) - Mixed Semi-Supervised Generalized-Linear-Regression with applications to
Deep-Learning and Interpolators [7.72340900466298]
本稿では、ラベルのないデータを用いて、半教師付き学習法(SSL)を設計する手法を提案する。
それぞれに$alpha$という混合パラメータが含まれており、ラベルのないデータに与えられる重みを制御する。
我々は,標準教師付きモデルと比較して,大幅な改善を実現するための方法論の有効性を実証する。
論文 参考訳(メタデータ) (2023-02-19T09:55:18Z) - PAC Reinforcement Learning for Predictive State Representations [60.00237613646686]
部分的に観察可能な力学系におけるオンライン強化学習(RL)について検討する。
我々は、他のよく知られたモデルをキャプチャする表現モデルである予測状態表現(PSR)モデルに焦点を当てる。
我々は,サンプル複雑性のスケーリングにおいて,ほぼ最適なポリシを学習可能な,PSRのための新しいモデルベースアルゴリズムを開発した。
論文 参考訳(メタデータ) (2022-07-12T17:57:17Z) - Model-agnostic multi-objective approach for the evolutionary discovery
of mathematical models [55.41644538483948]
現代のデータ科学では、どの部分がより良い結果を得るために置き換えられるかというモデルの性質を理解することがより興味深い。
合成データ駆動型モデル学習において,多目的進化最適化を用いてアルゴリズムの所望特性を求める。
論文 参考訳(メタデータ) (2021-07-07T11:17:09Z) - MINIMALIST: Mutual INformatIon Maximization for Amortized Likelihood
Inference from Sampled Trajectories [61.3299263929289]
シミュレーションベースの推論は、その可能性が実際に計算できない場合でもモデルのパラメータを学習することができる。
あるクラスのメソッドは、異なるパラメータでシミュレートされたデータを使用して、確率とエビデンス比の償却推定器を推定する。
モデルパラメータとシミュレーションデータ間の相互情報の観点から,本手法が定式化可能であることを示す。
論文 参考訳(メタデータ) (2021-06-03T12:59:16Z) - Model-data-driven constitutive responses: application to a multiscale
computational framework [0.0]
古典法則(モデルベース)、データ駆動補正コンポーネント、計算的マルチスケールアプローチを組み合わせたハイブリッド方法論が提示される。
非線形数値均質化法により得られた低スケールのデータを用いてモデルベース材料表現を局所的に改善する。
提案手法では,モデルとデータの両方が基本的な役割を担い,物理に基づく応答と機械学習のブラックボックスの相乗的統合を実現する。
論文 参考訳(メタデータ) (2021-04-06T16:34:46Z) - Structure-Property Maps with Kernel Principal Covariates Regression [0.0]
そこで本研究では,PCovRのカーネル化バージョンとスパーシフィケード拡張を導入し,構造-プロパティ関係の明確化と予測における本手法の性能を示す。
本稿では, 元素炭素, 多孔質ケイ酸塩, 有機分子, アミノ酸コンフォメータ, 分子材料の例を示す。
論文 参考訳(メタデータ) (2020-02-12T16:29:24Z) - Meta-learning framework with applications to zero-shot time-series
forecasting [82.61728230984099]
この研究は幅広いメタラーニングフレームワークを使って肯定的な証拠を提供する。
残余接続はメタラーニング適応機構として機能する。
我々は、ソースTSデータセット上でニューラルネットワークをトレーニングし、異なるターゲットTSデータセット上で再トレーニングすることなくデプロイできることを示します。
論文 参考訳(メタデータ) (2020-02-07T16:39:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。