論文の概要: Outlier-Based Domain of Applicability Identification for Materials
Property Prediction Models
- arxiv url: http://arxiv.org/abs/2302.06454v1
- Date: Tue, 17 Jan 2023 07:51:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 14:20:55.468695
- Title: Outlier-Based Domain of Applicability Identification for Materials
Property Prediction Models
- Title(参考訳): 材料特性予測モデルにおける適用可能性の領域
- Authors: Gihan Panapitiya and Emily Saldanha
- Abstract要約: 本稿では,大きな特徴空間を用いた適用可能性領域の探索手法を提案するとともに,検出された領域についてより深い知見を得るための解析手法を提案する。
本研究では,大きな特徴空間を用いた適用可能性領域の探索手法を提案するとともに,検出された領域についてより深い知見を得るための解析手法を提案する。
- 参考スコア(独自算出の注目度): 0.38073142980733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning models have been widely applied for material property
prediction. However, practical application of these models can be hindered by a
lack of information about how well they will perform on previously unseen types
of materials. Because machine learning model predictions depend on the quality
of the available training data, different domains of the material feature space
are predicted with different accuracy levels by such models. The ability to
identify such domains enables the ability to find the confidence level of each
prediction, to determine when and how the model should be employed depending on
the prediction accuracy requirements of different tasks, and to improve the
model for domains with high errors. In this work, we propose a method to find
domains of applicability using a large feature space and also introduce
analysis techniques to gain more insight into the detected domains and
subdomains.
- Abstract(参考訳): 機械学習モデルは材料特性予測に広く応用されている。
しかし、これらのモデルの実用的応用は、これまで見つからなかった種類の材料でどのように機能するかに関する情報の不足によって妨げられる。
機械学習モデル予測は、利用可能なトレーニングデータの品質に依存するため、材料特徴空間の異なる領域は、そのようなモデルによって異なる精度で予測される。
これらのドメインを識別する能力により、各予測の信頼性レベルを見つけ出し、異なるタスクの予測精度要求に応じてモデルがいつどのように使われるべきかを判断し、エラーの高いドメインのモデルを改善することができる。
本研究では,大きな特徴空間を用いた適用性ドメインの探索手法を提案し,検出されたドメインとサブドメインについてより深い洞察を得る分析手法を提案する。
関連論文リスト
- Comparative Evaluation of Applicability Domain Definition Methods for Regression Models [0.0]
適用可能性領域とは、予測モデルの予測が信頼性と正確さを期待するデータの範囲を指す。
本稿では,非決定論的ベイズニューラルネットワークに基づく新しい手法を提案する。
論文 参考訳(メタデータ) (2024-11-01T14:12:57Z) - Learning to Generalize Unseen Domains via Multi-Source Meta Learning for Text Classification [71.08024880298613]
テキスト分類の多元的領域一般化について検討する。
本稿では、複数の参照ドメインを使用して、未知のドメインで高い精度を達成可能なモデルをトレーニングするフレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-20T07:46:21Z) - Determining Domain of Machine Learning Models using Kernel Density Estimates: Applications in Materials Property Prediction [1.8551396341435895]
我々は,カーネル密度推定を用いたモデル領域の評価手法を開発した。
確立された化学知識に基づく無関係と判断された化学物質群は,本測定値と有意な相違が認められた。
相違性の高い尺度は、モデル性能の低さとモデル不確実性の評価の低さと関連している。
論文 参考訳(メタデータ) (2024-05-28T15:41:16Z) - Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Materials Informatics Transformer: A Language Model for Interpretable
Materials Properties Prediction [6.349503549199403]
本稿では,材料特性予測のための材料情報変換器(MatInFormer)について紹介する。
具体的には、関連する空間群情報のトークン化を通じて結晶学の文法を学習する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-30T18:34:55Z) - Entity Aware Modelling: A Survey [22.32009539611539]
最近の機械学習の進歩により、新しい最先端の応答予測モデルが生まれている。
人口レベルで構築されたモデルは、多くのパーソナライズされた予測設定において、最適以下のパフォーマンスをもたらすことが多い。
パーソナライズされた予測では、予測性能を改善するために、異なるエンティティの固有の特性を取り入れることが目的である。
論文 参考訳(メタデータ) (2023-02-16T16:33:33Z) - Assessing Out-of-Domain Language Model Performance from Few Examples [38.245449474937914]
ドメイン外性能(OOD)を数ショットで予測するタスクに対処する。
数ショットの例でモデル精度をみると、このタスクのパフォーマンスをベンチマークする。
帰属に基づく要因がOODの相対モデルの性能のランク付けに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-13T04:45:26Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - Spatial machine-learning model diagnostics: a model-agnostic
distance-based approach [91.62936410696409]
本研究は,空間予測誤差プロファイル (SPEP) と空間変数重要度プロファイル (SVIP) を,新しいモデルに依存しない評価・解釈ツールとして提案する。
統計学的手法、線形モデル、ランダムフォレスト、ハイブリッドアルゴリズムのSPEPとSVIPは、顕著な差異と関連する類似性を示している。
この新しい診断ツールは空間データ科学のツールキットを充実させ、MLモデルの解釈、選択、設計を改善する可能性がある。
論文 参考訳(メタデータ) (2021-11-13T01:50:36Z) - Model-agnostic multi-objective approach for the evolutionary discovery
of mathematical models [55.41644538483948]
現代のデータ科学では、どの部分がより良い結果を得るために置き換えられるかというモデルの性質を理解することがより興味深い。
合成データ駆動型モデル学習において,多目的進化最適化を用いてアルゴリズムの所望特性を求める。
論文 参考訳(メタデータ) (2021-07-07T11:17:09Z) - Transformer Based Multi-Source Domain Adaptation [53.24606510691877]
実践的な機械学習設定では、モデルを予測しなければならないデータは、トレーニングされたデータとは異なる分布から生まれることが多い。
本稿では、複数のソースドメインからラベル付きデータに基づいてモデルを訓練し、ラベル付きデータが見られないドメイン上で予測を行う、教師なしマルチソースドメイン適応の問題について検討する。
本研究では,大規模な事前学習型変圧器を用いたドメインエキスパートの予測が極めて均質であることを示し,それらの予測を混在させる効果的な関数の学習を困難にしている。
論文 参考訳(メタデータ) (2020-09-16T16:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。