論文の概要: Outlier-Based Domain of Applicability Identification for Materials
Property Prediction Models
- arxiv url: http://arxiv.org/abs/2302.06454v1
- Date: Tue, 17 Jan 2023 07:51:12 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-19 14:20:55.468695
- Title: Outlier-Based Domain of Applicability Identification for Materials
Property Prediction Models
- Title(参考訳): 材料特性予測モデルにおける適用可能性の領域
- Authors: Gihan Panapitiya and Emily Saldanha
- Abstract要約: 本稿では,大きな特徴空間を用いた適用可能性領域の探索手法を提案するとともに,検出された領域についてより深い知見を得るための解析手法を提案する。
本研究では,大きな特徴空間を用いた適用可能性領域の探索手法を提案するとともに,検出された領域についてより深い知見を得るための解析手法を提案する。
- 参考スコア(独自算出の注目度): 0.38073142980733
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine learning models have been widely applied for material property
prediction. However, practical application of these models can be hindered by a
lack of information about how well they will perform on previously unseen types
of materials. Because machine learning model predictions depend on the quality
of the available training data, different domains of the material feature space
are predicted with different accuracy levels by such models. The ability to
identify such domains enables the ability to find the confidence level of each
prediction, to determine when and how the model should be employed depending on
the prediction accuracy requirements of different tasks, and to improve the
model for domains with high errors. In this work, we propose a method to find
domains of applicability using a large feature space and also introduce
analysis techniques to gain more insight into the detected domains and
subdomains.
- Abstract(参考訳): 機械学習モデルは材料特性予測に広く応用されている。
しかし、これらのモデルの実用的応用は、これまで見つからなかった種類の材料でどのように機能するかに関する情報の不足によって妨げられる。
機械学習モデル予測は、利用可能なトレーニングデータの品質に依存するため、材料特徴空間の異なる領域は、そのようなモデルによって異なる精度で予測される。
これらのドメインを識別する能力により、各予測の信頼性レベルを見つけ出し、異なるタスクの予測精度要求に応じてモデルがいつどのように使われるべきかを判断し、エラーの高いドメインのモデルを改善することができる。
本研究では,大きな特徴空間を用いた適用性ドメインの探索手法を提案し,検出されたドメインとサブドメインについてより深い洞察を得る分析手法を提案する。
関連論文リスト
- Prospector Heads: Generalized Feature Attribution for Large Models &
Data [63.33062996732212]
本稿では,特徴帰属のための説明に基づく手法の,効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - Predictors from causal features do not generalize better to new domains [18.95420918106124]
我々は、因果的特徴に基づいて訓練された機械学習モデルがドメイン間でどのように一般化されるかを研究する。
我々の目標は、因果的特徴に基づいて訓練されたモデルがドメイン間でより良く一般化されるという仮説をテストすることである。
論文 参考訳(メタデータ) (2024-02-15T11:34:38Z) - Materials Informatics Transformer: A Language Model for Interpretable
Materials Properties Prediction [6.349503549199403]
本稿では,材料特性予測のための材料情報変換器(MatInFormer)について紹介する。
具体的には、関連する空間群情報のトークン化を通じて結晶学の文法を学習する新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-08-30T18:34:55Z) - Entity Aware Modelling: A Survey [22.32009539611539]
最近の機械学習の進歩により、新しい最先端の応答予測モデルが生まれている。
人口レベルで構築されたモデルは、多くのパーソナライズされた予測設定において、最適以下のパフォーマンスをもたらすことが多い。
パーソナライズされた予測では、予測性能を改善するために、異なるエンティティの固有の特性を取り入れることが目的である。
論文 参考訳(メタデータ) (2023-02-16T16:33:33Z) - Assessing Out-of-Domain Language Model Performance from Few Examples [38.245449474937914]
ドメイン外性能(OOD)を数ショットで予測するタスクに対処する。
数ショットの例でモデル精度をみると、このタスクのパフォーマンスをベンチマークする。
帰属に基づく要因がOODの相対モデルの性能のランク付けに有効であることを示す。
論文 参考訳(メタデータ) (2022-10-13T04:45:26Z) - Synthetic Model Combination: An Instance-wise Approach to Unsupervised
Ensemble Learning [92.89846887298852]
ラベル付きデータのトレーニングセットから学ぶ機会のない、新しいテストデータに対する予測を検討する。
専門家モデルのセットと予測へのアクセスと、トレーニングに使用するデータセットに関する制限された情報を提供すること。
論文 参考訳(メタデータ) (2022-10-11T10:20:31Z) - Model Reprogramming: Resource-Efficient Cross-Domain Machine Learning [65.268245109828]
視覚、言語、音声などのデータに富む領域では、ディープラーニングが高性能なタスク固有モデルを提供するのが一般的である。
リソース制限されたドメインでのディープラーニングは、(i)限られたデータ、(ii)制約付きモデル開発コスト、(iii)効果的な微調整のための適切な事前学習モデルの欠如など、多くの課題に直面している。
モデル再プログラミングは、ソースドメインから十分に訓練されたモデルを再利用して、モデル微調整なしでターゲットドメインのタスクを解くことで、リソース効率のよいクロスドメイン機械学習を可能にする。
論文 参考訳(メタデータ) (2022-02-22T02:33:54Z) - Spatial machine-learning model diagnostics: a model-agnostic
distance-based approach [91.62936410696409]
本研究は,空間予測誤差プロファイル (SPEP) と空間変数重要度プロファイル (SVIP) を,新しいモデルに依存しない評価・解釈ツールとして提案する。
統計学的手法、線形モデル、ランダムフォレスト、ハイブリッドアルゴリズムのSPEPとSVIPは、顕著な差異と関連する類似性を示している。
この新しい診断ツールは空間データ科学のツールキットを充実させ、MLモデルの解釈、選択、設計を改善する可能性がある。
論文 参考訳(メタデータ) (2021-11-13T01:50:36Z) - Model-agnostic multi-objective approach for the evolutionary discovery
of mathematical models [55.41644538483948]
現代のデータ科学では、どの部分がより良い結果を得るために置き換えられるかというモデルの性質を理解することがより興味深い。
合成データ駆動型モデル学習において,多目的進化最適化を用いてアルゴリズムの所望特性を求める。
論文 参考訳(メタデータ) (2021-07-07T11:17:09Z) - Discriminative, Generative and Self-Supervised Approaches for
Target-Agnostic Learning [8.666667951130892]
生成的および自己教師型学習モデルは、そのタスクでうまく機能することが示されている。
擬似相似理論の導出した定理は、結合分布モデルの推定に関係があることも示している。
論文 参考訳(メタデータ) (2020-11-12T15:03:40Z) - Transformer Based Multi-Source Domain Adaptation [53.24606510691877]
実践的な機械学習設定では、モデルを予測しなければならないデータは、トレーニングされたデータとは異なる分布から生まれることが多い。
本稿では、複数のソースドメインからラベル付きデータに基づいてモデルを訓練し、ラベル付きデータが見られないドメイン上で予測を行う、教師なしマルチソースドメイン適応の問題について検討する。
本研究では,大規模な事前学習型変圧器を用いたドメインエキスパートの予測が極めて均質であることを示し,それらの予測を混在させる効果的な関数の学習を困難にしている。
論文 参考訳(メタデータ) (2020-09-16T16:56:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。