論文の概要: Benchmarking bandgap prediction in semiconductors under experimental and realistic evaluation settings
- arxiv url: http://arxiv.org/abs/2604.25568v1
- Date: Tue, 28 Apr 2026 12:39:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.852791
- Title: Benchmarking bandgap prediction in semiconductors under experimental and realistic evaluation settings
- Title(参考訳): 実験的および現実的な評価条件下での半導体のバンドギャップ予測
- Authors: Haolin Wang, Xianyuan Liu, Anna Jungbluth, Alexandra J. Ramadan, Robert D. J. Oliver, Haiping Lu,
- Abstract要約: RealMat-BaGは実験的な条件下でモデルの信頼性を評価するためのベンチマークである。
我々は,実験用バンドギャップのオープンアクセスデータセットを結晶構造に沿ってキュレートし,グラフニューラルネットワークと比較する。
- 参考スコア(独自算出の注目度): 41.716484717366264
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurate bandgap prediction is crucial for semiconductor applications, yet machine learning models trained on computational data often struggle to generalize to experimental bandgap measurements. Challenges related to data fidelity, domain generalization, and model interpretability remain insufficiently addressed in existing evaluation frameworks. To bridge this gap, we introduce RealMat-BaG, a benchmark for assessing model reliability under experimentally relevant conditions. We curate an open-access dataset of experimental bandgaps with aligned crystal structures and compare graph neural networks as well as classical machine learning baselines. Our framework evaluates performance across statistical and domain-based splits, examines transfer from DFT-computed to experimental bandgaps, and analyzes interpretability at both elemental-property and structural levels. Our results reveal the fundamental generalization limitations of current bandgap prediction models and establish a benchmark aligned with experimental measurements for developing more reliable learning strategies for materials discovery.
- Abstract(参考訳): 半導体アプリケーションには正確なバンドギャップ予測が不可欠であるが、計算データに基づいて訓練された機械学習モデルは、実験的なバンドギャップ測定に一般化するのに苦労することが多い。
データ忠実性、ドメインの一般化、モデルの解釈可能性に関する課題は、既存の評価フレームワークでは未解決のままである。
このギャップを埋めるために、実験的な条件下でモデルの信頼性を評価するベンチマークであるRealMat-BaGを導入する。
実験用バンドギャップのオープンアクセスデータセットを整列結晶構造でキュレートし,グラフニューラルネットワークと古典的機械学習ベースラインを比較した。
本フレームワークは,DFTから実験用バンドギャップへの変換と,要素特性と構造レベルの相互解釈性の解析を行う。
本研究は,現在のバンドギャップ予測モデルの基本的一般化限界を明らかにし,材料発見のためのより信頼性の高い学習戦略を開発するための実験結果と整合したベンチマークを構築した。
関連論文リスト
- The Benchmarking Epistemology: Construct Validity for Evaluating Machine Learning Models [1.1315617886931963]
我々は心理的な測定理論に触発された構成妥当性の条件を策定する。
3つのケーススタディを通じて、これらの仮定を実際に検討する。
本フレームワークは,ベンチマークスコアが多様な科学的クレームをサポートする条件を明らかにする。
論文 参考訳(メタデータ) (2025-10-27T10:30:30Z) - Evaluating Universal Machine Learning Force Fields Against Experimental Measurements [15.863801293927635]
ユニバーサル機械学習力場(UMLFF)は、周期表を横断する素早い原子論シミュレーションを可能にすることによって、材料科学に革命をもたらすことを約束する。
ここでは, 1500の慎重に硬化した鉱物構造の実験的測定に対して, 実験結合性FFsを総合的に評価するためのフレームワークであるUniFFBenchについて述べる。
計算ベンチマークにおける印象的な性能を達成するモデルは、実験的な複雑さに直面すると、しばしば失敗する。
論文 参考訳(メタデータ) (2025-08-07T18:21:39Z) - Can We Validate Counterfactual Estimations in the Presence of General Network Interference? [13.49152464081862]
我々は、因果推論における推定と検証の両方に機械学習ツールを使うことを容易にするフレームワークを導入する。
新しい分布保存ネットワークブートストラップは、単一実験のデータから統計的に有意なサブポピュレーションを生成する。
ファクトファクトのクロスバリデーション手順は、モデル検証の原則を因果的設定のユニークな制約に適応させる。
論文 参考訳(メタデータ) (2025-02-03T06:51:04Z) - Testing Generalizability in Causal Inference [3.547529079746247]
機械学習アルゴリズムの一般化性を統計的に評価するための公式な手続きは存在しない。
本研究では,高次元因果推論モデルの一般化可能性を統計的に評価するための体系的枠組みを提案する。
論文 参考訳(メタデータ) (2024-11-05T11:44:00Z) - Fast and Reliable Probabilistic Reflectometry Inversion with Prior-Amortized Neural Posterior Estimation [73.81105275628751]
リフレクションメトリデータと互換性のある全ての構造を見つけることは、標準アルゴリズムでは計算が禁止される。
この信頼性の欠如に対処するため,確率論的深層学習法を用いて,現実的な構造を数秒で識別する。
提案手法は,シミュレーションに基づく推論と新しい適応型事前推定を併用する。
論文 参考訳(メタデータ) (2024-07-26T10:29:16Z) - GenBench: A Benchmarking Suite for Systematic Evaluation of Genomic Foundation Models [56.63218531256961]
我々はGenomic Foundation Modelsの有効性を評価するためのベンチマークスイートであるGenBenchを紹介する。
GenBenchはモジュラーで拡張可能なフレームワークを提供し、様々な最先端の方法論をカプセル化している。
本稿では,タスク固有性能におけるモデルアーキテクチャとデータセット特性の相互作用のニュアンス解析を行う。
論文 参考訳(メタデータ) (2024-06-01T08:01:05Z) - CausalBench: A Large-scale Benchmark for Network Inference from
Single-cell Perturbation Data [61.088705993848606]
本稿では,実世界の介入データに対する因果推論手法を評価するベンチマークスイートCausalBenchを紹介する。
CaulBenchには、新しい分散ベースの介入メトリクスを含む、生物学的に動機付けられたパフォーマンスメトリクスが含まれている。
論文 参考訳(メタデータ) (2022-10-31T13:04:07Z) - Estimating the Effects of Continuous-valued Interventions using
Generative Adversarial Networks [103.14809802212535]
我々は,連続的評価介入の効果を推定する問題に対処するため,GAN(Generative Adversarial Network)フレームワークを構築した。
我々のモデルであるSCIGANは柔軟であり、いくつかの異なる継続的な介入に対する対実的な結果の同時推定が可能である。
継続的な介入に移行することによって生じる課題に対処するために、差別者のための新しいアーキテクチャを提案する。
論文 参考訳(メタデータ) (2020-02-27T18:46:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。