論文の概要: Robust Machine Learning Framework for Reliable Discovery of High-Performance Half-Heusler Thermoelectrics
- arxiv url: http://arxiv.org/abs/2602.01149v1
- Date: Sun, 01 Feb 2026 10:50:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-03 19:28:33.626966
- Title: Robust Machine Learning Framework for Reliable Discovery of High-Performance Half-Heusler Thermoelectrics
- Title(参考訳): 高性能半高温熱電素子の信頼性発見のためのロバスト機械学習フレームワーク
- Authors: Shoeb Athar, Adrien Mecibah, Philippe Jund,
- Abstract要約: 機械学習(ML)は、環境危機に対処するための効率的な熱電(TE)材料発見を促進する。
MLモデルは、高いメトリクスにもかかわらず、しばしば実験的な一般化性に悩まされる。
本研究は、半ハウスラー(hH)構造プロトタイプに適用した頑健なワークフローを有益(zT)予測に適用する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Machine learning (ML) can facilitate efficient thermoelectric (TE) material discovery essential to address the environmental crisis. However, ML models often suffer from poor experimental generalizability despite high metrics. This study presents a robust workflow, applied to the half-Heusler (hH) structural prototype, for figure of merit (zT) prediction, to improve the generalizability of ML models. To resolve challenges in dataset handling and feature filtering, we first introduce a rigorous PCA-based splitting method that ensures training and test sets are unbiased and representative of the full chemical space. We then integrate Bayesian hyperparameter optimization with k-best feature filtering across three architectures-Random Forest, XGBoost, and Neural Networks - while employing SISSO symbolic regression for physical insight and comparison. Using SHAP and SISSO analysis, we identify A-site dopant concentration (xA'), and A-site Heat of Vaporization (HVA) as the primary drivers of zT besides Temperature (T). Finally, a high-throughput screening of approximately 6.6x10^8 potential compositions, filtered by stability constraints, yielded several novel high-zT candidates. Breaking from the traditional focus of improving test RMSE/R^2 values of the models, this work shifts the attention on establishing the test set a true proxy for model generalizability and strengthening the often neglected modules of the existing ML workflows for the data-driven design of next-generation thermoelectric materials.
- Abstract(参考訳): 機械学習(ML)は、環境危機に対処するための効率的な熱電(TE)材料発見を促進する。
しかし、MLモデルは高いメトリクスにもかかわらず、しばしば実験的な一般化に苦しむ。
本研究は,MLモデルの一般化性を改善するため,半ハウスラー (hH) 構造プロトタイプに適用した頑健なワークフローを提案する。
データセット処理と特徴フィルタリングの課題を解決するために,我々はまず,厳密なPCAベースの分割手法を導入する。
次に、ベイズ超パラメータ最適化と、Random Forest、XGBoost、Neural Networksという3つのアーキテクチャにわたるk-best機能フィルタリングを統合する。
SHAPおよびSISSO分析を用いて,温度(T)以外のzTの主成分として,A部位のドーパント濃度(xA')とA部位の気化熱(HVA)を同定した。
最後に、安定性の制約によってフィルタリングされた約6.6x10^8の電位組成の高スループットスクリーニングにより、いくつかの新しい高ZT候補が得られた。
この研究は、モデルのRMSE/R^2値を改善するという従来の焦点から外れており、テストセットの確立がモデル一般化可能性の真のプロキシとなり、次世代熱電材料のデータ駆動設計のために既存のMLワークフローのしばしば無視されるモジュールを強化することに注意を向けている。
関連論文リスト
- Improving Minimax Estimation Rates for Contaminated Mixture of Multinomial Logistic Experts via Expert Heterogeneity [49.809923981964715]
凍結したエキスパートとして機能する事前訓練されたモデルを、新しいタスクを学ぶためにトレーニング可能なエキスパートとして機能するアダプタモデルに統合するトランスファー学習手法によって、汚染された専門家の混合(MoE)が動機付けられる。
本研究は, 地絡パラメータがサンプルサイズによって異なる困難な条件下で, パラメータを推定するための一様収束率を特徴付ける。
また、対応するミニマックス下限を定め、これらのレートがミニマックス最適であることを保証する。
論文 参考訳(メタデータ) (2026-01-31T23:45:50Z) - China Regional 3km Downscaling Based on Residual Corrective Diffusion Model [39.12803910865843]
この研究は、低解像度と高解像度の歴史的データの統計的関係を確立する統計的ダウンスケーリングに焦点を当てている。
CorrDiffのオリジナルの作品とは対照的に、この作品で考慮された地域は40倍近く大きい。
ディープラーニングはこのタスクの強力なツールとして登場し、様々な高性能超解像モデルを生み出している。
論文 参考訳(メタデータ) (2025-12-05T02:27:08Z) - Fusion-Based Neural Generalization for Predicting Temperature Fields in Industrial PET Preform Heating [0.4337994560632144]
一般化温度予測のための新しいディープラーニングフレームワークを提案する。
各材料や設計のバリエーションに対して広範なリトレーニングを必要とする従来のモデルとは異なり、本手法ではデータ効率のよいニューラルアーキテクチャを導入している。
提案手法は,スクラッチからトレーニングしたモデルと比較して,大規模なシミュレーションデータセットの必要性を低減し,優れた性能を実現する。
論文 参考訳(メタデータ) (2025-10-06T21:38:37Z) - Process-Informed Forecasting of Complex Thermal Dynamics in Pharmaceutical Manufacturing [3.6138260410017797]
医薬液化における温度に対するプロセスインフォームド予測(PIF)モデルを導入する。
PIFモデルは、正確性、物理的妥当性、耐雑音性の観点から、データ駆動モデルよりも優れています。
論文 参考訳(メタデータ) (2025-09-24T17:42:00Z) - TSGym: Design Choices for Deep Multivariate Time-Series Forecasting [38.12202305030755]
この作業は、深いMTSFメソッドをそのコアできめ細かいコンポーネントに分解することでギャップを埋める。
MTSFタスクのためのTSGymと呼ばれる新しい自動化ソリューションを提案する。
大規模な実験により、TSGymは既存のMTSF法やAutoML法よりも大幅に優れていることが示された。
論文 参考訳(メタデータ) (2025-09-21T12:49:31Z) - QGAPHEnsemble : Combining Hybrid QLSTM Network Ensemble via Adaptive Weighting for Short Term Weather Forecasting [0.0]
本研究は,高度な機械学習技術を用いた実践的有効性を強調した。
本モデルでは,気象予測の精度と信頼性が大幅に向上したことを示す。
本稿では,天気予報タスクの性能向上のために,最適化アンサンブル技術の重要性を強調した。
論文 参考訳(メタデータ) (2025-01-18T20:18:48Z) - AI enhanced data assimilation and uncertainty quantification applied to
Geological Carbon Storage [0.0]
本稿では,Surrogate-based hybrid ESMDA (SH-ESMDA)を導入し,Surrogate-based hybrid ESMDA (SH-ESMDA)について述べる。
また,SurrogateをベースとしたHybrid RML(SH-RML)も導入する。
以上の結果より,SH-RMLは従来のESMDAと比較して不確実性が高いことが示唆された。
論文 参考訳(メタデータ) (2024-02-09T00:24:46Z) - Bayesian tomography using polynomial chaos expansion and deep generative
networks [0.0]
可変オートエンコーダ(VAE)の優れた再構成性能とPCA-PCEサロゲートモデリングの精度を組み合わせた戦略を提案する。
MCMCプロセス内では、VOEのパラメトリゼーションが事前の探査とサンプル提案に利用される。
論文 参考訳(メタデータ) (2023-07-09T16:44:37Z) - Prediction of liquid fuel properties using machine learning models with
Gaussian processes and probabilistic conditional generative learning [56.67751936864119]
本研究の目的は、代替燃料の物理的特性を予測するためのクロージャ方程式として機能する、安価で計算可能な機械学習モデルを構築することである。
これらのモデルは、MDシミュレーションのデータベースや、データ融合-忠実性アプローチによる実験的な測定を用いて訓練することができる。
その結果,MLモデルでは,広範囲の圧力および温度条件の燃料特性を正確に予測できることがわかった。
論文 参考訳(メタデータ) (2021-10-18T14:43:50Z) - On Minimum Word Error Rate Training of the Hybrid Autoregressive
Transducer [40.63693071222628]
ハイブリッド自己回帰変換器(HAT)の最小単語誤り率(MWER)訓練について検討する。
約3万時間のトレーニングデータを用いた実験から,MWERトレーニングがHATモデルの精度を向上させることを示す。
論文 参考訳(メタデータ) (2020-10-23T21:16:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。