論文の概要: Accelerating materials discovery using foundation model based In-context active learning
- arxiv url: http://arxiv.org/abs/2603.12567v1
- Date: Fri, 13 Mar 2026 01:57:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-16 17:38:11.843069
- Title: Accelerating materials discovery using foundation model based In-context active learning
- Title(参考訳): 基礎モデルに基づくインコンテキストアクティブラーニングを用いた教材発見の高速化
- Authors: Jeffrey Hu, Rongzhi Dong, Ying Feng, Ming Hu, Jianjun Hu,
- Abstract要約: アクティブラーニングは、材料発見を加速するための強力なパラダイムとして登場した。
本研究では,数百万の合成タスクを事前学習した変換器ベース基礎モデルであるTabPFNを提案する。
10データセット中8データセットでTabPFNが勝利し、GPに対する追加実験/評価で平均52%、RFに対する29.77%の節約を達成した。
- 参考スコア(独自算出の注目度): 12.870479903068665
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Active learning (AL) has emerged as a powerful paradigm for accelerating materials discovery by iteratively steering experiments toward the most promising candidates, reducing costly synthesis-and-characterization cycles. However, current AL relies predominantly on Gaussian Process (GP) and Random Forest (RF) surrogates with complementary limitations: GP underfits complex composition--property landscapes due to rigid kernel assumptions, while RF produces unreliable uncertainty estimates in small-data regimes, precisely where most materials datasets reside (with < 500 samples). Here we propose foudaiton model based In-Context Active Learning (ICAL), replacing conventional surrogates with TabPFN, a transformer-based foundation model pre-trained on millions of synthetic tasks to meta-learn a universal prior over tabular data. TabPFN performs principled Bayesian inference in a single forward pass without dataset-specific retraining, delivering well-calibrated predictive uncertainty where GP and RF fail most severely. Benchmarked against GP and RF across 10 materials datasets spanning copper alloy hardness and electrical conductivity, bulk metallic glass-forming ability, and crystal lattice thermal conductivity, TabPFN wins on 8 out of 10 datasets, achieving a mean saving of 52\% in extra experiments/evaluations relative to GP and 29.77% relative to RF. Cross-validation analysis confirms that TabPFN's advantage stems from superior uncertainty calibration,achieving the lowest Negative Log-Likelihood and Area Under the Sparsification Error curve among all surrogates. Our work demonstrates that a pre-trained foundation model can serve as a highly effective surrogate for accelerating active learning-based materials discovery.
- Abstract(参考訳): アクティブラーニング (AL) は、実験を最も有望な候補に向けて反復的に操り、コストのかかる合成・評価サイクルを減らし、材料発見を加速する強力なパラダイムとして登場した。
しかし、現在のALはガウス過程 (GP) とランダムフォレスト (RF) に主に依存しており、相補的な制限がある: GP は複雑な組成-固有な風景に不適合であり、一方 RF は小さなデータ構造において信頼性の低い不確実性を推定する。
本稿では,Foudaitonモデルに基づくIn-Context Active Learning(ICAL)を提案し,従来のサロゲートをTabPFNに置き換える。
TabPFNは、データセット固有のリトレーニングなしで単一の前方パスでベイズ推定を行い、GPとRFが最も深刻な障害となるような、よく校正された予測の不確実性を提供する。
銅合金硬度、電気伝導率、バルク金属ガラス形成能、結晶格子熱伝導率にまたがる10の材料データセットでGPとRFを比較し、TabPFNは10のデータセットのうち8つで勝利し、GPに対する追加実験や評価において平均52\%、RFに対する29.77%の節約を達成した。
クロスバリデーション分析により、TabPFNの利点は優れた不確実性校正に起因することが確認された。
我々の研究は、事前学習された基礎モデルが、活発な学習に基づく教材発見を加速するための、非常に効果的なサロゲートとして機能することを実証している。
関連論文リスト
- Benchmarking Few-shot Transferability of Pre-trained Models with Improved Evaluation Protocols [123.73663884421272]
より強力な事前訓練モデルと改良された適応アルゴリズムによって、わずかなショット転送が革新されている。
FEWTRANSは10種類のデータセットを含む総合的なベンチマークである。
FEWTRANS をリリースすることにより,数発の転写学習研究において再現性の向上を合理化するための厳密な "ルーラー" の提供を目指す。
論文 参考訳(メタデータ) (2026-02-28T05:41:57Z) - Robust Machine Learning Framework for Reliable Discovery of High-Performance Half-Heusler Thermoelectrics [0.0]
機械学習(ML)は、環境危機に対処するための効率的な熱電(TE)材料発見を促進する。
MLモデルは、高いメトリクスにもかかわらず、しばしば実験的な一般化性に悩まされる。
本研究は、半ハウスラー(hH)構造プロトタイプに適用した頑健なワークフローを有益(zT)予測に適用する。
論文 参考訳(メタデータ) (2026-02-01T10:50:42Z) - Quantum-Aware Generative AI for Materials Discovery: A Framework for Robust Exploration Beyond DFT Biases [0.0]
材料発見のための量子認識型生成AIフレームワークを提案する。
我々は、低忠実度予測と高忠実度予測の分岐を定量化し、ターゲットとする頑健な能動学習ループを実装した。
以上の結果から,高分散領域における潜在的安定候補の同定に成功し,3~5倍の精度向上が得られた。
論文 参考訳(メタデータ) (2025-12-13T11:17:21Z) - Advancing Tabular Stroke Modelling Through a Novel Hybrid Architecture and Feature-Selection Synergy [0.9999629695552196]
本研究は、ストロークを予測するように設計されたデータ駆動型、解釈可能な機械学習フレームワークを開発し、検証する。
定期的に収集された人口統計、生活習慣、臨床変数は4,981件の公的なコホートから得られた。
提案したモデルでは精度97.2%、F1スコア97.15%が達成され、先行する個人モデルと比較して大幅に向上した。
論文 参考訳(メタデータ) (2025-05-18T21:46:45Z) - DispFormer: A Pretrained Transformer Incorporating Physical Constraints for Dispersion Curve Inversion [56.64622091009756]
本研究では、レイリー波位相と群分散曲線からプロファイルインバージョンを$v_s$とするトランスフォーマーベースのニューラルネットワークであるDispFormerを紹介する。
DispFormerは各期間に分散データを個別に処理し、ネットワークの変更やデータセットのトレーニングとテストの厳格な調整を必要とせずに、さまざまな長さを処理できる。
論文 参考訳(メタデータ) (2025-01-08T09:08:24Z) - Transfer Learning for Deep Learning-based Prediction of Lattice Thermal Conductivity [0.0]
深層学習モデル(ParAIsite)の精度と一般化性に及ぼす伝達学習の影響について検討する。
格子熱伝導率(LTC)の低品質近似の大規模なデータセット上で、初めて微調整を行うと、さらに改善が得られた。
有望な結果は、低熱伝導率材料を探索する大きなデータベースを探索する能力を高めるための道を開く。
論文 参考訳(メタデータ) (2024-11-27T11:57:58Z) - Test-Time Adaptation Induces Stronger Accuracy and Agreement-on-the-Line [65.14099135546594]
最近のテスト時間適応 (TTA) 法は, モデルに非常に弱い相関関係を示すシフトであっても, ACL と AGL の傾向を大幅に強化する。
この結果から,TTAとAGLに基づく推定手法を組み合わせることで,より広い分布シフトの集合に対する高精度なモデルOOD性能を推定できることが示唆された。
論文 参考訳(メタデータ) (2023-10-07T23:21:25Z) - Boosting Differentiable Causal Discovery via Adaptive Sample Reweighting [62.23057729112182]
異なるスコアに基づく因果探索法は観測データから有向非巡回グラフを学習する。
本稿では,Reweighted Score関数ReScoreの適応重みを動的に学習することにより因果発見性能を向上させるためのモデルに依存しないフレームワークを提案する。
論文 参考訳(メタデータ) (2023-03-06T14:49:59Z) - Machine-Learning Prediction of the Computed Band Gaps of Double
Perovskite Materials [3.2798940914359056]
機能性材料の電子構造の予測は新しい装置の工学に不可欠である。
本研究では,2重ペロブスカイト材料の電子構造を機械学習で予測する。
この結果は,期待できる機能材料を迅速にスクリーニングするために,機械学習による回帰の可能性を実証するという意味で重要である。
論文 参考訳(メタデータ) (2023-01-04T08:19:18Z) - Deep Learning for Virtual Screening: Five Reasons to Use ROC Cost
Functions [80.12620331438052]
深層学習は サイリコの何十億もの分子を 迅速にスクリーニングする 重要なツールとなりました
その重要性にもかかわらず、厳密なクラス不均衡、高い決定しきい値、いくつかのデータセットにおける基底真理ラベルの欠如など、これらのモデルのトレーニングにおいて重大な課題が続いている。
このような場合、クラス不均衡に対するロバスト性から、レシーバ動作特性(ROC)を直接最適化することを好んで論じる。
論文 参考訳(メタデータ) (2020-06-25T08:46:37Z) - Stochastic-Sign SGD for Federated Learning with Theoretical Guarantees [49.91477656517431]
量子化に基づく解法は、フェデレートラーニング(FL)において広く採用されている。
上記のプロパティをすべて享受する既存のメソッドはありません。
本稿では,SIGNSGDに基づく直感的かつ理論的に簡易な手法を提案し,そのギャップを埋める。
論文 参考訳(メタデータ) (2020-02-25T15:12:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。