論文の概要: LLM-Driven Discovery of High-Entropy Catalysts via Retrieval-Augmented Generation
- arxiv url: http://arxiv.org/abs/2603.15712v1
- Date: Mon, 16 Mar 2026 14:10:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:06.903352
- Title: LLM-Driven Discovery of High-Entropy Catalysts via Retrieval-Augmented Generation
- Title(参考訳): LLMによる高エントロピー触媒の検索による発見
- Authors: AI Scientists, Xinyi Lin, Danqing Yin, Ying Guo,
- Abstract要約: 本稿では,触媒発見プロセスにおいて,大規模言語モデルがいかに役立つかを示す。
本稿では,GPT-4が化学空間をナビゲートできる検索拡張生成フレームワークを提案する。
提案手法は, 熱力学的安定性率82%の触媒候補を250以上生成した。
- 参考スコア(独自算出の注目度): 2.2716047672389306
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: CO2 reduction requires efficient catalysts, yet materials discovery remains bottlenecked by 10-20 year development cycles requiring deep domain expertise. This paper demonstrates how large language models can assist the catalyst discovery process by helping researchers explore chemical spaces and interpret results when augmented with retrieval-based grounding. We introduce a retrieval-augmented generation framework that enables GPT-4 to navigate chemical space by accessing a database of 50,000+ known materials, adapting general-purpose language understanding for high-throughput materials design. Our approach generated over 250 catalyst candidates with an 82% thermodynamic stability rate while addressing multi-objective constraints: 68% achieved <$100/kg cost with metallic conductivity (band gap<0.1eV) and mechanical stability (B/G>1.75). The best-performing Fe0.2Co0.2Ni0.2Ir0.1Ru0.3 achieves 0.285V limiting potential (25% improvement over IrO2), while Cr0.2Fe0.2Co0.3Ni0.2Mo0.1 optimally balances performance-cost trade-offs at $18/kg. Volcano plot analysis confirms that 78% of LLM-generated catalysts cluster near the theoretical activity optimum, while our system achieves 200x computational efficiency compared to traditional high-throughput screening. By demonstrating that retrieval-augmented generation can ground AI creativity in physical constraints without sacrificing exploration, this work demonstrates an approach where natural language interfaces can streamline materials discovery workflows, enabling researchers to explore chemical spaces more efficiently while the LLM assists in result interpretation and hypothesis generation.
- Abstract(参考訳): CO2削減には効率的な触媒が必要であるが、深いドメインの専門知識を必要とする10~20年の開発サイクルで材料発見がボトルネックとなる。
本稿では, 大規模言語モデルを用いて, 化学空間の探索や, 検索ベースグラウンド化による分析結果の解釈を支援することによって, 触媒発見プロセスを支援する方法を示す。
我々は,5万以上の既知の素材のデータベースにアクセスし,高出力材料の設計に汎用的な言語理解を適用することで,GPT-4が化学空間をナビゲートすることを可能にする検索拡張生成フレームワークを提案する。
68%が金属伝導率(バンドギャップ<0.1eV)と機械的安定性(B/G>1.75)で100/kg以上のコストを達成した。
最高性能のFe0.2Co0.2Ni0.2Ir0.1Ru0.3は0.285V制限電位(IrO2よりも25%改善)を達成し、Cr0.2Fe0.2Co0.2Ni0.2Mo0.1は18/kgのパフォーマンスコストトレードオフを最適にバランスさせる。
火山プロット解析により, LLM生成触媒の78%が理論活性の最適値付近に集結し, 従来の高出力検層に比べて200倍の計算効率が得られた。
この研究は、探索を犠牲にすることなく、AIの創造性を物理的制約で構築できることを実証することによって、自然言語インタフェースが材料発見ワークフローを効率化し、LLMが結果の解釈と仮説生成を支援する間、研究者がより効率的に化学空間を探索できるようにするアプローチを示す。
関連論文リスト
- Catalyst-Agent: Autonomous heterogeneous catalyst screening and optimization with an LLM Agent [10.596902977676807]
本稿では,サーバベースのLLMAIエージェントであるCatalyst-Agentを紹介する。
OPTIMADE APIを使って巨大なマテリアルデータベースを探索できる。
Catalyst-Agentは、選択して評価するすべての材料のうち、23~34%の成功率を達成する。
論文 参考訳(メタデータ) (2026-03-01T22:44:56Z) - From Memorization to Creativity: LLM as a Designer of Novel Neural-Architectures [48.83701310501069]
大規模言語モデル(LLM)は、プログラム合成において優れているが、ニューラルネットワーク設計(信頼性、性能、構造的ノベルティ)を自律的にナビゲートする能力は、未調査のままである。
コード指向LLMをクローズドループ合成フレームワークに配置し、22の教師付き微調整サイクルの進化を解析することによって、この問題に対処する。
論文 参考訳(メタデータ) (2026-01-06T13:20:28Z) - Adaptive Physics-Informed Neural Networks with Multi-Category Feature Engineering for Hydrogen Sorption Prediction in Clays, Shales, and Coals [1.5749416770494706]
本研究では, 適応型物理インフォームドニューラルネットワーク(PINN)フレームワークを導入し, 水素吸着予測を向上する。
PINNは、アダプティブ・ロス関数とモンテカルロ・ドロップアウトにより、不確実な定量化のために最適化された、多面的な注意を伴うディープ・リザーブ・ネットワークを採用している。
このフレームワークは、粘土鉱物、シェール、石炭をまたいだ堅牢なリソロジー特性を示し、85-91%の信頼性スコアを維持している。
論文 参考訳(メタデータ) (2025-08-24T19:41:33Z) - Inorganic Catalyst Efficiency Prediction Based on EAPCR Model: A Deep Learning Solution for Multi-Source Heterogeneous Data [9.022023762759641]
本研究では,Embedding-Attention-Permutated CNN-Residual (EAPCR)ディープラーニングモデルを提案する。
EAPCRは埋め込みと注意機構を用いて特徴関連行列を構築し、予測性能を向上させる。
我々は、不均一光触媒、熱、電気触媒のデータセット上でEAPCRを評価する。
論文 参考訳(メタデータ) (2025-03-10T15:10:22Z) - xCOMET-lite: Bridging the Gap Between Efficiency and Quality in Learned MT Evaluation Metrics [69.14652127492438]
xCOMETのような最先端の機械翻訳評価指標は、人間の判断と高い相関性を得るが、大きなエンコーダに依存している。
我々は, 蒸留, 定量化, プルーニング技術を用いて, 効率的なxCOMET代替品を作成する。
量子化により,xCOMETは3倍の圧縮が可能であり,品質劣化は生じない。
論文 参考訳(メタデータ) (2024-06-20T17:58:34Z) - Adaptive Catalyst Discovery Using Multicriteria Bayesian Optimization with Representation Learning [17.00084254889438]
高性能触媒は、持続可能なエネルギー変換と人間の健康に不可欠である。
触媒の発見は、巨大で高次元の構造と合成空間をナビゲートするための効率的なアプローチがないため、課題に直面している。
論文 参考訳(メタデータ) (2024-04-18T18:11:06Z) - Towards Green AI in Fine-tuning Large Language Models via Adaptive
Backpropagation [58.550710456745726]
ファインチューニングは、トレーニング済みの大規模言語モデル(LLM)を下流アプリケーションに適用する最も効果的な方法である。
既存の高速微調整技術は, FLOPの低減に限界がある。
本稿では,異なるテンソルのバックプロパゲーションコストを適応的に評価する新しい手法であるGreenTrainerについて述べる。
論文 参考訳(メタデータ) (2023-09-22T21:55:18Z) - PhAST: Physics-Aware, Scalable, and Task-specific GNNs for Accelerated
Catalyst Design [102.9593507372373]
触媒材料は産業プロセスに関わる電気化学反応において重要な役割を担っている。
機械学習は、大量のデータから材料特性を効率的にモデル化する可能性を秘めている。
本稿では,ほとんどのアーキテクチャに適用可能なタスク固有のイノベーションを提案し,計算効率と精度の両立を図っている。
論文 参考訳(メタデータ) (2022-11-22T05:24:30Z) - The Open Catalyst 2022 (OC22) Dataset and Challenges for Oxide
Electrocatalysis [9.9765107020148]
酸化物の化学空間にまたがる一般的な機械学習のポテンシャルは、まだ手の届かないところにある。
Open Catalyst 2022(OC22)データセットは62,521 密度汎関数論 (DFT) によって構成される。
異なる材料や吸着剤を含む場合でも、データセットの組み合わせがより良い結果をもたらすかどうかを調査する。
論文 参考訳(メタデータ) (2022-06-17T17:54:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。