論文の概要: CrystalGym: A New Benchmark for Materials Discovery Using Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2509.23156v1
- Date: Sat, 27 Sep 2025 07:02:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-30 22:32:19.073748
- Title: CrystalGym: A New Benchmark for Materials Discovery Using Reinforcement Learning
- Title(参考訳): CrystalGym: 強化学習を用いた材料発見のための新しいベンチマーク
- Authors: Prashant Govindarajan, Mathieu Reymond, Antoine Clavaud, Mariano Phielipp, Santiago Miret, Sarath Chandar,
- Abstract要約: 新しい材料の設計と最適化は、主に密度汎関数理論計算を行う高精度な原子シミュレータに依存している。
オンライン強化学習(RL)による材料設計ループにおける直接DFT信号の導入を支援するため,CrystalGymを提案する。
ターゲット特性に条件付けされた結晶を設計するための共通値およびポリシーに基づく強化学習アルゴリズムをベンチマークする。
- 参考スコア(独自算出の注目度): 21.461755133360796
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In silico design and optimization of new materials primarily relies on high-accuracy atomic simulators that perform density functional theory (DFT) calculations. While recent works showcase the strong potential of machine learning to accelerate the material design process, they mostly consist of generative approaches that do not use direct DFT signals as feedback to improve training and generation mainly due to DFT's high computational cost. To aid the adoption of direct DFT signals in the materials design loop through online reinforcement learning (RL), we propose CrystalGym, an open-source RL environment for crystalline material discovery. Using CrystalGym, we benchmark common value- and policy-based reinforcement learning algorithms for designing various crystals conditioned on target properties. Concretely, we optimize for challenging properties like the band gap, bulk modulus, and density, which are directly calculated from DFT in the environment. While none of the algorithms we benchmark solve all CrystalGym tasks, our extensive experiments and ablations show different sample efficiencies and ease of convergence to optimality for different algorithms and environment settings. Additionally, we include a case study on the scope of fine-tuning large language models with reinforcement learning for improving DFT-based rewards. Our goal is for CrystalGym to serve as a test bed for reinforcement learning researchers and material scientists to address these real-world design problems with practical applications. We therefore introduce a novel class of challenges for reinforcement learning methods dealing with time-consuming reward signals, paving the way for future interdisciplinary research for machine learning motivated by real-world applications.
- Abstract(参考訳): 新しい材料の設計と最適化は、主に密度汎関数理論(DFT)計算を行う高精度な原子シミュレータに依存している。
最近の研究は、材料設計プロセスを加速する機械学習の強い可能性を示しているが、それらは主にDFTの高計算コストのためにトレーニングと生成を改善するフィードバックとして直接DFT信号を使用しない生成的アプローチから成り立っている。
オンライン強化学習(RL)による材料設計ループにおける直接DFT信号の導入を支援するため,結晶材料発見のためのオープンソースのRL環境であるCrystalGymを提案する。
本研究では,CrystalGymを用いて,目標特性に条件付けされた各種結晶を設計するための共通値とポリシーに基づく強化学習アルゴリズムをベンチマークする。
具体的には, 環境中のDFTから直接計算した帯域ギャップ, バルク率, 密度などの難易度を最適化する。
ベンチマークしたアルゴリズムはいずれもすべてのCrystalGymタスクを解決していないが、広範な実験と改善により、異なるアルゴリズムと環境設定に対する最適性に対するサンプル効率と収束の容易さが示される。
さらに、DFTに基づく報酬改善のための強化学習を含む、細調整された大規模言語モデルの範囲に関するケーススタディを含む。
私たちのゴールは、CrystalGymが強化学習研究者や材料科学者のためのテストベッドとして機能し、これらの現実的な設計問題に実践的な応用で対処することです。
そこで我々は,時間を要する報奨信号を扱う強化学習手法の新たなクラスを導入し,実世界の応用を動機とした機械学習の今後の学際研究の道を開く。
関連論文リスト
- Active Learning for Conditional Inverse Design with Crystal Generation and Foundation Atomic Models [2.8408587358426725]
本稿では, 結晶生成モデルと基本原子モデルを組み合わせて, 逆設計の精度と効率を高めるための能動的学習フレームワークを提案する。
我々のフレームワークは、様々な結晶生成と基盤原子モデルに対応し、AI駆動材料発見のためのスケーラブルなアプローチを確立している。
論文 参考訳(メタデータ) (2025-02-24T09:15:38Z) - DRL-based Dolph-Tschebyscheff Beamforming in Downlink Transmission for Mobile Users [52.9870460238443]
学習可能なDolph-Tschebyscheffアンテナアレイを用いた深部強化学習に基づくブラインドビームフォーミング手法を提案する。
シミュレーションの結果,提案手法は最良値に非常に近いデータレートをサポートできることが示唆された。
論文 参考訳(メタデータ) (2025-02-03T11:50:43Z) - Remaining Useful Life Prediction: A Study on Multidimensional Industrial Signal Processing and Efficient Transfer Learning Based on Large Language Models [6.118896920507198]
本稿では,大言語モデル(LLM)をRUL予測に用いる革新的な回帰フレームワークを提案する。
ターボファンエンジンのRUL予測タスクの実験では、提案モデルが最先端(SOTA)法を超越していることが示されている。
微調整のための最小限のターゲットドメインデータでは、モデルは完全なターゲットドメインデータに基づいて訓練されたSOTAメソッドよりも優れている。
論文 参考訳(メタデータ) (2024-10-04T04:21:53Z) - OmniArch: Building Foundation Model For Scientific Computing [35.41293100957156]
OmniArchは,物理アライメントによるマルチスケール・マルチ物理科学計算問題の解決を目的とした,最初のプロトタイプである。
PDEBench上で1D-2D-3Dの統合事前トレーニングを行い、1D, 2D, 3D PDEの新たなパフォーマンスベンチマークを設定するだけでなく、コンテキスト内およびゼロショット学習アプローチによる新しい物理への例外的な適応性を示す。
論文 参考訳(メタデータ) (2024-02-25T07:19:01Z) - Machine Learning Insides OptVerse AI Solver: Design Principles and
Applications [74.67495900436728]
本稿では,Huawei CloudのOpsVerse AIソルバに機械学習(ML)技術を統合するための総合的研究について述べる。
本稿では,実世界の多面構造を反映した生成モデルを用いて,複雑なSATインスタンスとMILPインスタンスを生成する手法を紹介する。
本稿では,解解器性能を著しく向上させる,最先端パラメータチューニングアルゴリズムの導入について詳述する。
論文 参考訳(メタデータ) (2024-01-11T15:02:15Z) - End-to-End Meta-Bayesian Optimisation with Transformer Neural Processes [52.818579746354665]
本稿では,ニューラルネットワークを一般化し,トランスフォーマーアーキテクチャを用いて獲得関数を学習する,エンド・ツー・エンドの差別化可能な最初のメタBOフレームワークを提案する。
我々は、この強化学習(RL)によるエンドツーエンドのフレームワークを、ラベル付き取得データの欠如に対処できるようにします。
論文 参考訳(メタデータ) (2023-05-25T10:58:46Z) - Learning to Continuously Optimize Wireless Resource in a Dynamic
Environment: A Bilevel Optimization Perspective [52.497514255040514]
この研究は、データ駆動メソッドが動的環境でリソース割り当て戦略を継続的に学び、最適化することを可能にする新しいアプローチを開発しています。
学習モデルが新たなエピソードに段階的に適応できるように、連続学習の概念を無線システム設計に組み込むことを提案する。
我々の設計は、異なるデータサンプルにまたがる公平性を保証する、新しい二段階最適化定式化に基づいている。
論文 参考訳(メタデータ) (2021-05-03T07:23:39Z) - Learning to Continuously Optimize Wireless Resource In Episodically
Dynamic Environment [55.91291559442884]
この研究は、データ駆動型手法が動的環境で継続的に学習し、最適化できる方法論を開発する。
本稿では,無線システム学習のモデリングプロセスに連続学習の概念を構築することを提案する。
我々の設計は、異なるデータサンプル間で「一定の公正性を保証する」新しいmin-maxの定式化に基づいている。
論文 参考訳(メタデータ) (2020-11-16T08:24:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。