論文の概要: MADE: Benchmark Environments for Closed-Loop Materials Discovery
- arxiv url: http://arxiv.org/abs/2601.20996v1
- Date: Wed, 28 Jan 2026 19:46:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-30 16:22:49.412737
- Title: MADE: Benchmark Environments for Closed-Loop Materials Discovery
- Title(参考訳): MADE: 閉ループ材料発見のためのベンチマーク環境
- Authors: Shreshth A Malik, Tiarnan Doherty, Panagiotis Tigas, Muhammed Razzak, Stephen J. Roberts, Aron Walsh, Yarin Gal,
- Abstract要約: エンド・ツー・エンドの自律材料発見パイプラインをベンチマークする新しいフレームワークであるMAterials Discovery Environments (MADE)を紹介する。
本研究では, 熱力学的に安定な化合物の探索として, 与えられた凸船体に対する探索として発見を定式化し, ベースラインアルゴリズムとの比較による有効性と効率の評価を行った。
システムファミリをまたいだ体系的な実験を行い、発見パイプラインにおけるコンポーネントのアブレーションを可能にし、メソッドとシステムの複雑さを比較することでこれを実証する。
- 参考スコア(独自算出の注目度): 26.575933886112157
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing benchmarks for computational materials discovery primarily evaluate static predictive tasks or isolated computational sub-tasks. While valuable, these evaluations neglect the inherently iterative and adaptive nature of scientific discovery. We introduce MAterials Discovery Environments (MADE), a novel framework for benchmarking end-to-end autonomous materials discovery pipelines. MADE simulates closed-loop discovery campaigns in which an agent or algorithm proposes, evaluates, and refines candidate materials under a constrained oracle budget, capturing the sequential and resource-limited nature of real discovery workflows. We formalize discovery as a search for thermodynamically stable compounds relative to a given convex hull, and evaluate efficacy and efficiency via comparison to baseline algorithms. The framework is flexible; users can compose discovery agents from interchangeable components such as generative models, filters, and planners, enabling the study of arbitrary workflows ranging from fixed pipelines to fully agentic systems with tool use and adaptive decision making. We demonstrate this by conducting systematic experiments across a family of systems, enabling ablation of components in discovery pipelines, and comparison of how methods scale with system complexity.
- Abstract(参考訳): 計算材料発見のための既存のベンチマークは、主に静的予測タスクまたは孤立した計算サブタスクを評価する。
価値はあるものの、これらの評価は科学的発見の本質的に反復的で適応的な性質を無視している。
エンド・ツー・エンドの自律材料発見パイプラインをベンチマークする新しいフレームワークであるMAterials Discovery Environments (MADE)を紹介する。
MADEは、エージェントまたはアルゴリズムが候補物質を制約されたオラクル予算の下で提案し、評価し、洗練するクローズドループ発見キャンペーンをシミュレートし、実際の発見ワークフローのシーケンシャルでリソースに制限された性質を捉えている。
本研究では, 熱力学的に安定な化合物の探索として, 与えられた凸船体に対する探索として発見を定式化し, ベースラインアルゴリズムとの比較による有効性と効率の評価を行った。
ユーザーは生成モデル、フィルタ、プランナなどの交換可能なコンポーネントから発見エージェントを構成することができ、固定パイプラインからツールの使用と適応的な意思決定を備えた完全なエージェントシステムまで、任意のワークフローを研究することができる。
システムファミリをまたいだ体系的な実験を行い、発見パイプラインにおけるコンポーネントのアブレーションを可能にし、メソッドとシステムの複雑さを比較することでこれを実証する。
関連論文リスト
- ScholarGym: Benchmarking Deep Research Workflows on Academic Literature Retrieval [11.41528830724814]
本稿では,学術研究の再現性評価のためのシミュレーション環境であるScholarGymを紹介する。
決定論的検索を備えた570K論文の静的コーパス上に構築されたScholarGymは,2,536のクエリと専門家による注釈付き基底真理を提供する。
論文 参考訳(メタデータ) (2026-01-29T12:51:44Z) - Ontology-aligned structuring and reuse of multimodal materials data and workflows towards automatic reproduction [1.4658400971135652]
既存のテキストマイニング手法では、関連するパラメータを含む完全計算を抽出するには不十分である。
文献からの計算密度の自動抽出と構造化のための大規模言語モデル(LLM)支援フレームワークが導入された。
このフレームワークは、公表された結果を意味的に相互運用可能な形式で整理・コンテキスト化するための基盤を提供し、それによって計算材料データの透明性と再利用性を向上させる。
論文 参考訳(メタデータ) (2026-01-18T20:51:23Z) - Equation discovery framework EPDE: Towards a better equation discovery [50.79602839359522]
進化的最適化に基づく発見フレームワークであるEPDEアルゴリズムを強化する。
提案手法は基本関数や個人差分といった基本構造ブロックを用いて用語を生成する。
我々は,提案アルゴリズムの耐雑音性および全体的な性能を,最先端の方程式探索フレームワークであるSINDyの結果と比較することによって検証する。
論文 参考訳(メタデータ) (2024-12-28T15:58:44Z) - Generating Diverse Synthetic Datasets for Evaluation of Real-life Recommender Systems [0.0]
合成データセットは、機械学習モデルの評価とテストに重要である。
我々は,多様かつ統計的に一貫性のある合成データセットを生成するための新しいフレームワークを開発する。
このフレームワークは、最小限の摩擦で研究を容易にする無料のオープンPythonパッケージとして利用できる。
論文 参考訳(メタデータ) (2024-11-27T09:53:14Z) - DiscoveryBench: Towards Data-Driven Discovery with Large Language Models [50.36636396660163]
我々は、データ駆動探索の多段階プロセスを形式化する最初の包括的なベンチマークであるDiscoveryBenchを紹介する。
我々のベンチマークには、社会学や工学などの6つの分野にまたがる264のタスクが含まれている。
私たちのベンチマークでは、自律的なデータ駆動型発見の課題を説明し、コミュニティが前進するための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2024-07-01T18:58:22Z) - BEACON: A Bayesian Optimization Strategy for Novelty Search in Expensive Black-Box Systems [1.204357447396532]
ノベルティサーチ(NS)は、シミュレーションや実験を通じて多様なシステムの振る舞いを明らかにすることを目指している。
NS法は一般に、入力空間の密度の高いサンプリングを必要とする進化戦略やその他のメタヒューリスティックに依存している。
サンプル効率のよいベイズ最適化に基づくNSのアプローチであるBEACONを導入し、入力-行動関係が不透明で、評価にコストがかかるような設定に最適化する。
論文 参考訳(メタデータ) (2024-06-05T20:23:52Z) - Maximize to Explore: One Objective Function Fusing Estimation, Planning,
and Exploration [87.53543137162488]
我々はtextttMEX というオンライン強化学習(オンラインRL)フレームワークを提案する。
textttMEXは、自動的に探索エクスプロイトのバランスをとりながら、見積もりと計画コンポーネントを統合する。
様々な MuJoCo 環境では,ベースラインを安定的なマージンで上回り,十分な報酬を得られる。
論文 参考訳(メタデータ) (2023-05-29T17:25:26Z) - Optimization of a Hydrodynamic Computational Reservoir through Evolution [58.720142291102135]
我々は,スタートアップが開発中の流体力学系のモデルと,計算貯水池としてインターフェースする。
我々は、進化探索アルゴリズムを用いて、読み出し時間と入力を波の振幅や周波数にどのようにマッピングするかを最適化した。
この貯水池システムに進化的手法を適用することで、手作業パラメータを用いた実装と比較して、XNORタスクの分離性が大幅に向上した。
論文 参考訳(メタデータ) (2023-04-20T19:15:02Z) - Validation Diagnostics for SBI algorithms based on Normalizing Flows [55.41644538483948]
本研究は,NFに基づく多次元条件(後)密度推定器の検証診断を容易にすることを提案する。
また、局所的な一貫性の結果に基づいた理論的保証も提供する。
この作業は、より良い特定モデルの設計を支援したり、新しいSBIアルゴリズムの開発を促進するのに役立つだろう。
論文 参考訳(メタデータ) (2022-11-17T15:48:06Z) - Automated Evolutionary Approach for the Design of Composite Machine
Learning Pipelines [48.7576911714538]
提案手法は、複合機械学習パイプラインの設計を自動化することを目的としている。
パイプラインをカスタマイズ可能なグラフベースの構造で設計し、得られた結果を分析して再生する。
このアプローチのソフトウェア実装は、オープンソースフレームワークとして紹介されている。
論文 参考訳(メタデータ) (2021-06-26T23:19:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。