論文の概要: Toward Greater Autonomy in Materials Discovery Agents: Unifying Planning, Physics, and Scientists
- arxiv url: http://arxiv.org/abs/2506.05616v2
- Date: Mon, 09 Jun 2025 17:27:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-10 14:13:04.158633
- Title: Toward Greater Autonomy in Materials Discovery Agents: Unifying Planning, Physics, and Scientists
- Title(参考訳): 材料発見エージェントの自律性向上に向けて : 計画・物理・科学者の統合
- Authors: Lianhao Zhou, Hongyi Ling, Keqiang Yan, Kaiji Zhao, Xiaoning Qian, Raymundo Arróyave, Xiaofeng Qian, Shuiwang Ji,
- Abstract要約: MAPPSはPlanner、ツールコードジェネレータ、Scientific Mediatorで構成されている。
計画、物理学、科学者を統一することで、MAPPSはより柔軟で信頼性の高い物質発見を可能にする。
- 参考スコア(独自算出の注目度): 46.884317494606776
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: We aim at designing language agents with greater autonomy for crystal materials discovery. While most of existing studies restrict the agents to perform specific tasks within predefined workflows, we aim to automate workflow planning given high-level goals and scientist intuition. To this end, we propose Materials Agent unifying Planning, Physics, and Scientists, known as MAPPS. MAPPS consists of a Workflow Planner, a Tool Code Generator, and a Scientific Mediator. The Workflow Planner uses large language models (LLMs) to generate structured and multi-step workflows. The Tool Code Generator synthesizes executable Python code for various tasks, including invoking a force field foundation model that encodes physics. The Scientific Mediator coordinates communications, facilitates scientist feedback, and ensures robustness through error reflection and recovery. By unifying planning, physics, and scientists, MAPPS enables flexible and reliable materials discovery with greater autonomy, achieving a five-fold improvement in stability, uniqueness, and novelty rates compared with prior generative models when evaluated on the MP-20 data. We provide extensive experiments across diverse tasks to show that MAPPS is a promising framework for autonomous materials discovery.
- Abstract(参考訳): 結晶材料発見の自律性を高める言語エージェントを設計することを目的としている。
既存の研究のほとんどは、事前に定義されたワークフロー内で特定のタスクを実行するようにエージェントを制限しているが、我々は高レベルな目標と科学者の直感を与えられたワークフロー計画を自動化することを目指している。
この目的のために、MAPPSとして知られる計画・物理・科学者を統一する材料エージェントを提案する。
MAPPSはワークフロープランナー、ツールコードジェネレータ、Scientific Mediatorで構成されている。
Workflow Plannerは、構造化された複数ステップのワークフローを生成するために、大きな言語モデル(LLM)を使用する。
Tool Code Generatorは、物理をエンコードする力場基盤モデルを呼び出すなど、さまざまなタスクのために実行可能なPythonコードを合成する。
Scientific Mediatorはコミュニケーションをコーディネートし、科学者のフィードバックを促進し、エラーのリフレクションとリカバリを通じて堅牢性を確保する。
計画、物理学、科学者を統一することにより、MAPPSはより自律性の高い柔軟で信頼性の高い材料発見を可能にし、MP-20データで評価された場合の以前の生成モデルと比較して、安定性、独自性、新規性率の5倍の改善を達成する。
我々は、MAPPSが自律材料発見の有望な枠組みであることを示すために、多様なタスクにまたがる広範な実験を行っている。
関連論文リスト
- ScienceBoard: Evaluating Multimodal Autonomous Agents in Realistic Scientific Workflows [82.07367406991678]
大規模言語モデル(LLM)は自然言語処理を超えてその影響を拡大している。
これらのうち、コンピュータ利用エージェントは、人間がしているようにオペレーティングシステムと対話することができる。
我々はScienceBoardを紹介し、ダイナミックで視覚的にリッチな科学ソフトウェアを特徴とする現実的でマルチドメイン環境を包含する。
論文 参考訳(メタデータ) (2025-05-26T12:27:27Z) - LLM Agents Making Agent Tools [2.5529148902034637]
ツールの使用は、大規模言語モデル(LLM)を、複雑なマルチステップタスクを実行できる強力なエージェントに変えた。
しかし、これらのツールは人間の開発者によって事前に実装されなければならない。
論文をコードで自律的にLLM互換のツールに変換するエージェントフレームワークであるToolMakerを提案する。
論文 参考訳(メタデータ) (2025-02-17T11:44:11Z) - Autonomous Microscopy Experiments through Large Language Model Agents [4.241267255764773]
大規模言語モデル(LLM)は、材料研究のための自動運転研究所(SDL)の開発を加速させた。
本稿では,原子間力顕微鏡(AFM)を自動化するフレームワークであるAILA(Artificially Intelligent Lab Assistant)を紹介する。
我々の体系的な評価は、最先端の言語モデルがドキュメント検索のような基本的なタスクに悩まされていることを示している。
論文 参考訳(メタデータ) (2024-12-18T09:35:28Z) - MatPilot: an LLM-enabled AI Materials Scientist under the Framework of Human-Machine Collaboration [13.689620109856783]
我々はMatPilotという名のAI材料科学者を開発し、新しい素材の発見を奨励する能力を示した。
MatPilotのコアとなる強みは、自然言語で対話的な人間と機械のコラボレーションだ。
MatPilotは、ユニークな認知能力、豊富な蓄積された経験、そして人間の生活の好奇心を統合している。
論文 参考訳(メタデータ) (2024-11-10T12:23:44Z) - PEAR: A Robust and Flexible Automation Framework for Ptychography Enabled by Multiple Large Language Model Agents [6.6004056020499355]
実際には、高品質な画像を得るには、多数の実験パラメータとアルゴリズムパラメータを同時に最適化する必要がある。
本研究では,大規模言語モデル(LLM)を活用し,画像解析におけるデータ解析を自動化するフレームワークを開発する。
本研究は,PEARのマルチエージェント設計が,より小さなオープンウェイトモデルであっても,ワークフローの成功率を大幅に向上させることを示す。
論文 参考訳(メタデータ) (2024-10-11T17:50:59Z) - Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文 参考訳(メタデータ) (2024-07-15T17:54:37Z) - LLMatDesign: Autonomous Materials Discovery with Large Language Models [5.481299708562135]
新しい材料は科学的、技術的に重要な意味を持つ。
機械学習の最近の進歩により、データ駆動の手法により、有望な材料を素早くスクリーニングしたり、生成したりすることが可能になった。
LLMatDesignは,大規模言語モデルを用いた材料設計のための新しいフレームワークである。
論文 参考訳(メタデータ) (2024-06-19T02:35:02Z) - Octopus: Embodied Vision-Language Programmer from Environmental Feedback [58.04529328728999]
身体視覚言語モデル(VLM)は多モード認識と推論において大きな進歩を遂げた。
このギャップを埋めるために、我々は、計画と操作を接続する媒体として実行可能なコード生成を使用する、具体化された視覚言語プログラマであるOctopusを紹介した。
Octopusは、1)エージェントの視覚的およびテキスト的タスクの目的を正確に理解し、2)複雑なアクションシーケンスを定式化し、3)実行可能なコードを生成するように設計されている。
論文 参考訳(メタデータ) (2023-10-12T17:59:58Z) - MLAgentBench: Evaluating Language Agents on Machine Learning Experimentation [96.71370747681078]
我々は,CIFAR-10におけるモデル性能の改善から,BabyLMのような最近の研究課題まで,13のタスクからなるMLAgentBenchを紹介した。
各タスクに対して、エージェントはファイルの読み書き、コードの実行、出力の検査などのアクションを実行することができる。
我々は、Claude v1.0、Claude v2.1、Claude v3 Opus、GPT-4、GPT-4-turbo、Gemini-Pro、Mixtralに基づいてベンチマークエージェントをベンチマークし、Claude v3 Opusエージェントが成功率の点で最高であることを示す。
論文 参考訳(メタデータ) (2023-10-05T04:06:12Z) - pymdp: A Python library for active inference in discrete state spaces [52.85819390191516]
pymdpはPythonでアクティブな推論をシミュレートするオープンソースパッケージである。
我々は,POMDPによるアクティブな推論をシミュレートする,最初のオープンソースパッケージを提供する。
論文 参考訳(メタデータ) (2022-01-11T12:18:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。