論文の概要: "DIVE" into Hydrogen Storage Materials Discovery with AI Agents
- arxiv url: http://arxiv.org/abs/2508.13251v1
- Date: Mon, 18 Aug 2025 14:30:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.68956
- Title: "DIVE" into Hydrogen Storage Materials Discovery with AI Agents
- Title(参考訳): AIエージェントによる水素貯蔵材料発見の「DIVE」
- Authors: Di Zhang, Xue Jia, Tran Ba Hung, Seong Hoon Jang, Linda Zhang, Ryuhei Sato, Yusuke Hashimoto, Toyoto Sato, Kiyoe Konno, Shin-ichi Orimo, Hao Li,
- Abstract要約: データ駆動人工知能(AI)アプローチは、新しい素材の発見を変革している。
本稿では,視覚表現の記述的解釈(Descriptive Interpretation of Visual Expression, DIVE)について述べる。
4000の出版物から3万点を超えるキュレートされたデータベース上に構築し、これまで報告されていない水素貯蔵成分を2分で識別できる高速な逆設計ワークフローを構築した。
- 参考スコア(独自算出の注目度): 4.715970729335095
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Data-driven artificial intelligence (AI) approaches are fundamentally transforming the discovery of new materials. Despite the unprecedented availability of materials data in the scientific literature, much of this information remains trapped in unstructured figures and tables, hindering the construction of large language model (LLM)-based AI agent for automated materials design. Here, we present the Descriptive Interpretation of Visual Expression (DIVE) multi-agent workflow, which systematically reads and organizes experimental data from graphical elements in scientific literatures. We focus on solid-state hydrogen storage materials-a class of materials central to future clean-energy technologies and demonstrate that DIVE markedly improves the accuracy and coverage of data extraction compared to the direct extraction by multimodal models, with gains of 10-15% over commercial models and over 30% relative to open-source models. Building on a curated database of over 30,000 entries from 4,000 publications, we establish a rapid inverse design workflow capable of identifying previously unreported hydrogen storage compositions in two minutes. The proposed AI workflow and agent design are broadly transferable across diverse materials, providing a paradigm for AI-driven materials discovery.
- Abstract(参考訳): データ駆動人工知能(AI)アプローチは、新しい素材の発見を根本的に変えつつある。
科学文献における資料データの入手は前例のないことであるが、これらの情報の多くは構造化されていない数字や表に閉じ込められており、自動化された材料設計のための大規模言語モデル(LLM)ベースのAIエージェントの構築を妨げている。
本稿では,DIVE(Descriptive Interpretation of Visual Expression)マルチエージェントワークフローについて述べる。
我々は,将来のクリーンエネルギー技術の中心となる固体水素貯蔵材料に着目し,マルチモーダルモデルによる直接抽出と比較して,DIVEがデータ抽出の精度とカバレッジを著しく向上し,商用モデルよりも10~15%,オープンソースモデルと比較して30%以上向上することが実証された。
4000の出版物から3万点を超えるキュレートされたデータベース上に構築し、これまで報告されていない水素貯蔵成分を2分で識別できる高速な逆設計ワークフローを構築した。
提案されたAIワークフローとエージェント設計は、さまざまな材料間で広く伝達可能であり、AI駆動の材料発見のパラダイムを提供する。
関連論文リスト
- Artificial Intelligence and Generative Models for Materials Discovery -- A Review [0.0]
Reviewは、材料発見に適用可能なAI駆動生成モデルのさまざまな原則について議論することを目的としている。
また, 新規触媒, 半導体, 高分子, 結晶の設計における生成モデルの具体的な応用についても紹介する。
論文 参考訳(メタデータ) (2025-08-05T09:56:27Z) - Materials Generation in the Era of Artificial Intelligence: A Comprehensive Survey [54.40267149907223]
材料は現代社会の基礎であり、エネルギー、エレクトロニクス、医療、交通、インフラの進歩を支えている。
高度に調整された特性を持つ新しい材料を発見・設計する能力は、世界的課題の解決に不可欠である。
データ駆動生成モデルは、事前定義された特性要件を満たす新しい材料を直接作成することによって、材料設計のための強力なツールを提供する。
論文 参考訳(メタデータ) (2025-05-22T08:33:21Z) - A Large-Scale Vision-Language Dataset Derived from Open Scientific Literature to Advance Biomedical Generalist AI [70.06771291117965]
PubMed Central Open Accessサブセットから派生したオープンソースのデータセットであるBiomedicaを紹介する。
Biomedicaには600万以上の科学論文と2400万の画像テキストペアが含まれている。
私たちは、Webサーバを通じてスケーラブルなストリーミングと検索APIを提供し、AIシステムとのシームレスな統合を容易にします。
論文 参考訳(メタデータ) (2025-03-26T05:56:46Z) - Towards an automated workflow in materials science for combining multi-modal simulative and experimental information using data mining and large language models [0.0]
この原稿には、科学文献から機械可読データベースにエンコードされた情報を公開する自動化ワークフローが紹介されている。
最終的に、Retrieval-Augmented Generation (RAG)ベースのLarge Language Model (LLM)は、高速で効率的な質問応答チャットボットを可能にする。
論文 参考訳(メタデータ) (2025-02-18T16:24:46Z) - DARWIN 1.5: Large Language Models as Materials Science Adapted Learners [46.7259033847682]
DARWIN 1.5は,材料科学に適したオープンソースの大規模言語モデルである。
DARWINはタスク固有の記述子の必要性を排除し、材料特性の予測と発見に対する柔軟な統一的なアプローチを可能にする。
提案手法は,6Mの物質ドメイン論文と49,256の物質から得られた21の実験データセットを統合し,タスク間の知識伝達を可能にする。
論文 参考訳(メタデータ) (2024-12-16T16:51:27Z) - Leveraging Chemistry Foundation Models to Facilitate Structure Focused Retrieval Augmented Generation in Multi-Agent Workflows for Catalyst and Materials Design [0.0]
ケミカル基礎モデルは,構造に着目したセマンティックケミカル情報検索の基盤として機能することを示す。
また,OpenCLIP などのマルチモーダルモデルと化学基礎モデルの併用について述べる。
論文 参考訳(メタデータ) (2024-08-21T17:25:45Z) - Accelerating materials discovery for polymer solar cells: Data-driven insights enabled by natural language processing [5.527358421206627]
本稿では, 高分子太陽電池ドナー/アクセプターペアの発見のための各種能動的学習手法のシミュレーションを行う。
提案手法は, 材料革新の15年間の加速に相当し, 発見時間を約75%短縮する可能性を示した。
論文 参考訳(メタデータ) (2024-02-29T18:54:46Z) - ChemMiner: A Large Language Model Agent System for Chemical Literature Data Mining [56.15126714863963]
ChemMinerは、文学から化学データを抽出するエンドツーエンドのフレームワークである。
ChemMinerには、コア参照マッピングのためのテキスト分析エージェント、非テキスト情報抽出のためのマルチモーダルエージェント、データ生成のための合成分析エージェントの3つの特殊エージェントが組み込まれている。
実験の結果,ヒト化学者に匹敵する反応同定率を示すとともに,高い精度,リコール,F1スコアで処理時間を著しく短縮した。
論文 参考訳(メタデータ) (2024-02-20T13:21:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。