論文の概要: A Survey of AI for Materials Science: Foundation Models, LLM Agents, Datasets, and Tools
- arxiv url: http://arxiv.org/abs/2506.20743v1
- Date: Wed, 25 Jun 2025 18:10:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-27 19:53:09.842465
- Title: A Survey of AI for Materials Science: Foundation Models, LLM Agents, Datasets, and Tools
- Title(参考訳): 材料科学のためのAI:基礎モデル, LLMエージェント, データセット, ツール
- Authors: Minh-Hao Van, Prateek Verma, Chen Zhao, Xintao Wu,
- Abstract要約: ファンデーションモデル(FM)は、科学的発見のためにスケーラブルで汎用的でマルチモーダルなAIシステムを実現する。
この調査は、この成長分野をサポートする基盤モデル、エージェントシステム、データセット、計算ツールの包括的概要を提供する。
- 参考スコア(独自算出の注目度): 15.928285656168422
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Foundation models (FMs) are catalyzing a transformative shift in materials science (MatSci) by enabling scalable, general-purpose, and multimodal AI systems for scientific discovery. Unlike traditional machine learning models, which are typically narrow in scope and require task-specific engineering, FMs offer cross-domain generalization and exhibit emergent capabilities. Their versatility is especially well-suited to materials science, where research challenges span diverse data types and scales. This survey provides a comprehensive overview of foundation models, agentic systems, datasets, and computational tools supporting this growing field. We introduce a task-driven taxonomy encompassing six broad application areas: data extraction, interpretation and Q\&A; atomistic simulation; property prediction; materials structure, design and discovery; process planning, discovery, and optimization; and multiscale modeling. We discuss recent advances in both unimodal and multimodal FMs, as well as emerging large language model (LLM) agents. Furthermore, we review standardized datasets, open-source tools, and autonomous experimental platforms that collectively fuel the development and integration of FMs into research workflows. We assess the early successes of foundation models and identify persistent limitations, including challenges in generalizability, interpretability, data imbalance, safety concerns, and limited multimodal fusion. Finally, we articulate future research directions centered on scalable pretraining, continual learning, data governance, and trustworthiness.
- Abstract(参考訳): 基礎モデル(FM)は、科学的な発見のためにスケーラブルで汎用的でマルチモーダルなAIシステムを実現することによって、材料科学(MatSci)の変革的なシフトを触媒している。
通常スコープが狭く、タスク固有のエンジニアリングを必要とする従来の機械学習モデルとは異なり、FMはクロスドメインの一般化を提供し、創発的な能力を示す。
それらの汎用性は、研究課題がさまざまなデータタイプやスケールにまたがる材料科学に特に適している。
この調査は、この成長分野をサポートする基盤モデル、エージェントシステム、データセット、計算ツールの包括的概要を提供する。
本稿では,データ抽出,解釈,Q\&A,原子シミュレーション,特性予測,材料構造,設計,発見,プロセス計画,発見,最適化,マルチスケールモデリングの6分野を含むタスク駆動型分類について紹介する。
本稿では,一元的および多元的FMと,新たな大規模言語モデル(LLM)エージェントの最近の進歩について論じる。
さらに、標準化されたデータセット、オープンソースツール、そして研究ワークフローへのFMの開発と統合を加速する自律的な実験プラットフォームについてレビューする。
我々は、基礎モデルの早期成功を評価し、一般化可能性、解釈可能性、データの不均衡、安全性の懸念、限定的なマルチモーダル融合などの課題を含む永続的な限界を識別する。
最後に、スケーラブルな事前学習、継続的な学習、データガバナンス、信頼性に焦点を当てた将来の研究の方向性を明らかにします。
関連論文リスト
- Anomaly Detection and Generation with Diffusion Models: A Survey [51.61574868316922]
異常検出(AD)は、サイバーセキュリティ、金融、医療、工業製造など、さまざまな分野において重要な役割を担っている。
近年のディープラーニング,特に拡散モデル(DM)の進歩は,大きな関心を集めている。
この調査は、研究者や実践者が様々なアプリケーションにまたがる革新的なADソリューションにDMを利用することをガイドすることを目的としている。
論文 参考訳(メタデータ) (2025-06-11T03:29:18Z) - Empowering Time Series Analysis with Synthetic Data: A Survey and Outlook in the Era of Foundation Models [104.17057231661371]
時系列解析は複雑なシステムの力学を理解するために重要である。
基本モデルの最近の進歩はタスク非依存の時系列基礎モデル (TSFM) と大規模言語モデルベース時系列モデル (TSLLM) につながっている。
彼らの成功は、規制、多様性、品質、量制約のために構築が困難である、大規模で多様で高品質なデータセットに依存する。
本調査では,TSFMとTLLLMの合成データの総合的なレビュー,データ生成戦略の分析,モデル事前学習におけるそれらの役割,微調整,評価,今後の研究方向性の特定について述べる。
論文 参考訳(メタデータ) (2025-03-14T13:53:46Z) - Foundation Models for Spatio-Temporal Data Science: A Tutorial and Survey [69.0648659029394]
時空間(ST)データサイエンスは、都市コンピューティング、気候科学、インテリジェントトランスポートといった領域における複雑なシステムを理解するのに不可欠である。
研究者は、様々なSTタスクに対する適応性と一般化を高めるために、時空間モデル(STFM)の概念を探求し始めている。
STFMは、データセンシング、管理、マイニングなど、STデータサイエンスのワークフロー全体を強化し、より包括的でスケーラブルなアプローチを提供する。
論文 参考訳(メタデータ) (2025-03-12T09:42:18Z) - A Comprehensive Survey of Mixture-of-Experts: Algorithms, Theory, and Applications [7.414857515253022]
本稿では,ゲーティング機能,エキスパートネットワーク,ルーティング機構,トレーニング戦略,システム設計など,MoEの基本設計を紹介する。
次に,継続学習,メタ学習,マルチタスク学習,強化学習など,機械学習の重要なパラダイムにおけるMoEのアルゴリズム設計について検討する。
論文 参考訳(メタデータ) (2025-03-10T10:08:55Z) - MMSci: A Dataset for Graduate-Level Multi-Discipline Multimodal Scientific Understanding [59.41495657570397]
本稿では,72の科学分野をカバーするNature Communicationsの記事からまとめられた包括的データセットについて述べる。
2つのベンチマークタスク(図のキャプションと複数選択)で19のプロプライエタリモデルとオープンソースモデルを評価し,人手による注釈を行った。
タスク固有データを用いた細調整Qwen2-VL-7Bは、GPT-4oや人間の専門家でさえも、マルチチョイス評価において優れた性能を示した。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - HEMM: Holistic Evaluation of Multimodal Foundation Models [91.60364024897653]
マルチモーダル・ファンデーション・モデルは、画像、ビデオ、オーディオ、その他の知覚モダリティと共にテキストをホリスティックに処理することができる。
モデリング決定、タスク、ドメインの範囲を考えると、マルチモーダル基盤モデルの進歩を特徴づけ、研究することは困難である。
論文 参考訳(メタデータ) (2024-07-03T18:00:48Z) - Data-Driven Design for Metamaterials and Multiscale Systems: A Review [15.736695579155047]
メタマテリアル(Metamaterials)は、自然界にある物質を超える効果的な物質パラメータを示すために設計された人工材料である。
メタマテリアルの可能性を最大限に発揮できる魅力的なパラダイムとして、データ駆動設計(Data-driven Design)が生まれています。
我々は、データ駆動モジュールに関する既存の研究を組織し、データ取得、機械学習ベースの単位セル設計、データ駆動型マルチスケール最適化を含む。
論文 参考訳(メタデータ) (2023-07-01T22:36:40Z) - High-Modality Multimodal Transformer: Quantifying Modality & Interaction
Heterogeneity for High-Modality Representation Learning [112.51498431119616]
本稿では,多種多様なモダリティを含む高モダリティシナリオに対する効率的な表現学習について検討する。
単一のモデルであるHighMMTは、テキスト、画像、オーディオ、ビデオ、センサー、プロプレセプション、スピーチ、時系列、セット、テーブル)と5つの研究領域から15のタスクをスケールする。
論文 参考訳(メタデータ) (2022-03-02T18:56:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。