論文の概要: Are LLMs Ready for Real-World Materials Discovery?
- arxiv url: http://arxiv.org/abs/2402.05200v1
- Date: Wed, 7 Feb 2024 19:10:36 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-09 17:32:34.026920
- Title: Are LLMs Ready for Real-World Materials Discovery?
- Title(参考訳): LLMは現実世界の材料発見の準備が整っているか?
- Authors: Santiago Miret, N M Anoop Krishnan
- Abstract要約: 大規模言語モデル(LLM)は、材料科学の研究を加速する強力な言語処理ツールのエキサイティングな可能性を生み出します。
LLMは、物質理解と発見を加速する大きな可能性を秘めているが、現在は実用的な材料科学ツールとして不足している。
材料科学におけるLLMの失敗事例として,複雑で相互接続された材料科学知識の理解と推論に関連するLCMの現在の限界を明らかにする。
- 参考スコア(独自算出の注目度): 12.845153238975874
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large Language Models (LLMs) create exciting possibilities for powerful
language processing tools to accelerate research in materials science. While
LLMs have great potential to accelerate materials understanding and discovery,
they currently fall short in being practical materials science tools. In this
position paper, we show relevant failure cases of LLMs in materials science
that reveal current limitations of LLMs related to comprehending and reasoning
over complex, interconnected materials science knowledge. Given those
shortcomings, we outline a framework for developing Materials Science LLMs
(MatSci-LLMs) that are grounded in materials science knowledge and hypothesis
generation followed by hypothesis testing. The path to attaining performant
MatSci-LLMs rests in large part on building high-quality, multi-modal datasets
sourced from scientific literature where various information extraction
challenges persist. As such, we describe key materials science information
extraction challenges which need to be overcome in order to build large-scale,
multi-modal datasets that capture valuable materials science knowledge.
Finally, we outline a roadmap for applying future MatSci-LLMs for real-world
materials discovery via: 1. Automated Knowledge Base Generation; 2. Automated
In-Silico Material Design; and 3. MatSci-LLM Integrated Self-Driving Materials
Laboratories.
- Abstract(参考訳): 大規模言語モデル(LLM)は、材料科学の研究を加速する強力な言語処理ツールのエキサイティングな可能性を生み出します。
LLMは物質の理解と発見を加速する大きな可能性を秘めているが、現在は実用的な材料科学ツールとして不足している。
本稿では, 材料科学におけるLLMの失敗事例について, 複雑で相互接続された材料科学知識に対する理解と推論に関連するLLMの現在の限界を明らかにする。
これらの欠点を踏まえ、材料科学知識と仮説生成を基盤とした材料科学LLM(MatSci-LLMs)の開発のための枠組みを概説する。
MatSci-LLMsの達成への道は、様々な情報抽出課題が持続する科学文献から得られた高品質でマルチモーダルなデータセットの構築に大きく依存している。
そこで本研究では,材料科学の貴重な知識を収集する大規模マルチモーダルデータセットを構築するために,克服すべき重要な材料科学情報抽出課題について述べる。
最後に、実際の材料発見に将来のMatSci-LLMを適用するロードマップを概説する。
1.知識ベースの自動生成
2. シリコン内材料設計の自動化
3.MtSci-LLM統合自動運転材料研究所
関連論文リスト
- Materials science in the era of large language models: a perspective [0.0]
大きな言語モデル(LLM)は、その印象的な能力によってかなりの関心を集めている。
この論文は、様々なタスクや規律にわたる曖昧な要求に対処する能力は、研究者を支援する強力なツールになり得ると論じている。
論文 参考訳(メタデータ) (2024-03-11T17:34:25Z) - LEMMA: Towards LVLM-Enhanced Multimodal Misinformation Detection with
External Knowledge Augmentation [62.01320842738655]
外部知識を付加したLVLM強化マルチモーダル誤報検出システム LEMMAを提案する。
提案手法は,Twitter と Fakeddit のデータセットにおいて,上位ベースライン LVLM の精度を 7% と 13% に向上させる。
論文 参考訳(メタデータ) (2024-02-19T08:32:27Z) - Rethinking Interpretability in the Era of Large Language Models [76.1947554386879]
大規模言語モデル(LLM)は、幅広いタスクにまたがる顕著な機能を示している。
自然言語で説明できる能力により、LLMは人間に与えられるパターンのスケールと複雑さを拡大することができる。
これらの新しい機能は、幻覚的な説明や膨大な計算コストなど、新しい課題を提起する。
論文 参考訳(メタデータ) (2024-01-30T17:38:54Z) - Large Language Models for Generative Information Extraction: A Survey [93.28676955662002]
情報抽出は、平易な自然言語テキストから構造的知識を抽出することを目的としている。
生成型大規模言語モデル(LLM)は、テキストの理解と生成において顕著な能力を示した。
LLMは生成パラダイムに基づいたIEタスクに対して実行可能なソリューションを提供する。
論文 参考訳(メタデータ) (2023-12-29T14:25:22Z) - Multimodal Learning for Crystalline Materials [8.915142640507794]
液晶材料のための多モード学習(MLCM)は,多モードアライメントによる結晶材料の基礎モデルをトレーニングするための新しい手法である。
MLCMは、挑戦的なMaterial Projectデータベース上での材料特性予測のための最先端性能を実現する。
私たちの研究は、進行中のAI革命のイノベーションを材料科学の領域に持ち込み、素材を次世代AIのテストベッドとして特定します。
論文 参考訳(メタデータ) (2023-11-30T18:35:29Z) - RECALL: A Benchmark for LLMs Robustness against External Counterfactual
Knowledge [69.79676144482792]
本研究の目的は,LLMが外部知識から信頼できる情報を識別する能力を評価することである。
本ベンチマークは,質問応答とテキスト生成という2つのタスクから構成される。
論文 参考訳(メタデータ) (2023-11-14T13:24:19Z) - Reconstructing Materials Tetrahedron: Challenges in Materials
Information Extraction [25.200852480951454]
材料科学文献からの自動情報抽出における課題を論じ,定量化し,文書化する。
この情報は、表、テキスト、画像などの複数のフォーマットに分散し、レポートスタイルの統一性はほとんど、あるいは全くない。
この研究が研究者に、一貫性のある方法で課題に対処するように促すことを願っています。
論文 参考訳(メタデータ) (2023-10-12T14:57:24Z) - MatChat: A Large Language Model and Application Service Platform for
Materials Science [18.55541324347915]
我々は、LLaMA2-7Bモデルのパワーを活用し、13,878個の構造化材料知識データを組み込んだ学習プロセスを通じて、LLaMA2-7Bモデルを強化する。
MatChatという名前のこの専門的なAIモデルは、無機物質合成経路の予測に焦点を当てている。
MatChatは現在オンラインでアクセス可能であり、モデルとアプリケーションフレームワークの両方をオープンソースとして利用できる。
論文 参考訳(メタデータ) (2023-10-11T05:11:46Z) - SciBench: Evaluating College-Level Scientific Problem-Solving Abilities
of Large Language Models [72.92461995173201]
拡張ベンチマークスイートSciBench for Large Language Model (LLM)を導入する。
SciBenchには、数学、化学、物理学の分野から、さまざまな大学レベルの科学的問題を含むデータセットが含まれている。
その結果、現在のLLMは満足のいく性能を達成できないことが判明し、全体のスコアは43.22%に過ぎなかった。
論文 参考訳(メタデータ) (2023-07-20T07:01:57Z) - A Comprehensive Overview of Large Language Models [70.78732351626734]
大規模言語モデル(LLM)は、最近自然言語処理タスクにおいて顕著な機能を示した。
本稿では, LLM関連概念の幅広い範囲について, 既存の文献について概説する。
論文 参考訳(メタデータ) (2023-07-12T20:01:52Z) - 14 Examples of How LLMs Can Transform Materials Science and Chemistry: A
Reflection on a Large Language Model Hackathon [30.978561315637307]
大規模言語モデル(LLM)は化学や材料科学に有用である。
これらの可能性を探るため、ハッカソンを組織した。
この記事ではハッカソンの一部として構築されたプロジェクトを概説する。
論文 参考訳(メタデータ) (2023-06-09T22:22:02Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。