論文の概要: Polymetis:Large Language Modeling for Multiple Material Domains
- arxiv url: http://arxiv.org/abs/2411.08728v1
- Date: Wed, 13 Nov 2024 16:10:14 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-14 16:11:23.034931
- Title: Polymetis:Large Language Modeling for Multiple Material Domains
- Title(参考訳): Polymetis:マルチマテリアルドメインのための大規模言語モデリング
- Authors: Chao Huang, Huichen Xiao, Chen Chen, Chunyan Chen, Yi Zhao, Shiyu Du, Yiming Zhang, He Sha, Ruixin Gu,
- Abstract要約: 本稿では,多種多様な材料分野を対象とした大規模言語モデルPolymetisモデルを提案する。
このモデルでは,約200万件の資料知識に基づくデータセットを使用し,データセット構築の過程で知能抽出大モデルを開発した。
我々はこのデータをGLM4-9Bモデルに注入し、様々な物質領域における推論能力を向上させる。
- 参考スコア(独自算出の注目度): 11.396295878658924
- License:
- Abstract: As the application of large language models in various fields continues to expand, materials science also ushers in opportunities for AI-driven innovation. The traditional way of relying on manual search for materials science-related information is now using artificial intelligence technology as an auxiliary tool to improve the efficiency of materials science research. To accelerate researchers' knowledge acquisition and intelligent decision-making support in materials science research, this paper proposes a large language model Polymetis model for a variety of materials fields, aiming to provide highly professional knowledge answers in the field of materials, covering energy materials, functional materials, alloy materials, physical chemistry, biology, and other material directions. The model uses a dataset of about 2 million material knowledge instructions, and in the process of building the dataset, we developed the Intelligent Extraction Large Model (IELM), which is specially used to extract and form structured knowledge from scientific texts, avoiding a large number of costs that need to be manually annotated, and improving efficiency. We inject this data into the GLM4-9B model for learning to enhance its inference capabilities in a variety of material domains. In addition, we have introduced enhanced prompt strategies to ensure that the answers to the model are more organized and comprehensive, providing efficient and comprehensive intelligent support for the diverse needs of materials science exploration, and promoting the development of material science.
- Abstract(参考訳): 様々な分野における大規模言語モデルの適用が拡大し続けており、材料科学はAI駆動のイノベーションの機会にも繋がる。
材料科学関連情報の手動検索に頼る従来の方法は、現在、材料科学研究の効率を改善する補助ツールとして人工知能技術を使用している。
材料科学研究における研究者の知識獲得と知的な意思決定支援を促進するため,多種多様な材料分野を対象とした大規模言語モデルPolymetisモデルを提案し,エネルギー材料,機能性材料,合金材料,物理化学,生物学,その他の材料分野の高度な知識回答を提供することを目的とする。
モデルは約200万の資料知識のデータセットを使用し、データセット構築の過程で、我々は、科学的テキストから構造化知識を抽出・形成するために特別に使用される知能抽出大モデル(IELM)を開発し、手動でアノテートする必要のある膨大なコストを回避し、効率を向上した。
我々はこのデータをGLM4-9Bモデルに注入し、様々な物質領域における推論能力を向上させる。
さらに,我々は,モデルに対する回答がより組織的かつ包括的であることを保証し,材料科学探査の多様なニーズに対する効率的かつ包括的支援を提供し,材料科学の発展を促進するために,促進されたプロンプト戦略を導入した。
関連論文リスト
- From Tokens to Materials: Leveraging Language Models for Scientific Discovery [12.211984932142537]
本研究では, 材料科学における材料特性予測のための言語モデル埋め込みの適用について検討した。
本研究では、ドメイン固有モデル、特にMatBERTが、複合名や材料特性から暗黙的な知識を抽出する際の汎用モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-21T16:31:23Z) - From Text to Insight: Large Language Models for Materials Science Data Extraction [4.08853418443192]
科学知識の大部分は、構造化されていない自然言語に存在する。
構造化データは革新的で体系的な材料設計に不可欠である。
大きな言語モデル(LLM)の出現は、大きな変化を示している。
論文 参考訳(メタデータ) (2024-07-23T22:23:47Z) - Improving Molecular Modeling with Geometric GNNs: an Empirical Study [56.52346265722167]
本稿では,異なる標準化手法,(2)グラフ作成戦略,(3)補助的なタスクが性能,拡張性,対称性の強制に与える影響に焦点をあてる。
本研究の目的は,分子モデリングタスクに最適なモデリングコンポーネントの選択を研究者に案内することである。
論文 参考訳(メタデータ) (2024-07-11T09:04:12Z) - The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources [100.23208165760114]
ファンデーションモデル開発は、急速に成長するコントリビュータ、科学者、アプリケーションを引き付けている。
責任ある開発プラクティスを形成するために、我々はFoundation Model Development Cheatsheetを紹介します。
論文 参考訳(メタデータ) (2024-06-24T15:55:49Z) - Diversifying Knowledge Enhancement of Biomedical Language Models using
Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。
バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。
計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文 参考訳(メタデータ) (2023-12-21T14:26:57Z) - MatChat: A Large Language Model and Application Service Platform for
Materials Science [18.55541324347915]
我々は、LLaMA2-7Bモデルのパワーを活用し、13,878個の構造化材料知識データを組み込んだ学習プロセスを通じて、LLaMA2-7Bモデルを強化する。
MatChatという名前のこの専門的なAIモデルは、無機物質合成経路の予測に焦点を当てている。
MatChatは現在オンラインでアクセス可能であり、モデルとアプリケーションフレームワークの両方をオープンソースとして利用できる。
論文 参考訳(メタデータ) (2023-10-11T05:11:46Z) - BioinspiredLLM: Conversational Large Language Model for the Mechanics of
Biological and Bio-inspired Materials [0.0]
オープンソースの自己回帰変換器大言語モデルであるBioinspiredLLMが報告されている。
このモデルは、構造的生物学的および生体的インスパイアされた材料分野において、1,000以上の査読された記事のコーパスで微調整された。
論文 参考訳(メタデータ) (2023-09-15T22:12:44Z) - Large Language Models as Master Key: Unlocking the Secrets of Materials
Science with GPT [9.33544942080883]
本稿では,物質科学におけるデバイスレベルでの情報抽出の複雑さに対処するため,構造化情報推論(SII)と呼ばれる自然言語処理(NLP)タスクを提案する。
我々は、既存のペロブスカイト型太陽電池FAIRデータセットに91.8%のF1スコアでGPT-3をチューニングし、リリース以来のデータでデータセットを拡張した。
また、太陽電池の電気性能を予測する実験を設計し、大規模言語モデル(LLM)を用いてターゲットパラメータを持つ材料や装置の設計を行った。
論文 参考訳(メタデータ) (2023-04-05T04:01:52Z) - Artificial Intelligence and Natural Language Processing and
Understanding in Space: Four ESA Case Studies [48.53582660901672]
本稿では,空間文書から情報を自動的に抽出するための,人工知能と自然言語処理と理解に基づく方法論的枠組みを提案する。
ケーススタディはミッションデザイン、品質保証、長期データ保存、オープンスペースイノベーションプラットフォームなど、ESAのさまざまな機能領域で実装されている。
論文 参考訳(メタデータ) (2022-10-07T15:50:17Z) - Artificial Intelligence in Concrete Materials: A Scientometric View [77.34726150561087]
本章は, コンクリート材料用AI研究の主目的と知識構造を明らかにすることを目的としている。
まず、1990年から2020年にかけて発行された389の雑誌記事が、ウェブ・オブ・サイエンスから検索された。
キーワード共起分析やドキュメント共起分析などのサイエントメトリックツールを用いて,研究分野の特徴と特徴を定量化した。
論文 参考訳(メタデータ) (2022-09-17T18:24:56Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。