Fugu-MT 論文翻訳(概要): Polymetis:Large Language Modeling for Multiple Material Domains

論文の概要: Polymetis:Large Language Modeling for Multiple Material Domains

arxiv url: http://arxiv.org/abs/2411.08728v1
Date: Wed, 13 Nov 2024 16:10:14 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:47.346226
Title: Polymetis:Large Language Modeling for Multiple Material Domains
Title（参考訳）: Polymetis:マルチマテリアルドメインのための大規模言語モデリング
Authors: Chao Huang, Huichen Xiao, Chen Chen, Chunyan Chen, Yi Zhao, Shiyu Du, Yiming Zhang, He Sha, Ruixin Gu,
Abstract要約: 本稿では,多種多様な材料分野を対象とした大規模言語モデルPolymetisモデルを提案する。このモデルでは,約200万件の資料知識に基づくデータセットを使用し,データセット構築の過程で知能抽出大モデルを開発した。我々はこのデータをGLM4-9Bモデルに注入し、様々な物質領域における推論能力を向上させる。
参考スコア（独自算出の注目度）: 11.396295878658924
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: As the application of large language models in various fields continues to expand, materials science also ushers in opportunities for AI-driven innovation. The traditional way of relying on manual search for materials science-related information is now using artificial intelligence technology as an auxiliary tool to improve the efficiency of materials science research. To accelerate researchers' knowledge acquisition and intelligent decision-making support in materials science research, this paper proposes a large language model Polymetis model for a variety of materials fields, aiming to provide highly professional knowledge answers in the field of materials, covering energy materials, functional materials, alloy materials, physical chemistry, biology, and other material directions. The model uses a dataset of about 2 million material knowledge instructions, and in the process of building the dataset, we developed the Intelligent Extraction Large Model (IELM), which is specially used to extract and form structured knowledge from scientific texts, avoiding a large number of costs that need to be manually annotated, and improving efficiency. We inject this data into the GLM4-9B model for learning to enhance its inference capabilities in a variety of material domains. In addition, we have introduced enhanced prompt strategies to ensure that the answers to the model are more organized and comprehensive, providing efficient and comprehensive intelligent support for the diverse needs of materials science exploration, and promoting the development of material science.
Abstract（参考訳）: 様々な分野における大規模言語モデルの適用が拡大し続けており、材料科学はAI駆動のイノベーションの機会にも繋がる。材料科学関連情報の手動検索に頼る従来の方法は、現在、材料科学研究の効率を改善する補助ツールとして人工知能技術を使用している。材料科学研究における研究者の知識獲得と知的な意思決定支援を促進するため,多種多様な材料分野を対象とした大規模言語モデルPolymetisモデルを提案し,エネルギー材料,機能性材料,合金材料,物理化学,生物学,その他の材料分野の高度な知識回答を提供することを目的とする。モデルは約200万の資料知識のデータセットを使用し、データセット構築の過程で、我々は、科学的テキストから構造化知識を抽出・形成するために特別に使用される知能抽出大モデル(IELM)を開発し、手動でアノテートする必要のある膨大なコストを回避し、効率を向上した。我々はこのデータをGLM4-9Bモデルに注入し、様々な物質領域における推論能力を向上させる。さらに,我々は,モデルに対する回答がより組織的かつ包括的であることを保証し,材料科学探査の多様なニーズに対する効率的かつ包括的支援を提供し,材料科学の発展を促進するために,促進されたプロンプト戦略を導入した。

関連論文リスト

Role of Large Language Models and Retrieval-Augmented Generation for Accelerating Crystalline Material Discovery: A Systematic Review [0.0]
大規模言語モデル(LLM)は、ドメイン間の知識集約的なタスクのための強力なツールとして登場した。 Retrieval-augmented Generation(RAG)は、研究者が物質構造を予測する方法に革命をもたらす可能性がある。
論文参考訳（メタデータ） (2025-08-08T20:32:56Z)
Materials Generation in the Era of Artificial Intelligence: A Comprehensive Survey [54.40267149907223]
材料は現代社会の基礎であり、エネルギー、エレクトロニクス、医療、交通、インフラの進歩を支えている。高度に調整された特性を持つ新しい材料を発見・設計する能力は、世界的課題の解決に不可欠である。データ駆動生成モデルは、事前定義された特性要件を満たす新しい材料を直接作成することによって、材料設計のための強力なツールを提供する。
論文参考訳（メタデータ） (2025-05-22T08:33:21Z)
Towards Artificial Intelligence Research Assistant for Expert-Involved Learning [64.7438151207189]
大規模言語モデル (LLMs) と大規模多モードモデル (LMMs) は科学研究における変革的ツールとして登場している。 textbfExpert-involved textbfLearning (ARIEL)のためのtextbfARtificial textbfIntelligence Research Assistantを提案する。
論文参考訳（メタデータ） (2025-05-03T14:21:48Z)
DARWIN 1.5: Large Language Models as Materials Science Adapted Learners [46.7259033847682]
DARWIN 1.5は,材料科学に適したオープンソースの大規模言語モデルである。 DARWINはタスク固有の記述子の必要性を排除し、材料特性の予測と発見に対する柔軟な統一的なアプローチを可能にする。提案手法は,6Mの物質ドメイン論文と49,256の物質から得られた21の実験データセットを統合し,タスク間の知識伝達を可能にする。
論文参考訳（メタデータ） (2024-12-16T16:51:27Z)
From Tokens to Materials: Leveraging Language Models for Scientific Discovery [12.211984932142537]
本研究では, 材料科学における材料特性予測のための言語モデル埋め込みの適用について検討した。本研究では、ドメイン固有モデル、特にMatBERTが、複合名や材料特性から暗黙的な知識を抽出する際の汎用モデルよりも優れていることを示す。
論文参考訳（メタデータ） (2024-10-21T16:31:23Z)
From Text to Insight: Large Language Models for Materials Science Data Extraction [4.08853418443192]
科学知識の大部分は、構造化されていない自然言語に存在する。構造化データは革新的で体系的な材料設計に不可欠である。大きな言語モデル(LLM)の出現は、大きな変化を示している。
論文参考訳（メタデータ） (2024-07-23T22:23:47Z)
Improving Molecular Modeling with Geometric GNNs: an Empirical Study [56.52346265722167]
本稿では,異なる標準化手法,(2)グラフ作成戦略,(3)補助的なタスクが性能,拡張性,対称性の強制に与える影響に焦点をあてる。本研究の目的は,分子モデリングタスクに最適なモデリングコンポーネントの選択を研究者に案内することである。
論文参考訳（メタデータ） (2024-07-11T09:04:12Z)
The Responsible Foundation Model Development Cheatsheet: A Review of Tools & Resources [100.23208165760114]
ファンデーションモデル開発は、急速に成長するコントリビュータ、科学者、アプリケーションを引き付けている。責任ある開発プラクティスを形成するために、我々はFoundation Model Development Cheatsheetを紹介します。
論文参考訳（メタデータ） (2024-06-24T15:55:49Z)
Diversifying Knowledge Enhancement of Biomedical Language Models using Adapter Modules and Knowledge Graphs [54.223394825528665]
我々は、軽量なアダプターモジュールを用いて、構造化された生体医学的知識を事前訓練された言語モデルに注入するアプローチを開発した。バイオメディカル知識システムUMLSと新しいバイオケミカルOntoChemの2つの大きなKGと、PubMedBERTとBioLinkBERTの2つの著名なバイオメディカルPLMを使用している。計算能力の要件を低く保ちながら,本手法がいくつかの事例において性能改善につながることを示す。
論文参考訳（メタデータ） (2023-12-21T14:26:57Z)
MatChat: A Large Language Model and Application Service Platform for Materials Science [18.55541324347915]
我々は、LLaMA2-7Bモデルのパワーを活用し、13,878個の構造化材料知識データを組み込んだ学習プロセスを通じて、LLaMA2-7Bモデルを強化する。 MatChatという名前のこの専門的なAIモデルは、無機物質合成経路の予測に焦点を当てている。 MatChatは現在オンラインでアクセス可能であり、モデルとアプリケーションフレームワークの両方をオープンソースとして利用できる。
論文参考訳（メタデータ） (2023-10-11T05:11:46Z)
BioinspiredLLM: Conversational Large Language Model for the Mechanics of Biological and Bio-inspired Materials [0.0]
オープンソースの自己回帰変換器大言語モデルであるBioinspiredLLMが報告されている。このモデルは、構造的生物学的および生体的インスパイアされた材料分野において、1,000以上の査読された記事のコーパスで微調整された。
論文参考訳（メタデータ） (2023-09-15T22:12:44Z)
Large Language Models as Master Key: Unlocking the Secrets of Materials Science with GPT [9.33544942080883]
本稿では,物質科学におけるデバイスレベルでの情報抽出の複雑さに対処するため,構造化情報推論(SII)と呼ばれる自然言語処理(NLP)タスクを提案する。我々は、既存のペロブスカイト型太陽電池FAIRデータセットに91.8%のF1スコアでGPT-3をチューニングし、リリース以来のデータでデータセットを拡張した。また、太陽電池の電気性能を予測する実験を設計し、大規模言語モデル(LLM)を用いてターゲットパラメータを持つ材料や装置の設計を行った。
論文参考訳（メタデータ） (2023-04-05T04:01:52Z)
Artificial Intelligence and Natural Language Processing and Understanding in Space: Four ESA Case Studies [48.53582660901672]
本稿では,空間文書から情報を自動的に抽出するための,人工知能と自然言語処理と理解に基づく方法論的枠組みを提案する。ケーススタディはミッションデザイン、品質保証、長期データ保存、オープンスペースイノベーションプラットフォームなど、ESAのさまざまな機能領域で実装されている。
論文参考訳（メタデータ） (2022-10-07T15:50:17Z)
Artificial Intelligence in Concrete Materials: A Scientometric View [77.34726150561087]
本章は, コンクリート材料用AI研究の主目的と知識構造を明らかにすることを目的としている。まず、1990年から2020年にかけて発行された389の雑誌記事が、ウェブ・オブ・サイエンスから検索された。キーワード共起分析やドキュメント共起分析などのサイエントメトリックツールを用いて,研究分野の特徴と特徴を定量化した。
論文参考訳（メタデータ） (2022-09-17T18:24:56Z)
Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。 ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文参考訳（メタデータ） (2020-08-05T15:45:54Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。