論文の概要: Construction and Application of Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model
- arxiv url: http://arxiv.org/abs/2404.03080v3
- Date: Mon, 30 Sep 2024 13:46:20 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-01 22:01:39.370715
- Title: Construction and Application of Materials Knowledge Graph in Multidisciplinary Materials Science via Large Language Model
- Title(参考訳): 大規模言語モデルを用いた多分野教材科学における教材知識グラフの構築と応用
- Authors: Yanpeng Ye, Jie Ren, Shaozhou Wang, Yuwei Wan, Haofen Wang, Imran Razzak, Bram Hoex, Tong Xie, Wenjie Zhang,
- Abstract要約: 本稿では,高度な自然言語処理技術を活用したマテリアル知識グラフ(MKG)を紹介する。
MKGは、情報を名前、フォーミュラ、アプリケーションなどの包括的なラベルに分類する。
ネットワークベースのアルゴリズムを実装することで、MKGは効率的なリンク予測を容易にするだけでなく、従来の実験手法への依存を著しく低減する。
- 参考スコア(独自算出の注目度): 16.030268397865264
- License:
- Abstract: Knowledge in materials science is widely dispersed across extensive scientific literature, posing significant challenges for efficient discovery and integration of new materials. Traditional methods, often reliant on costly and time-consuming experimental approaches, further complicate rapid innovation. Addressing these challenges, the integration of artificial intelligence with materials science has opened avenues for accelerating the discovery process, though it also demands precise annotation, data extraction, and traceability of information. To tackle these issues, this article introduces the Materials Knowledge Graph (MKG), which utilizes advanced natural language processing techniques, integrated with large language models to extract and systematically organize a decade's worth of high-quality research into structured triples, contains 162,605 nodes and 731,772 edges. MKG categorizes information into comprehensive labels such as Name, Formula, and Application, structured around a meticulously designed ontology, thus enhancing data usability and integration. By implementing network-based algorithms, MKG not only facilitates efficient link prediction but also significantly reduces reliance on traditional experimental methods. This structured approach not only streamlines materials research but also lays the groundwork for more sophisticated science knowledge graphs.
- Abstract(参考訳): 材料科学の知識は幅広い科学文献に広く分散しており、新素材の効率的な発見と統合のための重要な課題となっている。
伝統的な手法は、しばしばコストと時間を要する実験的なアプローチに依存し、急激なイノベーションをさらに複雑にする。
これらの課題に対処するため、人工知能と材料科学の統合は発見プロセスを加速するための道を開いたが、正確なアノテーション、データ抽出、情報のトレーサビリティも要求されている。
これらの課題に対処するため,本論文では,高度な自然言語処理技術を活用し,大規模言語モデルと統合され,構造化三重項に対する10年分の高品質な研究の抽出と体系化を行うMaterial Knowledge Graph(MKG)について紹介する。
MKGは、情報を名前、フォーミュラ、アプリケーションなどの包括的ラベルに分類する。
ネットワークベースのアルゴリズムを実装することで、MKGは効率的なリンク予測を容易にするだけでなく、従来の実験手法への依存を著しく低減する。
この構造的アプローチは、材料研究の合理化だけでなく、より洗練された科学知識グラフの基盤となる。
関連論文リスト
- From Text to Insight: Large Language Models for Materials Science Data Extraction [4.08853418443192]
科学知識の大部分は、構造化されていない自然言語に存在する。
構造化データは革新的で体系的な材料設計に不可欠である。
大きな言語モデル(LLM)の出現は、大きな変化を示している。
論文 参考訳(メタデータ) (2024-07-23T22:23:47Z) - MMSci: A Multimodal Multi-Discipline Dataset for PhD-Level Scientific Comprehension [59.41495657570397]
我々は、Nature Communications Journalsに掲載されたオープンアクセス科学論文から、マルチモーダルで多分野のデータセットを収集した。
このデータセットは72の科学分野にまたがっており、多様性と品質の両方を保証している。
科学的な数字や内容を理解する上でLMMの能力を総合的に評価するために,様々なタスクと設定のベンチマークを作成した。
論文 参考訳(メタデータ) (2024-07-06T00:40:53Z) - Agent-based Learning of Materials Datasets from Scientific Literature [0.0]
我々は,大規模言語モデル(LLM)を利用した化学AIエージェントを開発し,自然言語テキストから構造化データセットを作成する。
化学者のAIエージェントであるEunomiaは、何十年もの科学研究論文から既存の知識を活用して、行動を計画し実行することができる。
論文 参考訳(メタデータ) (2023-12-18T20:29:58Z) - Reconstructing Materials Tetrahedron: Challenges in Materials Information Extraction [23.489721319567025]
材料科学文献からの自動情報抽出における課題を論じ,定量化し,文書化する。
この情報は、表、テキスト、画像などの複数のフォーマットに分散し、レポートスタイルの統一性はほとんど、あるいは全くない。
本研究は,IEが材料知識基盤を開発する上で,その課題に一貫した形で対処する上で,研究者に刺激を与えるものであることを願っている。
論文 参考訳(メタデータ) (2023-10-12T14:57:24Z) - Structured information extraction from complex scientific text with
fine-tuned large language models [55.96705756327738]
そこで本研究では,共振器認識と関係抽出のための簡単なシーケンス・ツー・シーケンス手法を提案する。
このアプローチは、約500組のプロンプトで微調整された、事前訓練済みの大規模言語モデル(LLM)であるGPT-3を利用する。
このアプローチは、構造化されていないテキストから抽出された構造化知識の大規模なデータベースを得るための、シンプルで、アクセス可能で、非常に柔軟な経路を示す。
論文 参考訳(メタデータ) (2022-12-10T07:51:52Z) - Artificial Intelligence in Concrete Materials: A Scientometric View [77.34726150561087]
本章は, コンクリート材料用AI研究の主目的と知識構造を明らかにすることを目的としている。
まず、1990年から2020年にかけて発行された389の雑誌記事が、ウェブ・オブ・サイエンスから検索された。
キーワード共起分析やドキュメント共起分析などのサイエントメトリックツールを用いて,研究分野の特徴と特徴を定量化した。
論文 参考訳(メタデータ) (2022-09-17T18:24:56Z) - Knowledge Graph Augmented Network Towards Multiview Representation
Learning for Aspect-based Sentiment Analysis [96.53859361560505]
本稿では,知識グラフ拡張ネットワーク(KGAN)を提案する。
KGANは感情の特徴表現を、文脈、構文、知識に基づく複数の視点から捉えている。
3つの人気のあるABSAベンチマークの実験は、我々のKGANの有効性と堅牢性を示している。
論文 参考訳(メタデータ) (2022-01-13T08:25:53Z) - Text to Insight: Accelerating Organic Materials Knowledge Extraction via
Deep Learning [1.2774526936067927]
本研究は,有機材料の知識抽出を探求することを目的とする。
我々は,92,667件の要約から,855件の注釈文と708,376件の注釈文からなる研究データセットを構築した。
BiLSTM-CNN-CRF深層学習モデルを用いて,文献から重要な知識を自動的に抽出した。
論文 参考訳(メタデータ) (2021-09-27T01:58:35Z) - Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain [1.9004296236396943]
本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。
本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。
セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
論文 参考訳(メタデータ) (2020-10-28T08:31:40Z) - Machine Learning in Nano-Scale Biomedical Engineering [77.75587007080894]
ナノスケールバイオメディカルエンジニアリングにおける機械学習の利用に関する既存の研究について概説する。
ML問題として定式化できる主な課題は、3つの主要なカテゴリに分類される。
提示された方法論のそれぞれについて、その原則、応用、制限に特に重点を置いている。
論文 参考訳(メタデータ) (2020-08-05T15:45:54Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。