論文の概要: MatSciRE: Leveraging Pointer Networks to Automate Entity and Relation
Extraction for Material Science Knowledge-base Construction
- arxiv url: http://arxiv.org/abs/2401.09839v1
- Date: Thu, 18 Jan 2024 09:54:18 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-19 17:09:18.983300
- Title: MatSciRE: Leveraging Pointer Networks to Automate Entity and Relation
Extraction for Material Science Knowledge-base Construction
- Title(参考訳): MatScire: 材料科学知識ベース構築のためのエンティティと関係抽出を自動化するポインタネットワークを活用する
- Authors: Ankan Mullick, Akash Ghosh, G Sai Chaitanya, Samir Ghui, Tapas Nayak,
Seung-Cheol Lee, Satadeep Bhattacharjee, Pawan Goyal
- Abstract要約: 本稿では,3重項として物質科学論文から実体と関係を共同抽出する,ポインタネットワークベースのエンコーダデコーダフレームワークであるMatSciREを提案する。
電池材料を対象とし, 導電性, クーロン効率, キャパシティ, 電圧, エネルギーの5つの関係を同定する。
提案手法は,ChemDataExtractorを用いた以前の試みよりもはるかに優れたF1スコア(0.771)を実現した。
- 参考スコア(独自算出の注目度): 14.088077096316654
- License: http://creativecommons.org/publicdomain/zero/1.0/
- Abstract: Material science literature is a rich source of factual information about
various categories of entities (like materials and compositions) and various
relations between these entities, such as conductivity, voltage, etc.
Automatically extracting this information to generate a material science
knowledge base is a challenging task. In this paper, we propose MatSciRE
(Material Science Relation Extractor), a Pointer Network-based encoder-decoder
framework, to jointly extract entities and relations from material science
articles as a triplet ($entity1, relation, entity2$). Specifically, we target
the battery materials and identify five relations to work on - conductivity,
coulombic efficiency, capacity, voltage, and energy. Our proposed approach
achieved a much better F1-score (0.771) than a previous attempt using
ChemDataExtractor (0.716). The overall graphical framework of MatSciRE is shown
in Fig 1. The material information is extracted from material science
literature in the form of entity-relation triplets using MatSciRE.
- Abstract(参考訳): 物質科学の文献は、様々な種類の実体(材料や組成など)とこれらの実体間の様々な関係(導電性、電圧など)に関する事実情報の豊富な情報源である。
物質科学知識ベースを生成するためにこの情報を自動抽出することは難しい課題である。
本稿では,ポインタネットワークを用いたエンコーダ・デコーダ・フレームワークであるMatSciRE(Material Science Relation Extractor)を提案する。
具体的には, 電池材料を対象とし, 導電率, クーロン効率, 容量, 電圧, エネルギーの5つの関係を同定する。
提案手法は,従来のChemDataExtractor (0.716) よりもはるかに優れたF1スコア(0.771)を実現した。
MatSciREの全体的なグラフィカルなフレームワークは、図1に示されています。
物質情報は、MatSciREを用いて、実体関係三重項の形で物質科学文献から抽出される。
関連論文リスト
- Foundation Model for Composite Materials and Microstructural Analysis [49.1574468325115]
複合材料に特化して設計された基礎モデルを提案する。
我々のモデルは、頑健な潜伏特性を学習するために、短繊維コンポジットのデータセット上で事前訓練されている。
転送学習中、MMAEはR2スコアが0.959に達し、限られたデータで訓練しても0.91を超えている均質化剛性を正確に予測する。
論文 参考訳(メタデータ) (2024-11-10T19:06:25Z) - SciER: An Entity and Relation Extraction Dataset for Datasets, Methods, and Tasks in Scientific Documents [49.54155332262579]
我々は,科学論文のデータセット,メソッド,タスクに関連するエンティティに対して,新たなエンティティと関係抽出データセットをリリースする。
我々のデータセットには、24k以上のエンティティと12kの関係を持つ106の注釈付きフルテキストの科学出版物が含まれています。
論文 参考訳(メタデータ) (2024-10-28T15:56:49Z) - From Tokens to Materials: Leveraging Language Models for Scientific Discovery [12.211984932142537]
本研究では, 材料科学における材料特性予測のための言語モデル埋め込みの適用について検討した。
本研究では、ドメイン固有モデル、特にMatBERTが、複合名や材料特性から暗黙的な知識を抽出する際の汎用モデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-21T16:31:23Z) - Mining experimental data from Materials Science literature with Large Language Models: an evaluation study [1.9849264945671101]
本研究は,大規模言語モデル (LLM) の教材科学における科学的資料から構造化情報を抽出する能力を評価することを目的としている。
我々は,情報抽出における2つの重要な課題に焦点をあてる: (i) 研究材料と物性の名前を付けたエンティティ認識(NER) と, (ii) それらのエンティティ間の関係抽出(RE) である。
これらのタスクの実行におけるLCMの性能は、BERTアーキテクチャとルールベースのアプローチ(ベースライン)に基づいて従来のモデルと比較される。
論文 参考訳(メタデータ) (2024-01-19T23:00:31Z) - Multimodal Learning for Materials [7.167520424757711]
材料の基礎モデルの自己教師型マルチモーダルトレーニングを可能にするマルチモーダル・ラーニング・フォー・マテリアル(MultiMat)を紹介した。
複数の軸上のMaterial Projectデータベースからのデータを用いてフレームワークの可能性を示す。
論文 参考訳(メタデータ) (2023-11-30T18:35:29Z) - MuLMS: A Multi-Layer Annotated Text Corpus for Information Extraction in
the Materials Science Domain [0.7947524927438001]
材料科学の7つのサブドメインにまたがる50のオープンアクセス記事のデータセットであるMulMSを提示する。
すべてのタスクに対して競合するニューラルモデルを提示し、既存の関連リソースによるマルチタスクトレーニングがメリットをもたらすことを示す。
論文 参考訳(メタデータ) (2023-10-24T07:23:46Z) - ReSel: N-ary Relation Extraction from Scientific Text and Tables by
Learning to Retrieve and Select [53.071352033539526]
学術論文からN-ary関係を抽出する問題について考察する。
提案手法であるReSelは,このタスクを2段階のプロシージャに分解する。
3つの科学的情報抽出データセットに対する実験により、ReSelは最先端のベースラインを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2022-10-26T02:28:02Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - MatScIE: An automated tool for the generation of databases of methods
and parameters used in the computational materials science literature [5.217605474243695]
MatScIEは、材料科学文献から関連情報を抽出し、構造化されたデータベースを作成する。
ユーザーは公開された記事をアップロードし、このツールから取得した情報を閲覧/ダウンロードすることができる。
論文 参考訳(メタデータ) (2020-09-15T01:52:47Z) - HittER: Hierarchical Transformers for Knowledge Graph Embeddings [85.93509934018499]
複雑な知識グラフにおける実体と関係の表現を学習するためにHittを提案する。
実験結果から,Hittは複数リンク予測において最先端の新たな結果が得られることがわかった。
さらに,HittをBERTに統合する簡単なアプローチを提案し,その効果を2つのFreebaseファクトイド対応データセットで示す。
論文 参考訳(メタデータ) (2020-08-28T18:58:15Z) - ENT-DESC: Entity Description Generation by Exploring Knowledge Graph [53.03778194567752]
実際には、出力記述が最も重要な知識のみをカバーするため、入力知識は十分以上である可能性がある。
我々は、KG-to-textにおけるこのような実践的なシナリオの研究を容易にするために、大規模で挑戦的なデータセットを導入する。
本稿では,元のグラフ情報をより包括的に表現できるマルチグラフ構造を提案する。
論文 参考訳(メタデータ) (2020-04-30T14:16:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。