論文の概要: CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction
- arxiv url: http://arxiv.org/abs/2106.01560v1
- Date: Thu, 3 Jun 2021 03:00:12 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-04 16:06:53.883016
- Title: CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction
- Title(参考訳): CitationIE:科学情報抽出のためのCitation Graphの活用
- Authors: Vijay Viswanathan, Graham Neubig, Pengfei Liu
- Abstract要約: 引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
- 参考スコア(独自算出の注目度): 89.33938657493765
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Automatically extracting key information from scientific documents has the
potential to help scientists work more efficiently and accelerate the pace of
scientific progress. Prior work has considered extracting document-level entity
clusters and relations end-to-end from raw scientific text, which can improve
literature search and help identify methods and materials for a given problem.
Despite the importance of this task, most existing works on scientific
information extraction (SciIE) consider extraction solely based on the content
of an individual paper, without considering the paper's place in the broader
literature. In contrast to prior work, we augment our text representations by
leveraging a complementary source of document context: the citation graph of
referential links between citing and cited papers. On a test set of
English-language scientific documents, we show that simple ways of utilizing
the structure and content of the citation graph can each lead to significant
gains in different scientific information extraction tasks. When these tasks
are combined, we observe a sizable improvement in end-to-end information
extraction over the state-of-the-art, suggesting the potential for future work
along this direction. We release software tools to facilitate citation-aware
SciIE development.
- Abstract(参考訳): 科学的文書から重要な情報を自動抽出することは、科学者がより効率的に働き、科学的進歩のペースを加速するのに役立つ可能性がある。
先行研究は、文書レベルのエンティティクラスタと関係を原文から端から端まで抽出することを検討しており、文学検索を改善し、特定の問題の方法や資料を特定するのに役立つ。
この課題の重要性にもかかわらず、科学情報抽出(SciIE)に関する既存の研究の多くは、論文の広い文献における位置づけを考慮せずに、個々の論文の内容にのみ基づく抽出を検討する。
先行研究とは対照的に,文書コンテキストの補完的情報源である引用と引用間の参照リンクの引用グラフを利用することで,テキスト表現を増強する。
英文科学文書のテストセットにおいて,引用グラフの構造と内容を利用する簡単な方法が,それぞれ異なる科学情報抽出タスクにおいて有意な利益をもたらすことを示す。
これらのタスクが組み合わさった場合、最先端情報抽出の大幅な改善が観察され、今後の作業の可能性が示唆される。
我々は引用対応のSciIE開発を容易にするソフトウェアツールをリリースする。
関連論文リスト
- Context-Enhanced Language Models for Generating Multi-Paper Citations [35.80247519023821]
本稿では,Large Language Models (LLMs) を用いて多文文を生成する手法を提案する。
提案手法は,複数文の引用文を含むコヒーレントな段落に終止符を打つ,単一のソース・ペーパーと対象論文の集合を包含する。
論文 参考訳(メタデータ) (2024-04-22T04:30:36Z) - An approach based on Open Research Knowledge Graph for Knowledge
Acquisition from scientific papers [4.8951183832371]
Open Research Knowledge Graph (ORKG)は、研究論文から抽出されたキーインサイトを整理するコンピュータ支援ツールである。
現在、"食品情報工学"、"知識グラフマッチングへのタブラリデータ"、"クエストアンサーリング"研究問題、"Neuro-symbolic AI"ドメインの文書化に使用されている。
論文 参考訳(メタデータ) (2023-08-23T20:05:42Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - Scientific Paper Extractive Summarization Enhanced by Citation Graphs [50.19266650000948]
我々は、引用グラフを活用して、異なる設定下での科学的論文の抽出要約を改善することに重点を置いている。
予備的な結果は、単純な教師なしフレームワークであっても、引用グラフが有用であることを示している。
そこで我々は,大規模ラベル付きデータが利用可能である場合のタスクにおいて,より正確な結果を得るために,グラフベースのスーパービジョン・サムライゼーション・モデル(GSS)を提案する。
論文 参考訳(メタデータ) (2022-12-08T11:53:12Z) - Keyword Extraction in Scientific Documents [6.88201646115184]
科学的文書を理解することは、知識グラフの構築、テキストマイニング、規律分類といった下流タスクの重要なステップである。
本ワークショップでは,学術論文の要約からキーワードとキーフレーズの抽出をよりよく理解する。
論文 参考訳(メタデータ) (2022-07-05T08:33:47Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - Generating Knowledge Graphs by Employing Natural Language Processing and
Machine Learning Techniques within the Scholarly Domain [1.9004296236396943]
本稿では、自然言語処理と機械学習を利用して研究論文から実体や関係を抽出する新しいアーキテクチャを提案する。
本研究では,現在最先端の自然言語処理ツールとテキストマイニングツールを用いて,知識抽出の課題に取り組む。
セマンティックWebドメイン内の論文26,827件から抽出した109,105件のトリプルを含む科学知識グラフを作成した。
論文 参考訳(メタデータ) (2020-10-28T08:31:40Z) - Explaining Relationships Between Scientific Documents [55.23390424044378]
本稿では,2つの学術文書間の関係を自然言語テキストを用いて記述する課題に対処する。
本稿では154K文書から622Kサンプルのデータセットを作成する。
論文 参考訳(メタデータ) (2020-02-02T03:54:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。