論文の概要: KnowGraph@IITK at SemEval-2021 Task 11: Building KnowledgeGraph for NLP
Research
- arxiv url: http://arxiv.org/abs/2104.01619v1
- Date: Sun, 4 Apr 2021 14:33:21 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-06 14:43:21.797003
- Title: KnowGraph@IITK at SemEval-2021 Task 11: Building KnowledgeGraph for NLP
Research
- Title(参考訳): KnowGraph@IITK at SemEval-2021 Task 11: Building KnowledgeGraph for NLP Research
- Authors: Shashank Shailabh, Sajal Chaurasia, Ashutosh Modi
- Abstract要約: 自然言語処理文献を用いた研究論文貢献型知識グラフ作成システムを開発する。
提案システムは対象領域に依存せず,任意の領域の知識グラフ構築に利用することができる。
終末パイプラインテスト,句抽出テスト,三重項抽出テストでは,F1スコアが0.38,0.63,0.76となった。
- 参考スコア(独自算出の注目度): 2.1012672709024294
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Research in Natural Language Processing is making rapid advances, resulting
in the publication of a large number of research papers. Finding relevant
research papers and their contribution to the domain is a challenging problem.
In this paper, we address this challenge via the SemEval 2021 Task 11:
NLPContributionGraph, by developing a system for a research paper
contributions-focused knowledge graph over Natural Language Processing
literature. The task is divided into three sub-tasks: extracting contribution
sentences that show important contributions in the research article, extracting
phrases from the contribution sentences, and predicting the information units
in the research article together with triplet formation from the phrases. The
proposed system is agnostic to the subject domain and can be applied for
building a knowledge graph for any area. We found that transformer-based
language models can significantly improve existing techniques and utilized the
SciBERT-based model. Our first sub-task uses Bidirectional LSTM (BiLSTM)
stacked on top of SciBERT model layers, while the second sub-task uses
Conditional Random Field (CRF) on top of SciBERT with BiLSTM. The third
sub-task uses a combined SciBERT based neural approach with heuristics for
information unit prediction and triplet formation from the phrases. Our system
achieved F1 score of 0.38, 0.63 and 0.76 in end-to-end pipeline testing, phrase
extraction testing and triplet extraction testing respectively.
- Abstract(参考訳): 自然言語処理の研究は急速に進展しており、多くの研究論文が発行されている。
関連する研究論文の発見とドメインへの貢献は難しい問題である。
本稿では,自然言語処理文献を対象とする研究論文に焦点を絞ったナレッジグラフのシステムを構築し,semeval 2021タスク11: nlpcontributiongraphを通じてこの問題に対処した。
課題は3つのサブタスクに分けられる:研究記事において重要な貢献を示す貢献文を抽出し、貢献文からフレーズを抽出し、そのフレーズから三重項の生成とともに研究記事の情報単位を予測する。
提案システムは対象領域に依存せず,任意の領域の知識グラフ構築に利用することができる。
トランスフォーマーベースの言語モデルは既存の手法を大幅に改善し、SciBERTベースのモデルを利用した。
第1のサブタスクはSciBERTモデルレイヤ上に積み重ねられたBidirectional LSTM(BiLSTM)を使用し、第2のサブタスクはSciBERT上にBiLSTMを組み込んだ条件ランダムフィールド(CRF)を使用する。
第3のサブタスクでは、SciBERTベースのニューラルネットワークとヒューリスティックを組み合わせて、情報単位予測とフレーズからのトリプルト生成を行う。
終末パイプラインテスト,句抽出テスト,三重項抽出テストではF1スコアが0.38,0.63,0.76となった。
関連論文リスト
- SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [80.49349719239584]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning, SciRIFF)は、54のタスクに対して137Kの命令追従デモのデータセットである。
SciRIFFは、幅広い科学分野の研究文献から情報を抽出し、合成することに焦点を当てた最初のデータセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - Enriched BERT Embeddings for Scholarly Publication Classification [0.13654846342364302]
NSLP 2024 FoRC Task Iは、競争として組織されたこの課題に対処する。
目的は、ある論文に対する研究分野の分類法であるOpen Research Knowledge Graph (ORKG) から、123の事前定義されたクラスのうちの1つを予測することができる分類器を開発することである。
論文 参考訳(メタデータ) (2024-05-07T09:05:20Z) - Recitation-Augmented Language Models [85.30591349383849]
知識集約型NLPタスクにおいて,RECITEは強力なパラダイムであることを示す。
具体的には、リサイクリングを中間ステップとして活用することにより、新しい最先端性能を実現することができることを示す。
論文 参考訳(メタデータ) (2022-10-04T00:49:20Z) - Modeling Multi-Granularity Hierarchical Features for Relation Extraction [26.852869800344813]
本稿では,原文のみに基づく多粒度特徴抽出手法を提案する。
外部知識を必要とせずに,効果的な構造的特徴が達成可能であることを示す。
論文 参考訳(メタデータ) (2022-04-09T09:44:05Z) - Exploring Neural Models for Query-Focused Summarization [74.41256438059256]
クエリ中心の要約(QFS)に対するニューラルネットワークの体系的な探索を行う。
本稿では,QMSumデータセットの最先端性能を最大3.38ROUGE-1,3.72ROUGE-2,3.28ROUGE-Lのマージンで達成する2つのモデル拡張を提案する。
論文 参考訳(メタデータ) (2021-12-14T18:33:29Z) - SemEval-2021 Task 11: NLPContributionGraph -- Structuring Scholarly NLP
Contributions for a Research Knowledge Graph [0.17188280334580192]
SemEval-2021 Shared Task NLPContributionGraph (別名「NCGタスク」)は、NLPの学術論文からの貢献を構造化する自動システムの開発に参加する。
SemEvalシリーズの第一種であるこのタスクは、NLPの学術論文から構造化されたデータを3レベルの情報粒度でリリースした。
ベストエンド・ツー・エンドのタスク・システムは、貢献の文章を57.27% F1、フレーズを46.41% F1、トリプルを22.28% F1と分類した。
論文 参考訳(メタデータ) (2021-06-10T13:43:47Z) - Wizard of Search Engine: Access to Information Through Conversations
with Search Engines [58.53420685514819]
我々は3つの側面からCISの研究を促進するために努力している。
目的検出(ID)、キーフレーズ抽出(KE)、行動予測(AP)、クエリ選択(QS)、通過選択(PS)、応答生成(RG)の6つのサブタスクでCIS用のパイプラインを定式化する。
検索エンジンのウィザード(WISE)と呼ばれるベンチマークデータセットをリリースし、CISのすべての側面について包括的かつ詳細な調査を可能にします。
論文 参考訳(メタデータ) (2021-05-18T06:35:36Z) - UIUC_BioNLP at SemEval-2021 Task 11: A Cascade of Neural Models for
Structuring Scholarly NLP Contributions [1.5942130010323128]
本稿では,文分類,文認識,三重抽出を行うニューラルネットワークのカスケードを提案する。
BERT-CRFモデルを用いて、コントリビューション文中の関連するフレーズを認識し、特徴付ける。
本システムは第1相評価では第2位,第2相評価では両部で第1位であった。
論文 参考訳(メタデータ) (2021-05-12T05:24:35Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - SciSummPip: An Unsupervised Scientific Paper Summarization Pipeline [39.46301416663324]
SummPipに触発されたテキスト要約システムSciSummPipについて述べる(Zhao et al., 2020)。
我々のSciSummPipには、文脈文表現のためのトランスフォーマーベースの言語モデルSciBERTが含まれている。
我々の研究は、コンテンツ選択と要約長制約が科学領域に適応するために適用されるという点において、以前の方法と異なる。
論文 参考訳(メタデータ) (2020-10-19T03:29:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。