論文の概要: Sentence, Phrase, and Triple Annotations to Build a Knowledge Graph of
Natural Language Processing Contributions -- A Trial Dataset
- arxiv url: http://arxiv.org/abs/2010.04388v3
- Date: Fri, 7 May 2021 06:08:59 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 06:18:56.360510
- Title: Sentence, Phrase, and Triple Annotations to Build a Knowledge Graph of
Natural Language Processing Contributions -- A Trial Dataset
- Title(参考訳): 自然言語処理貢献のナレッジグラフを構築するための文、句、三重アノテーション -- 試用データセット
- Authors: Jennifer D'Souza, S\"oren Auer
- Abstract要約: 本研究の目的は,NLPコントリビューションスキームを正規化して,論文文から直接,自然言語処理(NLP)学術論文のコントリビューション情報を構築することである。
50の論文にNLPCONTRIBUTIONGRAPHを適用した結果、最終的に900のコントリビューション中心の文、4,702のコントリビューション情報中心のフレーズ、2,980の表層構造を持つ3つ組のデータセットが得られた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Purpose: The aim of this work is to normalize the NLPCONTRIBUTIONS scheme
(henceforward, NLPCONTRIBUTIONGRAPH) to structure, directly from article
sentences, the contributions information in Natural Language Processing (NLP)
scholarly articles via a two-stage annotation methodology: 1) pilot stage - to
define the scheme (described in prior work); and 2) adjudication stage - to
normalize the graphing model (the focus of this paper).
Design/methodology/approach: We re-annotate, a second time, the
contributions-pertinent information across 50 prior-annotated NLP scholarly
articles in terms of a data pipeline comprising: contribution-centered
sentences, phrases, and triple statements. To this end, specifically, care was
taken in the adjudication annotation stage to reduce annotation noise while
formulating the guidelines for our proposed novel NLP contributions structuring
and graphing scheme.
Findings: The application of NLPCONTRIBUTIONGRAPH on the 50 articles resulted
finally in a dataset of 900 contribution-focused sentences, 4,702
contribution-information-centered phrases, and 2,980 surface-structured
triples. The intra-annotation agreement between the first and second stages, in
terms of F1, was 67.92% for sentences, 41.82% for phrases, and 22.31% for
triple statements indicating that with increased granularity of the
information, the annotation decision variance is greater.
Practical Implications: We demonstrate NLPCONTRIBUTIONGRAPH data integrated
into the Open Research Knowledge Graph (ORKG), a next-generation KG-based
digital library with intelligent computations enabled over structured scholarly
knowledge, as a viable aid to assist researchers in their day-to-day tasks.
- Abstract(参考訳): 目的:本研究の目的は,NLPCONTRIBUTIONSスキーム(以下,NLPCONTRIBUTIONGRAPH)を標準化して,論文文から直接,自然言語処理(NLP)の学術論文への貢献情報を2段階の方法論で構造化することである。
1) パイロット段階 - 計画(先行作業に記載されている)を定義するための
2) 判断段階(adjudication stage) - グラフ化モデルを正規化する(本稿の焦点)。
設計/方法論/アプローチ: 第二に、コントリビューション中心の文、フレーズ、三重文からなるデータパイプラインという、50の事前アノテーション付きNLPの学術論文にまたがるコントリビューション関連情報を再注釈します。
この目的のために,提案したNLPコントリビューションの構造化とグラフ化手法のガイドラインを定式化しながら,アノテーションノイズを低減するために,適応アノテーション段階の注意を要した。
結論: nlpcontributiongraphを50記事に適用した結果,最終的に900文,4,702文の投稿情報中心文,2,980の表層構造三重項のデータセットが得られた。
第1段と第2段の間の注記契約は、文の67.92%、句の41.82%、情報の粒度が増すにつれて、アノテーション決定のばらつきが大きくなることを示す3つの文の22.31%であった。
実践的意味: NLPCONTRIBUTIONGRAPH データを Open Research Knowledge Graph (ORKG) に統合した次世代のKGベースのデジタルライブラリで、構造化された学術的知識を通じてインテリジェントな計算を可能にする。
関連論文リスト
- Text-Augmented Open Knowledge Graph Completion via Pre-Trained Language
Models [53.09723678623779]
本稿では,高品質なクエリプロンプトを自動的に生成し,大規模テキストコーパスからサポート情報を取得するためのTAGREALを提案する。
その結果、TAGREALは2つのベンチマークデータセット上で最先端のパフォーマンスを達成することがわかった。
TAGREALは、限られたトレーニングデータであっても、既存の埋め込みベース、グラフベース、およびPLMベースの手法よりも優れた性能を有することが判明した。
論文 参考訳(メタデータ) (2023-05-24T22:09:35Z) - Distant finetuning with discourse relations for stance classification [55.131676584455306]
そこで本研究では,定位分類のモデルとして,原文から銀ラベルでデータを抽出し,微調整する手法を提案する。
また,様々な段階において微調整に用いるデータのノイズレベルが減少する3段階のトレーニングフレームワークを提案する。
NLPCC 2021共有タスクArgumentative Text Understanding for AI Debaterでは,26の競合チームの中で1位にランクインした。
論文 参考訳(メタデータ) (2022-04-27T04:24:35Z) - An Open Natural Language Processing Development Framework for EHR-based
Clinical Research: A case demonstration using the National COVID Cohort
Collaborative (N3C) [29.701601520785033]
我々は、N3C(National COVID Cohort Collaborative)のためのNLPアルゴリズムの実装を通じて、オープンな自然言語処理開発フレームワークを提案し、評価する。
本研究は,(1)新型コロナウイルスの症状と症状を用いたオープンなデータアノテーションプロセス,2)コミュニティ主導のルールセット作成プラットフォーム,3)人体を介さずに情報抽出タスクのテキストを生成するための合成テキストデータ生成ワークフロー,である。
論文 参考訳(メタデータ) (2021-10-20T21:09:41Z) - SemEval-2021 Task 11: NLPContributionGraph -- Structuring Scholarly NLP
Contributions for a Research Knowledge Graph [0.17188280334580192]
SemEval-2021 Shared Task NLPContributionGraph (別名「NCGタスク」)は、NLPの学術論文からの貢献を構造化する自動システムの開発に参加する。
SemEvalシリーズの第一種であるこのタスクは、NLPの学術論文から構造化されたデータを3レベルの情報粒度でリリースした。
ベストエンド・ツー・エンドのタスク・システムは、貢献の文章を57.27% F1、フレーズを46.41% F1、トリプルを22.28% F1と分類した。
論文 参考訳(メタデータ) (2021-06-10T13:43:47Z) - Annotation Curricula to Implicitly Train Non-Expert Annotators [56.67768938052715]
自発的な研究は、しばしば、アノテータがタスク、そのアノテーションスキーム、およびデータドメインに精通することを要求する。
これは最初は圧倒的であり、精神的に課税され、結果として生じるアノテーションにエラーを誘導する。
暗黙的にアノテータを訓練する新しい手法であるアノテーションキュリキュラを提案する。
論文 参考訳(メタデータ) (2021-06-04T09:48:28Z) - KnowGraph@IITK at SemEval-2021 Task 11: Building KnowledgeGraph for NLP
Research [2.1012672709024294]
自然言語処理文献を用いた研究論文貢献型知識グラフ作成システムを開発する。
提案システムは対象領域に依存せず,任意の領域の知識グラフ構築に利用することができる。
終末パイプラインテスト,句抽出テスト,三重項抽出テストでは,F1スコアが0.38,0.63,0.76となった。
論文 参考訳(メタデータ) (2021-04-04T14:33:21Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Investigating Pretrained Language Models for Graph-to-Text Generation [55.55151069694146]
Graph-to-text生成は、グラフベースのデータから流動的なテキストを生成することを目的としている。
本稿では,3つのグラフ領域,つまり表現,ウィキペディア知識グラフ(KG),科学的なKGについて検討する。
我々は, PLM の BART と T5 が新たな最先端の成果を達成し, タスク適応型事前学習戦略が性能をさらに向上することを示す。
論文 参考訳(メタデータ) (2020-07-16T16:05:34Z) - NLPContributions: An Annotation Scheme for Machine Reading of Scholarly
Contributions in Natural Language Processing Literature [0.0]
本稿では,自然言語処理(NLP)論文の学術的貢献を捉えるためのアノテーションイニシアチブについて述べる。
我々は,5つの情報抽出タスクへのコントリビューションを提示する50のNLP-ML学術論文に対するパイロット演習に基づくアノテーションタスクを開発する。
我々は,NLPコントリビューションの方法論が,そのさらなる洗練と発展に向けて,このトピックについてより広範な議論を巻き起こすことを想定する。
論文 参考訳(メタデータ) (2020-06-23T10:04:39Z) - Structure-Augmented Text Representation Learning for Efficient Knowledge
Graph Completion [53.31911669146451]
人為的な知識グラフは、様々な自然言語処理タスクに重要な支援情報を提供する。
これらのグラフは通常不完全であり、自動補完を促す。
グラフ埋め込みアプローチ(例えばTransE)は、グラフ要素を密度の高い埋め込みに表現することで構造化された知識を学ぶ。
テキストエンコーディングアプローチ(KG-BERTなど)は、グラフトリプルのテキストとトリプルレベルの文脈化表現を利用する。
論文 参考訳(メタデータ) (2020-04-30T13:50:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。