論文の概要: SemEval-2021 Task 11: NLPContributionGraph -- Structuring Scholarly NLP
Contributions for a Research Knowledge Graph
- arxiv url: http://arxiv.org/abs/2106.07385v1
- Date: Thu, 10 Jun 2021 13:43:47 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-20 05:49:37.241010
- Title: SemEval-2021 Task 11: NLPContributionGraph -- Structuring Scholarly NLP
Contributions for a Research Knowledge Graph
- Title(参考訳): SemEval-2021 Task 11: NLP ContributionGraph -- 研究知識グラフのためのScholarly NLP Contributionsの構築
- Authors: Jennifer D'Souza, S\"oren Auer and Ted Pedersen
- Abstract要約: SemEval-2021 Shared Task NLPContributionGraph (別名「NCGタスク」)は、NLPの学術論文からの貢献を構造化する自動システムの開発に参加する。
SemEvalシリーズの第一種であるこのタスクは、NLPの学術論文から構造化されたデータを3レベルの情報粒度でリリースした。
ベストエンド・ツー・エンドのタスク・システムは、貢献の文章を57.27% F1、フレーズを46.41% F1、トリプルを22.28% F1と分類した。
- 参考スコア(独自算出の注目度): 0.17188280334580192
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: There is currently a gap between the natural language expression of scholarly
publications and their structured semantic content modeling to enable
intelligent content search. With the volume of research growing exponentially
every year, a search feature operating over semantically structured content is
compelling. The SemEval-2021 Shared Task NLPContributionGraph (a.k.a. 'the NCG
task') tasks participants to develop automated systems that structure
contributions from NLP scholarly articles in the English language. Being the
first-of-its-kind in the SemEval series, the task released structured data from
NLP scholarly articles at three levels of information granularity, i.e. at
sentence-level, phrase-level, and phrases organized as triples toward Knowledge
Graph (KG) building. The sentence-level annotations comprised the few sentences
about the article's contribution. The phrase-level annotations were scientific
term and predicate phrases from the contribution sentences. Finally, the
triples constituted the research overview KG. For the Shared Task,
participating systems were then expected to automatically classify contribution
sentences, extract scientific terms and relations from the sentences, and
organize them as KG triples.
Overall, the task drew a strong participation demographic of seven teams and
27 participants. The best end-to-end task system classified contribution
sentences at 57.27% F1, phrases at 46.41% F1, and triples at 22.28% F1. While
the absolute performance to generate triples remains low, in the conclusion of
this article, the difficulty of producing such data and as a consequence of
modeling it is highlighted.
- Abstract(参考訳): 現在、学術出版物の自然言語表現と、知的コンテンツ検索を可能にする構造化意味コンテンツモデリングとの間にはギャップがある。
研究の量は毎年急増しており、セマンティックに構造化されたコンテンツを検索する機能は魅力的だ。
SemEval-2021 Shared Task NLPContributionGraph (別名)
英語のNLP学術論文からの貢献を構造化する自動システム開発に参加者が参加する「NCGタスク」)。
SemEvalシリーズの第一種であるこのタスクは、NLPの学術論文から構造化されたデータを3レベルの情報粒度でリリースした。
文レベル、フレーズレベル、フレーズが、知識グラフ(KG)構築のためのトリプルとして整理される。
文章レベルの注釈は、記事の貢献に関する数少ない文章で構成されていた。
句レベルの注釈は科学的用語であり、貢献文からの述語である。
最後に、トリプルは研究概要kgを構成する。
共有タスクでは,投稿文を自動的に分類し,科学用語と関係を抽出し,kgトリプルとして整理することが期待された。
全体では7チーム、27人の参加者が参加している。
ベストエンド・ツー・エンドのタスク・システムは57.27% F1、フレーズ46.41% F1、トリプル22.28% F1を分類した。
三重項を生成する絶対性能は依然として低いが、本稿の結論として、そのようなデータを生成するのが困難であり、モデリングの結果が強調される。
関連論文リスト
- Unsupervised Chunking with Hierarchical RNN [62.15060807493364]
本稿では,非階層的手法で単語をグループ化する構文的タスクであるチャンキングに対する教師なしアプローチを紹介する。
本稿では,単語-チャンク・チャンク-文合成をモデル化した2層階層型階層型リカレントニューラルネットワーク(HRNN)を提案する。
CoNLL-2000データセットの実験では、既存の教師なし手法よりも顕著な改善が見られ、フレーズF1スコアが最大6ポイント向上した。
論文 参考訳(メタデータ) (2023-09-10T02:55:12Z) - Mapping Process for the Task: Wikidata Statements to Text as Wikipedia
Sentences [68.8204255655161]
本稿では,ウィキデータ文をウィキペディアのプロジェクト用自然言語テキスト(WS2T)に変換するタスクに対して,文レベルでのマッピングプロセスを提案する。
主なステップは、文を整理し、四つ組と三つ組のグループとして表現し、それらを英語のウィキペディアで対応する文にマッピングすることである。
文構造解析,ノイズフィルタリング,および単語埋め込みモデルに基づく文成分間の関係について,出力コーパスの評価を行った。
論文 参考訳(メタデータ) (2022-10-23T08:34:33Z) - CometKiwi: IST-Unbabel 2022 Submission for the Quality Estimation Shared
Task [11.716878242203267]
WMT2022におけるISTとUnbabelの協力による品質評価の共有タスク(QE)について述べる。
研究チームは3つのサブタスク(i)文と単語レベルの品質予測,(ii)説明可能なQE,(iii)クリティカルエラー検出)に参加した。
論文 参考訳(メタデータ) (2022-09-13T18:05:12Z) - O-Dang! The Ontology of Dangerous Speech Messages [53.15616413153125]
O-Dang!:The Ontology of Dangerous Speech Messages, a systematic and interoperable Knowledge Graph (KG)
O-Dang!は、Lingguistic Linked Open Dataコミュニティで共有されている原則に従って、イタリアのデータセットを構造化されたKGにまとめ、整理するように設計されている。
ゴールド・スタンダードとシングル・アノテータのラベルをKGにエンコードするモデルを提供する。
論文 参考訳(メタデータ) (2022-07-13T11:50:05Z) - UPB at SemEval-2021 Task 1: Combining Deep Learning and Hand-Crafted
Features for Lexical Complexity Prediction [0.7197592390105455]
本稿では,SemEval-2021 Task 1: Lexical Complexity Prediction competitionについて述べる。
私たちの結果は、第1および第2サブタスクの競争で得られたトップスコアよりもわずか5.46%と6.5%低いです。
論文 参考訳(メタデータ) (2021-04-14T17:05:46Z) - KnowGraph@IITK at SemEval-2021 Task 11: Building KnowledgeGraph for NLP
Research [2.1012672709024294]
自然言語処理文献を用いた研究論文貢献型知識グラフ作成システムを開発する。
提案システムは対象領域に依存せず,任意の領域の知識グラフ構築に利用することができる。
終末パイプラインテスト,句抽出テスト,三重項抽出テストでは,F1スコアが0.38,0.63,0.76となった。
論文 参考訳(メタデータ) (2021-04-04T14:33:21Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Sentence, Phrase, and Triple Annotations to Build a Knowledge Graph of
Natural Language Processing Contributions -- A Trial Dataset [0.0]
本研究の目的は,NLPコントリビューションスキームを正規化して,論文文から直接,自然言語処理(NLP)学術論文のコントリビューション情報を構築することである。
50の論文にNLPCONTRIBUTIONGRAPHを適用した結果、最終的に900のコントリビューション中心の文、4,702のコントリビューション情報中心のフレーズ、2,980の表層構造を持つ3つ組のデータセットが得られた。
論文 参考訳(メタデータ) (2020-10-09T06:45:35Z) - NLPContributions: An Annotation Scheme for Machine Reading of Scholarly
Contributions in Natural Language Processing Literature [0.0]
本稿では,自然言語処理(NLP)論文の学術的貢献を捉えるためのアノテーションイニシアチブについて述べる。
我々は,5つの情報抽出タスクへのコントリビューションを提示する50のNLP-ML学術論文に対するパイロット演習に基づくアノテーションタスクを開発する。
我々は,NLPコントリビューションの方法論が,そのさらなる洗練と発展に向けて,このトピックについてより広範な議論を巻き起こすことを想定する。
論文 参考訳(メタデータ) (2020-06-23T10:04:39Z) - RUSSE'2020: Findings of the First Taxonomy Enrichment Task for the
Russian language [70.27072729280528]
本稿では,ロシア語の分類学的豊か化に関する最初の共有課題の結果について述べる。
16チームがこのタスクに参加し、半数以上が提供されたベースラインを上回った。
論文 参考訳(メタデータ) (2020-05-22T13:30:37Z) - Structure-Augmented Text Representation Learning for Efficient Knowledge
Graph Completion [53.31911669146451]
人為的な知識グラフは、様々な自然言語処理タスクに重要な支援情報を提供する。
これらのグラフは通常不完全であり、自動補完を促す。
グラフ埋め込みアプローチ(例えばTransE)は、グラフ要素を密度の高い埋め込みに表現することで構造化された知識を学ぶ。
テキストエンコーディングアプローチ(KG-BERTなど)は、グラフトリプルのテキストとトリプルレベルの文脈化表現を利用する。
論文 参考訳(メタデータ) (2020-04-30T13:50:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。