論文の概要: CiteBench: A benchmark for Scientific Citation Text Generation
- arxiv url: http://arxiv.org/abs/2212.09577v3
- Date: Fri, 3 Nov 2023 19:55:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-11-08 01:16:14.028165
- Title: CiteBench: A benchmark for Scientific Citation Text Generation
- Title(参考訳): CiteBench:Scientific Citation Text Generationのベンチマーク
- Authors: Martin Funkquist, Ilia Kuznetsov, Yufang Hou and Iryna Gurevych
- Abstract要約: CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
- 参考スコア(独自算出の注目度): 69.37571393032026
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Science progresses by building upon the prior body of knowledge documented in
scientific publications. The acceleration of research makes it hard to stay
up-to-date with the recent developments and to summarize the ever-growing body
of prior work. To address this, the task of citation text generation aims to
produce accurate textual summaries given a set of papers-to-cite and the citing
paper context. Due to otherwise rare explicit anchoring of cited documents in
the citing paper, citation text generation provides an excellent opportunity to
study how humans aggregate and synthesize textual knowledge from sources. Yet,
existing studies are based upon widely diverging task definitions, which makes
it hard to study this task systematically. To address this challenge, we
propose CiteBench: a benchmark for citation text generation that unifies
multiple diverse datasets and enables standardized evaluation of citation text
generation models across task designs and domains. Using the new benchmark, we
investigate the performance of multiple strong baselines, test their
transferability between the datasets, and deliver new insights into the task
definition and evaluation to guide future research in citation text generation.
We make the code for CiteBench publicly available at
https://github.com/UKPLab/citebench.
- Abstract(参考訳): 科学は、科学出版物に記録された知識の先行体の上に構築することで進歩する。
研究の加速は、最近の発展に最新を保ち、成長を続ける先行作業の体をまとめるのを困難にしている。
これを解決するために、引用テキスト生成のタスクは、引用紙の集合と引用紙のコンテキストとが与えられた正確なテキスト要約を作成することを目的としている。
引用論文における引用文書の明示的なアンカー化により、引用テキスト生成は、人間がいかにして情報源からテキスト知識を集約して合成するかを研究する素晴らしい機会となる。
しかし、既存の研究は広範囲にわたるタスク定義に基づいているため、このタスクを体系的に研究することは困難である。
そこで本研究では,複数の多様なデータセットを統一し,タスク設計とドメイン間での引用テキスト生成モデルの標準化評価を可能にする,引用テキスト生成ベンチマークであるcitebenchを提案する。
新しいベンチマークを用いて、複数の強いベースラインの性能を調査し、データセット間の転送可能性を確認し、タスク定義と評価に関する新たな洞察を提供し、引用テキスト生成における今後の研究を導く。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
関連論文リスト
- Verifiable Generation with Subsentence-Level Fine-Grained Citations [13.931548733211436]
検証可能な生成には、出力をサポートするソースドキュメントを引用するために、大きな言語モデルが必要である。
先行研究は主に文レベルの引用の生成を目標としており、引用された情報源によって文のどの部分が裏付けられているかの特異性が欠如している。
本研究は, サブ文レベルのきめ細かな引用による生成を検証し, 引用元が支持する生成コンテンツのより正確な位置について検討する。
論文 参考訳(メタデータ) (2024-06-10T09:32:37Z) - Contextualizing Generated Citation Texts [11.531517736126657]
本稿では,引用テキスト生成タスクの簡単な修正を提案する。
生成ターゲットは、引用そのものだけではなく、ターゲットの引用を含むコンテキストウィンドウ全体である。
論文 参考訳(メタデータ) (2024-02-28T05:24:21Z) - Retrieval is Accurate Generation [99.24267226311157]
本稿では,支援文書の集合からコンテキスト認識句を選択する新しい手法を提案する。
本モデルでは,検索対象のベースラインの中で,最高の性能と低レイテンシを実現する。
論文 参考訳(メタデータ) (2024-02-27T14:16:19Z) - A survey on text generation using generative adversarial networks [0.0]
本研究は, ジェネレーティブ・アドバイサル・ネットワークを用いた最近の研究とテキスト生成の進展について, 徹底的なレビューを行う。
テキスト生成における敵対的学習の使用は、いわゆる「自然な」言語を生成する代替手段を提供するので、有望である。
論文 参考訳(メタデータ) (2022-12-20T17:54:08Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - SciXGen: A Scientific Paper Dataset for Context-Aware Text Generation [27.064042116555925]
我々は、科学領域におけるtextbfcontext-aware テキスト生成という新しいタスクを提案する。
我々は、ContetextbfXt-Aware TextbfGeneration (SciXGen)のための新しい大規模テキストbfScientific Paperデータセットを提案する。
SciXGenデータセットが記述と段落の生成に有効であることを示す。
論文 参考訳(メタデータ) (2021-10-20T20:37:11Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。