論文の概要: CiteBench: A benchmark for Scientific Citation Text Generation
- arxiv url: http://arxiv.org/abs/2212.09577v2
- Date: Tue, 16 May 2023 12:29:55 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-17 19:18:22.042976
- Title: CiteBench: A benchmark for Scientific Citation Text Generation
- Title(参考訳): CiteBench:Scientific Citation Text Generationのベンチマーク
- Authors: Martin Funkquist, Ilia Kuznetsov, Yufang Hou and Iryna Gurevych
- Abstract要約: CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
- 参考スコア(独自算出の注目度): 60.38745330704945
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Science progresses by incrementally building upon the prior body of knowledge
documented in scientific publications. The acceleration of research across many
fields makes it hard to stay up-to-date with the recent developments and to
summarize the ever-growing body of prior work. To target this issue, the task
of citation text generation aims to produce accurate textual summaries given a
set of papers-to-cite and the citing paper context. Existing studies in
citation text generation are based upon widely diverging task definitions,
which makes it hard to study this task systematically. To address this
challenge, we propose CiteBench: a benchmark for citation text generation that
unifies multiple diverse datasets and enables standardized evaluation of
citation text generation models across task designs and domains. Using the new
benchmark, we investigate the performance of multiple strong baselines, test
their transferability between the datasets, and deliver new insights into the
task definition and evaluation to guide future research in citation text
generation. We make the code for CiteBench publicly available at
https://github.com/UKPLab/citebench.
- Abstract(参考訳): 科学は、科学出版物に記録された知識体系を段階的に構築することで進歩する。
多くの分野にまたがる研究の加速は、最近の進歩を最新に保ち、成長を続ける先行研究をまとめることが難しくなっている。
この課題を対象とするため,引用テキスト生成の課題は,論文と引用用紙コンテキストのセットを与えられた正確なテキスト要約を作成することにある。
引用テキスト生成における既存の研究は、広範囲にわたるタスク定義に基づいているため、このタスクを体系的に研究することは困難である。
そこで本研究では,複数の多様なデータセットを統一し,タスク設計とドメイン間での引用テキスト生成モデルの標準化評価を可能にする,引用テキスト生成ベンチマークであるcitebenchを提案する。
新しいベンチマークを用いて、複数の強いベースラインの性能を調査し、データセット間の転送可能性を確認し、タスク定義と評価に関する新たな洞察を提供し、引用テキスト生成における今後の研究を導く。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
関連論文リスト
- Verifiable Generation with Subsentence-Level Fine-Grained Citations [13.931548733211436]
検証可能な生成には、出力をサポートするソースドキュメントを引用するために、大きな言語モデルが必要である。
先行研究は主に文レベルの引用の生成を目標としており、引用された情報源によって文のどの部分が裏付けられているかの特異性が欠如している。
本研究は, サブ文レベルのきめ細かな引用による生成を検証し, 引用元が支持する生成コンテンツのより正確な位置について検討する。
論文 参考訳(メタデータ) (2024-06-10T09:32:37Z) - Contextualizing Generated Citation Texts [11.531517736126657]
本稿では,引用テキスト生成タスクの簡単な修正を提案する。
生成ターゲットは、引用そのものだけではなく、ターゲットの引用を含むコンテキストウィンドウ全体である。
論文 参考訳(メタデータ) (2024-02-28T05:24:21Z) - Retrieval is Accurate Generation [99.24267226311157]
本稿では,支援文書の集合からコンテキスト認識句を選択する新しい手法を提案する。
本モデルでは,検索対象のベースラインの中で,最高の性能と低レイテンシを実現する。
論文 参考訳(メタデータ) (2024-02-27T14:16:19Z) - A survey on text generation using generative adversarial networks [0.0]
本研究は, ジェネレーティブ・アドバイサル・ネットワークを用いた最近の研究とテキスト生成の進展について, 徹底的なレビューを行う。
テキスト生成における敵対的学習の使用は、いわゆる「自然な」言語を生成する代替手段を提供するので、有望である。
論文 参考訳(メタデータ) (2022-12-20T17:54:08Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - SciXGen: A Scientific Paper Dataset for Context-Aware Text Generation [27.064042116555925]
我々は、科学領域におけるtextbfcontext-aware テキスト生成という新しいタスクを提案する。
我々は、ContetextbfXt-Aware TextbfGeneration (SciXGen)のための新しい大規模テキストbfScientific Paperデータセットを提案する。
SciXGenデータセットが記述と段落の生成に有効であることを示す。
論文 参考訳(メタデータ) (2021-10-20T20:37:11Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。