論文の概要: CiteBench: A benchmark for Scientific Citation Text Generation
- arxiv url: http://arxiv.org/abs/2212.09577v1
- Date: Mon, 19 Dec 2022 16:10:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-20 16:47:28.815042
- Title: CiteBench: A benchmark for Scientific Citation Text Generation
- Title(参考訳): CiteBench:Scientific Citation Text Generationのベンチマーク
- Authors: Martin Funkquist, Ilia Kuznetsov, Yufang Hou and Iryna Gurevych
- Abstract要約: 本稿では,引用テキスト生成の問題について検討し,引用論文の集合と引用コンテキストが与えられた場合,そのモデルが引用テキストを生成するべきであることを示す。
引用テキスト生成は従来から行われているが、既存の研究ではデータセットやタスク定義が異なる。
提案するCiteBenchは,従来のデータセットを統一し,引用テキスト生成モデルの標準化評価を可能にする,引用テキスト生成のベンチマークである。
- 参考スコア(独自算出の注目度): 60.38745330704945
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The publication rates are skyrocketing across many fields of science, and it
is difficult to stay up to date with the latest research. This makes
automatically summarizing the latest findings and helping scholars to
synthesize related work in a given area an attractive research objective. In
this paper we study the problem of citation text generation, where given a set
of cited papers and citing context the model should generate a citation text.
While citation text generation has been tackled in prior work, existing studies
use different datasets and task definitions, which makes it hard to study
citation text generation systematically. To address this, we propose CiteBench:
a benchmark for citation text generation that unifies the previous datasets and
enables standardized evaluation of citation text generation models across task
settings and domains. Using the new benchmark, we investigate the performance
of multiple strong baselines, test their transferability between the datasets,
and deliver new insights into task definition and evaluation to guide the
future research in citation text generation. We make CiteBench publicly
available at https://github.com/UKPLab/citebench.
- Abstract(参考訳): 出版率は多くの科学分野にまたがって急上昇しており、最新の研究に追随することは困難である。
これにより、最新の発見を自動的に要約し、研究者が特定の領域における関連する研究を魅力的な研究目的として合成する手助けをする。
本稿では,引用テキスト生成の問題について検討し,引用された論文の集合と引用された文脈が引用テキストを生成する。
引用テキスト生成は従来から行われているが、既存の研究ではデータセットやタスク定義が異なるため、引用テキスト生成を体系的に研究することは困難である。
そこで本稿では,これまでのデータセットを統一し,タスク設定とドメイン間での引用テキスト生成モデルの標準化評価を可能にする,引用テキスト生成ベンチマークであるcitebenchを提案する。
新しいベンチマークを用いて、複数の強いベースラインの性能を調査し、データセット間の転送可能性を確認し、タスク定義と評価に関する新たな洞察を提供し、引用テキスト生成における今後の研究を導く。
CiteBenchをhttps://github.com/UKPLab/citebench.comで公開しています。
関連論文リスト
- Verifiable Generation with Subsentence-Level Fine-Grained Citations [13.931548733211436]
検証可能な生成には、出力をサポートするソースドキュメントを引用するために、大きな言語モデルが必要である。
先行研究は主に文レベルの引用の生成を目標としており、引用された情報源によって文のどの部分が裏付けられているかの特異性が欠如している。
本研究は, サブ文レベルのきめ細かな引用による生成を検証し, 引用元が支持する生成コンテンツのより正確な位置について検討する。
論文 参考訳(メタデータ) (2024-06-10T09:32:37Z) - Contextualizing Generated Citation Texts [11.531517736126657]
本稿では,引用テキスト生成タスクの簡単な修正を提案する。
生成ターゲットは、引用そのものだけではなく、ターゲットの引用を含むコンテキストウィンドウ全体である。
論文 参考訳(メタデータ) (2024-02-28T05:24:21Z) - Retrieval is Accurate Generation [99.24267226311157]
本稿では,支援文書の集合からコンテキスト認識句を選択する新しい手法を提案する。
本モデルでは,検索対象のベースラインの中で,最高の性能と低レイテンシを実現する。
論文 参考訳(メタデータ) (2024-02-27T14:16:19Z) - A survey on text generation using generative adversarial networks [0.0]
本研究は, ジェネレーティブ・アドバイサル・ネットワークを用いた最近の研究とテキスト生成の進展について, 徹底的なレビューを行う。
テキスト生成における敵対的学習の使用は、いわゆる「自然な」言語を生成する代替手段を提供するので、有望である。
論文 参考訳(メタデータ) (2022-12-20T17:54:08Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - SciXGen: A Scientific Paper Dataset for Context-Aware Text Generation [27.064042116555925]
我々は、科学領域におけるtextbfcontext-aware テキスト生成という新しいタスクを提案する。
我々は、ContetextbfXt-Aware TextbfGeneration (SciXGen)のための新しい大規模テキストbfScientific Paperデータセットを提案する。
SciXGenデータセットが記述と段落の生成に有効であることを示す。
論文 参考訳(メタデータ) (2021-10-20T20:37:11Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。