論文の概要: Cited Text Spans for Citation Text Generation
- arxiv url: http://arxiv.org/abs/2309.06365v2
- Date: Tue, 20 Feb 2024 23:31:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-02-22 20:27:32.423170
- Title: Cited Text Spans for Citation Text Generation
- Title(参考訳): 引用テキスト生成のための引用テキストスパン
- Authors: Xiangci Li, Yi-Hui Lee, Jessica Ouyang
- Abstract要約: 自動引用生成システムは,2つの論文間の関係を簡潔かつ正確に記述することを目的としている。
科学的文書の長さのため、既存の抽象的アプローチは引用された論文の要約にのみ条件づけられている。
本稿では,抽象文の代替として,引用テキストスパン(CTS)を条件にすることを提案する。
- 参考スコア(独自算出の注目度): 12.039469573641217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: An automatic citation generation system aims to concisely and accurately
describe the relationship between two scientific articles. To do so, such a
system must ground its outputs to the content of the cited paper to avoid
non-factual hallucinations. Due to the length of scientific documents, existing
abstractive approaches have conditioned only on cited paper abstracts. We
demonstrate empirically that the abstract is not always the most appropriate
input for citation generation and that models trained in this way learn to
hallucinate. We propose to condition instead on the cited text span (CTS) as an
alternative to the abstract. Because manual CTS annotation is extremely time-
and labor-intensive, we experiment with distant labeling of candidate CTS
sentences, achieving sufficiently strong performance to substitute for
expensive human annotations in model training, and we propose a
human-in-the-loop, keyword-based CTS retrieval approach that makes generating
citation texts grounded in the full text of cited papers both promising and
practical.
- Abstract(参考訳): 自動引用生成システムは、2つの科学論文の関係を簡潔かつ正確に記述することを目的としている。
そのためには、非事実幻覚を避けるために、引用された論文の内容に出力をあてはめなければならない。
科学的文書の長さのため、既存の抽象的アプローチは引用された論文の要約にのみ条件づけられている。
我々は、抽象概念が引用生成の最も適切な入力であるとは限らないことを実証的に示し、この方法で訓練されたモデルは幻覚を学ぶ。
我々は、抽象文の代わりに引用テキストスパン(CTS)を条件にすることを提案する。
手動CTSアノテーションは非常に時間と労力がかかるので、モデルトレーニングにおいて高価な人間のアノテーションに代えて十分な性能を発揮でき、提案手法では、提案する論文の全文に引用文を生成するための、ループ内キーワードベースのCTS検索手法を提案する。
関連論文リスト
- HLM-Cite: Hybrid Language Model Workflow for Text-based Scientific Citation Prediction [14.731720495144112]
本稿では,表面的な言及を超越した批判的参照を識別する,コア引用という新しい概念を紹介する。
我々は、引用予測のための$textbfH$ybrid $textbfL$anguage $textbfM$odelワークフローである$textbfHLM-Citeを提案する。
我々はHLM-Citeを19分野にわたって評価し,SOTA法と比較して17.6%の性能向上を示した。
論文 参考訳(メタデータ) (2024-10-10T10:46:06Z) - Context-Enhanced Language Models for Generating Multi-Paper Citations [35.80247519023821]
本稿では,Large Language Models (LLMs) を用いて多文文を生成する手法を提案する。
提案手法は,複数文の引用文を含むコヒーレントな段落に終止符を打つ,単一のソース・ペーパーと対象論文の集合を包含する。
論文 参考訳(メタデータ) (2024-04-22T04:30:36Z) - Contextualizing Generated Citation Texts [11.531517736126657]
本稿では,引用テキスト生成タスクの簡単な修正を提案する。
生成ターゲットは、引用そのものだけではなく、ターゲットの引用を含むコンテキストウィンドウ全体である。
論文 参考訳(メタデータ) (2024-02-28T05:24:21Z) - SciLit: A Platform for Joint Scientific Literature Discovery,
Summarization and Citation Generation [11.186252009101077]
本稿では,関連論文を自動的に推薦し,ハイライトを抽出するパイプラインSciLitを提案し,論文の引用として参照文を提案する。
SciLitは、2段階の事前フェッチと再ランクの文献検索システムを使用して、数億の論文の大規模なデータベースから論文を効率的に推奨する。
論文 参考訳(メタデータ) (2023-06-06T09:34:45Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Tortured phrases: A dubious writing style emerging in science. Evidence
of critical issues affecting established journals [69.76097138157816]
確率的テキストジェネレータは10年以上にわたって偽の科学論文の作成に使われてきた。
複雑なAIを利用した生成技術は、人間のものと区別できないテキストを生成する。
一部のウェブサイトはテキストを無料で書き直し、拷問されたフレーズでいっぱいのgobbledegookを生成する。
論文 参考訳(メタデータ) (2021-07-12T20:47:08Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。