論文の概要: Cited Text Spans for Citation Text Generation
- arxiv url: http://arxiv.org/abs/2309.06365v1
- Date: Tue, 12 Sep 2023 16:28:36 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-13 12:13:52.050179
- Title: Cited Text Spans for Citation Text Generation
- Title(参考訳): 引用テキスト生成のための引用テキストスパン
- Authors: Xiangci Li, Yi-Hui Lee, Jessica Ouyang
- Abstract要約: 要約が引用生成の最も適切な入力であるとは限らないことを実証する。
そこで本研究では,テキストスパン (CTS) の代替として,テキストスパン (CTS) を条件として提案する。
- 参考スコア(独自算出の注目度): 12.039469573641217
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Automatic related work generation must ground their outputs to the content of
the cited papers to avoid non-factual hallucinations, but due to the length of
scientific documents, existing abstractive approaches have conditioned only on
the cited paper \textit{abstracts}. We demonstrate that the abstract is not
always the most appropriate input for citation generation and that models
trained in this way learn to hallucinate. We propose to condition instead on
the \textit{cited text span} (CTS) as an alternative to the abstract. Because
manual CTS annotation is extremely time- and labor-intensive, we experiment
with automatic, ROUGE-based labeling of candidate CTS sentences, achieving
sufficiently strong performance to substitute for expensive human annotations,
and we propose a human-in-the-loop, keyword-based CTS retrieval approach that
makes generating citation texts grounded in the full text of cited papers both
promising and practical.
- Abstract(参考訳): 自動的な関連作業生成は、引用された論文の内容に基づいて、非事実的な幻覚を避ける必要があるが、科学的文書の長さのため、既存の抽象的アプローチは引用された論文にのみ条件付けされている。
我々は、抽象概念が引用生成の最も適切な入力であるとは限らないことを示し、この方法で訓練されたモデルは幻覚を学習する。
我々は、抽象文の代替として、代わりに \textit{cited text span} (CTS) を条件として提案する。
手動のctsアノテーションは非常に時間と労力がかかるため、候補のcts文の自動ラベリングを実験し、高価な人間のアノテーションの代わりに十分に強力な性能を実現し、引用された論文の全文に基礎を置く引用テキストを生成するためのキーワードベースのcts検索手法を提案する。
関連論文リスト
- HLM-Cite: Hybrid Language Model Workflow for Text-based Scientific Citation Prediction [14.731720495144112]
本稿では,表面的な言及を超越した批判的参照を識別する,コア引用という新しい概念を紹介する。
我々は、引用予測のための$textbfH$ybrid $textbfL$anguage $textbfM$odelワークフローである$textbfHLM-Citeを提案する。
我々はHLM-Citeを19分野にわたって評価し,SOTA法と比較して17.6%の性能向上を示した。
論文 参考訳(メタデータ) (2024-10-10T10:46:06Z) - Context-Enhanced Language Models for Generating Multi-Paper Citations [35.80247519023821]
本稿では,Large Language Models (LLMs) を用いて多文文を生成する手法を提案する。
提案手法は,複数文の引用文を含むコヒーレントな段落に終止符を打つ,単一のソース・ペーパーと対象論文の集合を包含する。
論文 参考訳(メタデータ) (2024-04-22T04:30:36Z) - Contextualizing Generated Citation Texts [11.531517736126657]
本稿では,引用テキスト生成タスクの簡単な修正を提案する。
生成ターゲットは、引用そのものだけではなく、ターゲットの引用を含むコンテキストウィンドウ全体である。
論文 参考訳(メタデータ) (2024-02-28T05:24:21Z) - SciLit: A Platform for Joint Scientific Literature Discovery,
Summarization and Citation Generation [11.186252009101077]
本稿では,関連論文を自動的に推薦し,ハイライトを抽出するパイプラインSciLitを提案し,論文の引用として参照文を提案する。
SciLitは、2段階の事前フェッチと再ランクの文献検索システムを使用して、数億の論文の大規模なデータベースから論文を効率的に推奨する。
論文 参考訳(メタデータ) (2023-06-06T09:34:45Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Tortured phrases: A dubious writing style emerging in science. Evidence
of critical issues affecting established journals [69.76097138157816]
確率的テキストジェネレータは10年以上にわたって偽の科学論文の作成に使われてきた。
複雑なAIを利用した生成技術は、人間のものと区別できないテキストを生成する。
一部のウェブサイトはテキストを無料で書き直し、拷問されたフレーズでいっぱいのgobbledegookを生成する。
論文 参考訳(メタデータ) (2021-07-12T20:47:08Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Semantic Analysis for Automated Evaluation of the Potential Impact of
Research Articles [62.997667081978825]
本稿では,情報理論に基づくテキスト意味のベクトル表現のための新しい手法を提案する。
この情報意味論がLeicester Scientific Corpusに基づいてテキスト分類にどのように使用されるかを示す。
テキストの意味を表現するための情報的アプローチは,研究論文の科学的影響を効果的に予測する方法であることを示す。
論文 参考訳(メタデータ) (2021-04-26T20:37:13Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。