論文の概要: What's New? Summarizing Contributions in Scientific Literature
- arxiv url: http://arxiv.org/abs/2011.03161v2
- Date: Mon, 9 Nov 2020 16:16:45 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 04:50:17.558037
- Title: What's New? Summarizing Contributions in Scientific Literature
- Title(参考訳): 何が新しいの?
科学文献における貢献の要約
- Authors: Hiroaki Hayashi, Wojciech Kry\'sci\'nski, Bryan McCann, Nazneen
Rajani, Caiming Xiong
- Abstract要約: 本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
- 参考スコア(独自算出の注目度): 85.95906677964815
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With thousands of academic articles shared on a daily basis, it has become
increasingly difficult to keep up with the latest scientific findings. To
overcome this problem, we introduce a new task of disentangled paper
summarization, which seeks to generate separate summaries for the paper
contributions and the context of the work, making it easier to identify the key
findings shared in articles. For this purpose, we extend the S2ORC corpus of
academic articles, which spans a diverse set of domains ranging from economics
to psychology, by adding disentangled "contribution" and "context" reference
labels. Together with the dataset, we introduce and analyze three baseline
approaches: 1) a unified model controlled by input code prefixes, 2) a model
with separate generation heads specialized in generating the disentangled
outputs, and 3) a training strategy that guides the model using additional
supervision coming from inbound and outbound citations. We also propose a
comprehensive automatic evaluation protocol which reports the relevance,
novelty, and disentanglement of generated outputs. Through a human study
involving expert annotators, we show that in 79%, of cases our new task is
considered more helpful than traditional scientific paper summarization.
- Abstract(参考訳): 何千もの学術論文が毎日共有されているため、最新の科学的発見に追随することはますます困難になっている。
この課題を克服するために,論文の投稿と作業の文脈について個別の要約を生成し,論文で共有される重要な知見の識別を容易にするために,論文要約を分割するタスクを新たに導入する。
この目的のために、経済学から心理学まで幅広い分野にまたがる学術論文のs2orcコーパスを拡張し、異質な「帰属」と「文脈」の参照ラベルを追加する。
データセットとともに、3つのベースラインアプローチを導入し分析する。
1) 入力コードプレフィックスによって制御される統一モデル
2 異種出力の生成に特化した別個の生成ヘッドを有するモデル、及び
3)インバウンドおよびアウトバウンドの引用から来る追加の監督を用いてモデルを指導するトレーニング戦略。
また,生成された出力の関連性,新規性,乱れを報告する総合的な自動評価プロトコルを提案する。
専門家による人間による研究により、79%のケースにおいて、新しいタスクは従来の科学論文の要約よりも有用であると考えられた。
関連論文リスト
- P^3SUM: Preserving Author's Perspective in News Summarization with Diffusion Language Models [57.571395694391654]
既存のアプローチは、要約の50%以上で、ニュース記事の政治的意見やスタンスを変えている。
政治的視点分類器によって制御される拡散モデルに基づく要約手法であるP3SUMを提案する。
3つのニュース要約データセットの実験により、P3SUMは最先端の要約システムより優れていることが示された。
論文 参考訳(メタデータ) (2023-11-16T10:14:28Z) - NLPeer: A Unified Resource for the Computational Study of Peer Review [58.71736531356398]
NLPeer - 5万以上の論文と5つの異なる会場からの1万1千件のレビューレポートからなる、初めて倫理的にソースされたマルチドメインコーパス。
従来のピアレビューデータセットを拡張し、解析および構造化された論文表現、豊富なメタデータ、バージョニング情報を含む。
我々の研究は、NLPなどにおけるピアレビューの体系的、多面的、エビデンスに基づく研究への道のりをたどっている。
論文 参考訳(メタデータ) (2022-11-12T12:29:38Z) - Target-aware Abstractive Related Work Generation with Contrastive
Learning [48.02845973891943]
関連作業部は学術論文の重要な構成要素であり、参考論文の文脈における対象論文の貢献を強調している。
既存の作業部生成手法の多くは、既成の文章を抽出することに依存している。
本稿では,新たな文からなる関連作業区間を生成できる抽象的目標認識関連作業生成装置(TAG)を提案する。
論文 参考訳(メタデータ) (2022-05-26T13:20:51Z) - Revise and Resubmit: An Intertextual Model of Text-based Collaboration
in Peer Review [52.359007622096684]
ピアレビューは、ほとんどの科学分野における出版プロセスの重要な要素である。
既存のNLP研究は個々のテキストの分析に重点を置いている。
編集補助は、しばしばテキストのペア間の相互作用をモデル化する必要がある。
論文 参考訳(メタデータ) (2022-04-22T16:39:38Z) - Enhancing Identification of Structure Function of Academic Articles
Using Contextual Information [6.28532577139029]
本稿では,学術論文の構造的機能を明らかにするためのコーパスとして,ACLカンファレンスの記事を取り上げる。
従来の機械学習モデルとディープラーニングモデルを用いて、様々な特徴入力に基づいて分類器を構築する。
2) に触発された本論文は,ディープラーニングモデルに文脈情報を導入し,重要な結果を得た。
論文 参考訳(メタデータ) (2021-11-28T11:21:21Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - CORAL: COde RepresentAtion Learning with Weakly-Supervised Transformers
for Analyzing Data Analysis [33.190021245507445]
ソースコード、特に科学的なソースコードの大規模解析は、データサイエンスのプロセスをよりよく理解する約束を持っている。
本稿では,抽象構文木と周辺自然言語コメントからコードの共同表現を計算するための,弱い教師付きトランスフォーマーベースのアーキテクチャを提案する。
本モデルでは,手軽に手軽に管理できる弱さを生かし,専門家による供給よりも38%の精度向上を実現し,ベースラインを上回ります。
論文 参考訳(メタデータ) (2020-08-28T19:57:49Z) - Two Huge Title and Keyword Generation Corpora of Research Articles [0.0]
本稿では,テキスト要約(OAGSX)とキーワード生成(OAGKX)の2つの巨大なデータセットを紹介する。
データは、研究プロファイルと出版物のネットワークであるOpen Academic Graphから取得された。
より具体的な分野から研究論文のサブセットを導出するために、この2つの集合にトピックモデリングを適用したい。
論文 参考訳(メタデータ) (2020-02-11T21:17:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。