論文の概要: CORWA: A Citation-Oriented Related Work Annotation Dataset
- arxiv url: http://arxiv.org/abs/2205.03512v1
- Date: Sat, 7 May 2022 00:23:46 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-15 12:35:29.477519
- Title: CORWA: A Citation-Oriented Related Work Annotation Dataset
- Title(参考訳): corwa: 引用指向の関連作業アノテーションデータセット
- Authors: Xiangci Li, Biswadip Mandal, Jessica Ouyang
- Abstract要約: 自然言語処理では、通常「関連作業」という節で文献レビューが行われる。
我々はCORWAラベルを自動的にタグ付けする強力なベースラインモデルをトレーニングする。
そこで本研究では,ヒューマン・イン・ザ・ループ,反復的,抽象的関連作業生成のための新しいフレームワークを提案する。
- 参考スコア(独自算出の注目度): 4.740962650068886
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Academic research is an exploratory activity to discover new solutions to
problems. By this nature, academic research works perform literature reviews to
distinguish their novelties from prior work. In natural language processing,
this literature review is usually conducted under the "Related Work" section.
The task of related work generation aims to automatically generate the related
work section given the rest of the research paper and a list of papers to cite.
Prior work on this task has focused on the sentence as the basic unit of
generation, neglecting the fact that related work sections consist of variable
length text fragments derived from different information sources. As a first
step toward a linguistically-motivated related work generation framework, we
present a Citation Oriented Related Work Annotation (CORWA) dataset that labels
different types of citation text fragments from different information sources.
We train a strong baseline model that automatically tags the CORWA labels on
massive unlabeled related work section texts. We further suggest a novel
framework for human-in-the-loop, iterative, abstractive related work
generation.
- Abstract(参考訳): 学術研究は、問題に対する新しい解決策を発見するための探索活動である。
この性質により、学術研究は文学評論を行い、その新奇性を先行作品と区別する。
自然言語処理では、この文献レビューは「関連作業」のセクションで通常実施される。
関連作業生成のタスクは、研究論文の残りと引用する論文のリストから、関連作業セクションを自動的に生成することを目的としている。
このタスクの以前の作業は、文を生成の基本単位として重視しており、関連する作業セクションが異なる情報ソースから派生した可変長テキストフラグメントで構成されているという事実を無視している。
言語的に動機づけられた作業生成フレームワークへの第一歩として、異なる情報ソースから異なるタイプの引用テキストフラグメントをラベル付けしたCitation Oriented Related Work Annotation (CORWA)データセットを提案する。
大量のラベルのない関連作業セクションのテキストにcorwaラベルを自動的にタグ付けする、強力なベースラインモデルをトレーニングします。
さらに,人間-イン-ループ,反復的,抽象的関連作業生成のための新しいフレームワークを提案する。
関連論文リスト
- CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - Target-aware Abstractive Related Work Generation with Contrastive
Learning [48.02845973891943]
関連作業部は学術論文の重要な構成要素であり、参考論文の文脈における対象論文の貢献を強調している。
既存の作業部生成手法の多くは、既成の文章を抽出することに依存している。
本稿では,新たな文からなる関連作業区間を生成できる抽象的目標認識関連作業生成装置(TAG)を提案する。
論文 参考訳(メタデータ) (2022-05-26T13:20:51Z) - Revise and Resubmit: An Intertextual Model of Text-based Collaboration
in Peer Review [52.359007622096684]
ピアレビューは、ほとんどの科学分野における出版プロセスの重要な要素である。
既存のNLP研究は個々のテキストの分析に重点を置いている。
編集補助は、しばしばテキストのペア間の相互作用をモデル化する必要がある。
論文 参考訳(メタデータ) (2022-04-22T16:39:38Z) - Automatic Related Work Generation: A Meta Study [5.025654873456755]
自然言語処理では、通常「関連作業」という節で文献レビューが行われる。
自動作業生成の課題は, 「関連作業」 セクションを自動生成することである。
本稿では,問題定式化,データセット収集,方法論的アプローチ,性能評価,今後の展望の観点から,関連作業生成に関する既存の文献をメタスタディで比較する。
論文 参考訳(メタデータ) (2022-01-06T01:16:38Z) - MultiCite: Modeling realistic citations requires moving beyond the
single-sentence single-label setting [13.493267499658527]
我々は1200以上の計算言語学論文から12,653の引用コンテキストのデータセットであるMultiCiteをリリースした。
従来のCCAモデルのトレーニングにはまだ使用可能なデータセットが,固定幅テキスト分類以外にも,CCAの新しいタイプのモデルの開発をサポートすることを示す。
論文 参考訳(メタデータ) (2021-07-01T12:54:23Z) - Generating Related Work [37.161925758727456]
論文引用の動機を否定しながら,関連する作業セクションの生成をモデル化する。
我々のモデルは、いくつかの強力な最先端の要約モデルとマルチドキュメントの要約モデルより優れている。
論文 参考訳(メタデータ) (2021-04-18T00:19:37Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Positioning yourself in the maze of Neural Text Generation: A
Task-Agnostic Survey [54.34370423151014]
本稿では, ストーリーテリング, 要約, 翻訳など, 世代ごとのタスクインパクトをリレーする手法の構成要素について検討する。
本稿では,学習パラダイム,事前学習,モデリングアプローチ,復号化,各分野における重要な課題について,命令的手法の抽象化を提案する。
論文 参考訳(メタデータ) (2020-10-14T17:54:42Z) - From Standard Summarization to New Tasks and Beyond: Summarization with
Manifold Information [77.89755281215079]
テキスト要約は、原文書の短く凝縮した版を作成することを目的とした研究分野である。
現実世界のアプリケーションでは、ほとんどのデータは平易なテキスト形式ではない。
本稿では,現実のアプリケーションにおけるこれらの新しい要約タスクとアプローチについて調査する。
論文 参考訳(メタデータ) (2020-05-10T14:59:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。