論文の概要: SciNews: From Scholarly Complexities to Public Narratives -- A Dataset for Scientific News Report Generation
- arxiv url: http://arxiv.org/abs/2403.17768v2
- Date: Tue, 10 Dec 2024 09:12:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-11 14:35:06.581190
- Title: SciNews: From Scholarly Complexities to Public Narratives -- A Dataset for Scientific News Report Generation
- Title(参考訳): SciNews:Scholarly ComplexitiesからPublic Narrativesへ - 科学ニュース生成のためのデータセット
- Authors: Dongqi Liu, Yifan Wang, Jia Loy, Vera Demberg,
- Abstract要約: 我々は、科学ニュースの自動生成を容易にするための新しいコーパスを提示する。
本データセットは,9分野にわたる学術出版物と,それに対応する科学報告から構成される。
我々は、最先端のテキスト生成モデルを用いてデータセットをベンチマークする。
- 参考スコア(独自算出の注目度): 16.61347730523143
- License:
- Abstract: Scientific news reports serve as a bridge, adeptly translating complex research articles into reports that resonate with the broader public. The automated generation of such narratives enhances the accessibility of scholarly insights. In this paper, we present a new corpus to facilitate this paradigm development. Our corpus comprises a parallel compilation of academic publications and their corresponding scientific news reports across nine disciplines. To demonstrate the utility and reliability of our dataset, we conduct an extensive analysis, highlighting the divergences in readability and brevity between scientific news narratives and academic manuscripts. We benchmark our dataset employing state-of-the-art text generation models. The evaluation process involves both automatic and human evaluation, which lays the groundwork for future explorations into the automated generation of scientific news reports. The dataset and code related to this work are available at https://dongqi.me/projects/SciNews.
- Abstract(参考訳): 科学的な報道は橋として機能し、複雑な研究論文を一般大衆に反響するレポートに順応的に翻訳する。
このような物語の自動生成は、学術的洞察のアクセシビリティを高める。
本稿では,このパラダイム開発を促進するための新しいコーパスを提案する。
我々のコーパスは、9つの分野にわたる学術出版物とそれに対応する科学ニュースを並行してまとめて構成する。
本データセットの有用性と信頼性を実証するため,学術論文と学術論文の読みやすさと簡潔さの相違に着目し,広範囲な分析を行った。
我々は、最先端のテキスト生成モデルを用いてデータセットをベンチマークする。
評価プロセスには、自動的な評価と人的評価の両方が含まれる。
この作業に関連するデータセットとコードはhttps://dongqi.me/projects/SciNews.comで公開されている。
関連論文リスト
- MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - 'Don't Get Too Technical with Me': A Discourse Structure-Based Framework
for Science Journalism [36.16009435194716]
科学ジャーナリズム(英: science journalism)とは、科学論文の技術的発見を、より専門的なニュース記事として一般大衆に報告するタスクである。
我々は,この現実的なタスク(すなわち,科学ジャーナリズム)を支援する自動化システムを,公開可能な科学論文,対応するニュース記事,専門家による要約スニペットのオーディエンスに導入することを目的としている。
論文 参考訳(メタデータ) (2023-10-23T16:35:05Z) - Interactive Distillation of Large Single-Topic Corpora of Scientific
Papers [1.2954493726326113]
より堅牢だが時間を要するアプローチは、主題の専門家が文書を手書きするデータセットを構成的に構築することである。
ここでは,学術文献のターゲットデータセットを構築的に生成するための,機械学習に基づく新しいツールを紹介する。
論文 参考訳(メタデータ) (2023-09-19T17:18:36Z) - Identifying Informational Sources in News Articles [109.70475599552523]
我々は、ニュース執筆に使用される情報ソースの、最大かつ最も広範囲にアノテートされたデータセットを構築した。
本稿では,ニュース記事中のソースの構成性を研究するための新しいタスクであるソース予測を導入する。
論文 参考訳(メタデータ) (2023-05-24T08:56:35Z) - The Semantic Reader Project: Augmenting Scholarly Documents through
AI-Powered Interactive Reading Interfaces [54.2590226904332]
本稿では,研究論文を対象とした動的読解インタフェースの自動作成を目的としたセマンティック・リーダー・プロジェクトについて述べる。
10のプロトタイプインターフェースが開発され、300人以上の参加者と現実世界のユーザが読書体験を改善している。
本論文は,研究論文を読む際,学者と公衆の面を巡って構築する。
論文 参考訳(メタデータ) (2023-03-25T02:47:09Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。