論文の概要: Generating Topic Pages for Scientific Concepts Using Scientific
Publications
- arxiv url: http://arxiv.org/abs/2304.11922v1
- Date: Mon, 24 Apr 2023 09:03:14 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-25 15:39:55.695033
- Title: Generating Topic Pages for Scientific Concepts Using Scientific
Publications
- Title(参考訳): 科学論文を用いた科学概念のトピックページの作成
- Authors: Hosein Azarbonyad, Zubair Afzal, George Tsatsaronis
- Abstract要約: Topic Pagesは、科学書や雑誌の膨大なコレクションから抽出された、科学的概念とそれらの周辺の情報の目録である。
トピックページの主な目的は、科学分野の学術的内容を読みながら、彼らが出会った科学的概念を理解するために、読者にすべての必要な情報を提供することである。
- 参考スコア(独自算出の注目度): 3.0918442363750804
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In this paper, we describe Topic Pages, an inventory of scientific concepts
and information around them extracted from a large collection of scientific
books and journals. The main aim of Topic Pages is to provide all the necessary
information to the readers to understand scientific concepts they come across
while reading scholarly content in any scientific domain. Topic Pages are a
collection of automatically generated information pages using NLP and ML, each
corresponding to a scientific concept. Each page contains three pieces of
information: a definition, related concepts, and the most relevant snippets,
all extracted from scientific peer-reviewed publications. In this paper, we
discuss the details of different components to extract each of these elements.
The collection of pages in production contains over 360,000 Topic Pages across
20 different scientific domains with an average of 23 million unique visits per
month, constituting it a popular source for scientific information.
- Abstract(参考訳): 本稿では,学術論文や雑誌のコレクションから抽出した,科学的概念と周辺情報の目録であるトピックページについて述べる。
トピックページの主な目的は、科学分野の学術的内容を読みながら、彼らが出会った科学的概念を理解するために必要な情報をすべて読者に提供することである。
トピックページは、NLPとMLを使用して自動生成された情報ページのコレクションであり、それぞれが科学的概念に対応する。
各ページには、定義、関連する概念、そして最も関連するスニペットの3つの情報が含まれている。
本稿では,これら各要素を抽出するためのコンポーネントの詳細について述べる。
生産中のページのコレクションには、20の科学分野にまたがる36万ページ以上のトピックページが含まれており、月間平均2300万のユニーク訪問者がある。
関連論文リスト
- SciDMT: A Large-Scale Corpus for Detecting Scientific Mentions [52.35520385083425]
SciDMTは,科学的言及検出のための拡張および拡張されたコーパスである。
コーパスは,1)SciDMTの主コーパスは8万4千件の科学的論文と8百万件以上の弱い注釈付き言及アノテーションと,2)評価目的のために手作業で注釈付けされた100件の科学的論文からなる評価セットから構成される。
論文 参考訳(メタデータ) (2024-06-20T22:03:21Z) - A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.48094108571432]
大規模言語モデル(LLM)は、テキストやその他のデータ処理方法に革命をもたらした。
我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
論文 参考訳(メタデータ) (2024-06-16T08:03:24Z) - Scientific Large Language Models: A Survey on Biological & Chemical Domains [47.97810890521825]
大規模言語モデル(LLM)は、自然言語理解の強化において、変革的な力として現れてきた。
LLMの応用は従来の言語境界を超えて、様々な科学分野で開発された専門的な言語システムを含んでいる。
AI for Science(AI for Science)のコミュニティで急成長している分野として、科学LLMは包括的な探査を義務付けている。
論文 参考訳(メタデータ) (2024-01-26T05:33:34Z) - SMAuC -- The Scientific Multi-Authorship Corpus [32.77279821297011]
本稿では,SMAuCを紹介する。SMAuCは科学的オーサシップ分析に適した,包括的でメタデータに富んだコーパスである。
SMAuCは500万人以上の著者による様々な分野の300万以上の出版物で構成されており、この目的のために公開されている最大規模のコーパスである。
論文 参考訳(メタデータ) (2022-11-04T14:07:17Z) - Change Summarization of Diachronic Scholarly Paper Collections by
Semantic Evolution Analysis [10.554831859741851]
本研究では,長期間にわたる研究論文の収集を解析するための新しい手法を実証する。
我々のアプローチは、時間とともに単語の意味表現を比較することに基づいており、学術出版物の大規模なドメイン中心のアーカイブをより深く理解することを目的としている。
論文 参考訳(メタデータ) (2021-12-07T11:15:19Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - What's New? Summarizing Contributions in Scientific Literature [85.95906677964815]
本稿では,論文のコントリビューションと作業状況について,個別の要約を生成するために,論文要約のアンタングル化という新たなタスクを導入する。
本稿では,学術論文のS2ORCコーパスを拡張し,コントリビューション・コントリビューション・コントリビューション・レファレンス・ラベルを付加する。
本稿では, 生成した出力の関連性, 新規性, 絡み合いを報告する総合的自動評価プロトコルを提案する。
論文 参考訳(メタデータ) (2020-11-06T02:23:01Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z) - Will This Idea Spread Beyond Academia? Understanding Knowledge Transfer
of Scientific Concepts across Text Corpora [18.76916879679805]
我々はすべての科学分野の科学的概念のレベルで翻訳研究を研究する。
我々は「研究アイデア」のインスタンス化としてコーパスから科学的概念を抽出する。
そして、45万以上の新しい概念の軌跡を辿って、これらのアイデアのごく一部しか発明や薬物の試行に使われていない要因を特定します。
論文 参考訳(メタデータ) (2020-10-13T19:46:59Z) - A Study of Human Summaries of Scientific Articles [23.54266983884704]
これらのプラットフォームのうちの1つで共有されている要約を分析します。
目的は、科学的論文の人間の要約を特徴づけ、既存の自動要約システムの改善と適応のために得られた洞察を利用することである。
論文 参考訳(メタデータ) (2020-02-10T08:53:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。