論文の概要: Change Summarization of Diachronic Scholarly Paper Collections by
Semantic Evolution Analysis
- arxiv url: http://arxiv.org/abs/2112.03634v1
- Date: Tue, 7 Dec 2021 11:15:19 GMT
- ステータス: 処理完了
- システム内更新日: 2021-12-08 20:39:11.584283
- Title: Change Summarization of Diachronic Scholarly Paper Collections by
Semantic Evolution Analysis
- Title(参考訳): 意味的進化解析によるDiachronic Scholarly Paper Collectionsの変化要約
- Authors: Naman Paharia, Muhammad Syafiq Mohd Pozi, Adam Jatowt
- Abstract要約: 本研究では,長期間にわたる研究論文の収集を解析するための新しい手法を実証する。
我々のアプローチは、時間とともに単語の意味表現を比較することに基づいており、学術出版物の大規模なドメイン中心のアーカイブをより深く理解することを目的としている。
- 参考スコア(独自算出の注目度): 10.554831859741851
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The amount of scholarly data has been increasing dramatically over the last
years. For newcomers to a particular science domain (e.g., IR, physics, NLP) it
is often difficult to spot larger trends and to position the latest research in
the context of prior scientific achievements and breakthroughs. Similarly,
researchers in the history of science are interested in tools that allow them
to analyze and visualize changes in particular scientific domains. Temporal
summarization and related methods should be then useful for making sense of
large volumes of scientific discourse data aggregated over time. We demonstrate
a novel approach to analyze the collections of research papers published over
longer time periods to provide a high-level overview of important semantic
changes that occurred over the progress of time. Our approach is based on
comparing word semantic representations over time and aims to support users in
a better understanding of large domain-focused archives of scholarly
publications. As an example dataset we use the ACL Anthology Reference Corpus
that spans from 1979 to 2015 and contains 22,878 scholarly articles.
- Abstract(参考訳): 学術データの量はここ数年で劇的に増加している。
特定の科学分野(例えば、IR、物理学、NLP)への新規参入者にとって、より大きなトレンドを見つけ出し、最新の研究を以前の科学的成果やブレークスルーの文脈で位置づけることはしばしば困難である。
同様に、科学史の研究者は、特定の科学領域における変化を分析し視覚化できるツールに興味を持っている。
時間的要約と関連する手法は、時間とともに集約された大量の科学談話データを理解するのに有用である。
我々は,研究論文のコレクションを長期にわたって分析し,時間経過とともに生じる重要な意味的変化を高レベルに概観する新しい手法を提案する。
我々のアプローチは、時間とともに単語の意味表現を比較することに基づいており、学術出版物の大規模なドメイン中心のアーカイブをより深く理解することを目的としている。
例として、1979年から2015年までのACL Anthology Reference Corpusを使用し、22,878の学術論文を含む。
関連論文リスト
- A Comprehensive Survey of Scientific Large Language Models and Their Applications in Scientific Discovery [68.48094108571432]
大規模言語モデル(LLM)は、テキストやその他のデータ処理方法に革命をもたらした。
我々は,科学LLM間のクロスフィールドおよびクロスモーダル接続を明らかにすることで,研究ランドスケープのより総合的なビューを提供することを目指している。
論文 参考訳(メタデータ) (2024-06-16T08:03:24Z) - Mapping the Increasing Use of LLMs in Scientific Papers [99.67983375899719]
2020年1月から2024年2月にかけて、arXiv、bioRxiv、Natureのポートフォリオジャーナルで950,965の論文をまとめて、体系的で大規模な分析を行った。
計算機科学の論文では, LLMの使用が着実に増加し, 最大, 最速の成長が観察された。
論文 参考訳(メタデータ) (2024-04-01T17:45:15Z) - SciMMIR: Benchmarking Scientific Multi-modal Information Retrieval [64.03631654052445]
科学領域内の画像テキストペアリングにおけるMMIR性能を評価するための最新のベンチマークは、顕著なギャップを示している。
オープンアクセス用紙コレクションを利用した特殊な科学的MMIRベンチマークを開発する。
このベンチマークは、科学的文書に詳細なキャプションのある数字や表から抽出された、530Kの精巧にキュレートされた画像テキストペアからなる。
論文 参考訳(メタデータ) (2024-01-24T14:23:12Z) - A Comprehensive Study of Groundbreaking Machine Learning Research:
Analyzing highly cited and impactful publications across six decades [1.6442870218029522]
機械学習(ML)は、コンピュータ科学やその他の関連分野の研究分野として注目されている。
重要なトレンド、影響力のある著者、そしてこれまでの重要な貢献を識別するために、高度に引用された出版物の風景を理解することが不可欠である。
論文 参考訳(メタデータ) (2023-08-01T21:43:22Z) - A Diachronic Analysis of Paradigm Shifts in NLP Research: When, How, and
Why? [84.46288849132634]
本稿では、因果発見と推論技術を用いて、科学分野における研究トピックの進化を分析するための体系的な枠組みを提案する。
我々は3つの変数を定義し、NLPにおける研究トピックの進化の多様な側面を包含する。
我々は因果探索アルゴリズムを用いてこれらの変数間の因果関係を明らかにする。
論文 参考訳(メタデータ) (2023-05-22T11:08:00Z) - Modeling Information Change in Science Communication with Semantically
Matched Paraphrases [50.67030449927206]
SPICEDは、情報変化の度合いに注釈を付けた科学的な発見の最初のパラフレーズデータセットである。
SPICEDには、ニュース記事、ソーシャルメディアの議論、オリジナル論文の全文から抽出された6000の科学的発見ペアが含まれている。
SPICEDで訓練されたモデルは、実世界の科学的主張の事実チェックのための証拠検索において下流のパフォーマンスを改善する。
論文 参考訳(メタデータ) (2022-10-24T07:44:38Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Early Indicators of Scientific Impact: Predicting Citations with
Altmetrics [0.0]
altmetricsを使って、学術的な出版物が得る短期的および長期的な引用を予測する。
我々は,様々な分類モデルと回帰モデルを構築し,それらの性能を評価し,それらのタスクに最適なニューラルネットワークとアンサンブルモデルを見つける。
論文 参考訳(メタデータ) (2020-12-25T16:25:07Z) - Semantic and Relational Spaces in Science of Science: Deep Learning
Models for Article Vectorisation [4.178929174617172]
我々は、自然言語処理(NLP)とグラフニューラルネットワーク(GNN)を用いて、記事の意味的・関係的な側面に基づく文書レベルの埋め込みに焦点を当てる。
論文のセマンティックな空間をNLPでエンコードできるのに対し、GNNでは研究コミュニティの社会的実践をエンコードするリレーショナルな空間を構築することができる。
論文 参考訳(メタデータ) (2020-11-05T14:57:41Z) - Topic Space Trajectories: A case study on machine learning literature [0.0]
本稿では,研究トピックの包括的追跡を可能にする構造であるトピック空間トラジェクトリを提案する。
我々は,32の出版会場から50年間の機械学習研究を対象とする出版コーパスへのアプローチの適用性を示した。
本手法は,論文分類,今後の研究課題の予測,未発表の論文提出のための会議や雑誌の掲載を推奨するために利用することができる。
論文 参考訳(メタデータ) (2020-10-23T10:53:42Z) - Attention: to Better Stand on the Shoulders of Giants [34.5017808610466]
本稿では,長期科学的影響予測のための注意機構を開発する。
実際の大規模引用データセットに基づいて,本手法の検証を行う。
論文 参考訳(メタデータ) (2020-05-27T00:25:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。