論文の概要: How do software citation formats evolve over time? A longitudinal
analysis of R programming language packages
- arxiv url: http://arxiv.org/abs/2307.09390v1
- Date: Mon, 17 Jul 2023 09:18:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-19 13:43:22.430356
- Title: How do software citation formats evolve over time? A longitudinal
analysis of R programming language packages
- Title(参考訳): ソフトウェア引用形式は時間とともにどのように進化するか?
R言語パッケージの縦解析
- Authors: Yuzhuo Wang, Kai Li
- Abstract要約: 本研究では2021年と2022年に収集された全Rパッケージの引用形式の時系列データセットを比較し,分析する。
引用の背景となるさまざまなドキュメントタイプと、引用形式におけるメタデータ要素が時間とともに変化したかを検討する。
- 参考スコア(独自算出の注目度): 12.082972614614413
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Under the data-driven research paradigm, research software has come to play
crucial roles in nearly every stage of scientific inquiry. Scholars are
advocating for the formal citation of software in academic publications,
treating it on par with traditional research outputs. However, software is
hardly consistently cited: one software entity can be cited as different
objects, and the citations can change over time. These issues, however, are
largely overlooked in existing empirical research on software citation. To fill
the above gaps, the present study compares and analyzes a longitudinal dataset
of citation formats of all R packages collected in 2021 and 2022, in order to
understand the citation formats of R-language packages, important members in
the open-source software family, and how the citations evolve over time. In
particular, we investigate the different document types underlying the
citations and what metadata elements in the citation formats changed over time.
Furthermore, we offer an in-depth analysis of the disciplinarity of journal
articles cited as software (software papers). By undertaking this research, we
aim to contribute to a better understanding of the complexities associated with
software citation, shedding light on future software citation policies and
infrastructure.
- Abstract(参考訳): データ駆動研究パラダイムの下では、研究ソフトウェアは科学調査のほぼすべての段階において重要な役割を担っている。
研究者は、学術出版物におけるソフトウェアの正式な引用を提唱し、従来の研究成果と同等に扱う。
しかし、ソフトウェアは一貫して引用されることはほとんどない: 1つのソフトウェアエンティティは異なるオブジェクトとして参照することができ、引用は時間とともに変化する。
しかし、これらの問題は、ソフトウェア引用に関する既存の実証研究でほとんど見過ごされている。
上記のギャップを埋めるため,本研究では2021年と2022年に収集された全rパッケージの引用形式を縦断的に比較分析し,r言語パッケージの引用形式,オープンソースソフトウェアファミリーの重要なメンバ,引用形式が時間とともにどのように進化するかを理解する。
特に,引用の基盤となる異なる文書タイプと,引用形式におけるメタデータ要素が時間とともに変化したかについて検討する。
さらに,ソフトウェア(ソフトウェア論文)として引用された論文の学際性を詳細に分析する。
本研究は,ソフトウェア引用に関する複雑さをより深く理解し,今後のソフトウェア引用方針とインフラに光を当てることを目的としている。
関連論文リスト
- Don't mention it: An approach to assess challenges to using software
mentions for citation and discoverability research [0.3268055538225029]
本研究では,このようなデータセットのユーザビリティを研究ソフトウェア研究のために評価する手法を提案する。
1つのデータセットは、前述のソフトウェアへのリンクをまったく提供しないが、もう1つのデータセットは、定量的研究の取り組みを妨げることができる。
ソフトウェア参照データセットを扱う際の最大の課題と根底にある問題は、ソフトウェア引用のまだ最適なプラクティスである。
論文 参考訳(メタデータ) (2024-02-22T14:51:17Z) - The Semantic Scholar Open Data Platform [79.4493235243312]
セマンティック・スカラー(Semantic Scholar、S2)は、学術文献の発見と理解を支援することを目的としたオープンデータプラットフォームおよびウェブサイトである。
我々は、学術的なPDFコンテンツ抽出と知識グラフの自動構築のための最先端技術を用いて、パブリックおよびプロプライエタリなデータソースを組み合わせる。
このグラフには、構造解析されたテキスト、自然言語要約、ベクトル埋め込みなどの高度な意味的特徴が含まれている。
論文 参考訳(メタデータ) (2023-01-24T17:13:08Z) - CiteBench: A benchmark for Scientific Citation Text Generation [69.37571393032026]
CiteBenchは引用テキスト生成のベンチマークである。
CiteBenchのコードはhttps://github.com/UKPLab/citebench.comで公開しています。
論文 参考訳(メタデータ) (2022-12-19T16:10:56Z) - Deep Graph Learning for Anomalous Citation Detection [55.81334139806342]
本稿では,新たな深層グラフ学習モデルであるGLAD(Graph Learning for Anomaly Detection)を提案する。
GLADフレームワーク内ではCPU(Citation PUrpose)と呼ばれるアルゴリズムが提案され,引用テキストに基づく引用の目的が明らかになった。
論文 参考訳(メタデータ) (2022-02-23T09:05:28Z) - Towards generating citation sentences for multiple references with
intent control [86.53829532976303]
We build a novel generation model with the Fusion-in-Decoder approach to handlee with multiple long inputs。
実験により,提案手法は引用文を生成するためのより包括的な特徴を提供することが示された。
論文 参考訳(メタデータ) (2021-12-02T15:32:24Z) - Cross-Lingual Citations in English Papers: A Large-Scale Analysis of
Prevalence, Usage, and Impact [0.0]
本稿では,100万以上の英文論文に基づく言語間引用の分析を行う。
私たちの発見の中には、中国語で書かれた出版物への引用率の増加がある。
さらなる研究を容易にするため,収集したデータとソースコードを公開している。
論文 参考訳(メタデータ) (2021-11-07T15:34:02Z) - SoMeSci- A 5 Star Open Data Gold Standard Knowledge Graph of Software
Mentions in Scientific Articles [1.335443972283229]
SoMeSciは、科学論文におけるソフトウェア言及の知識グラフである。
高品質なアノテーション(IRR: $kappa=.82$)が含まれており、1367年のPubMed Centralの記事で3756のソフトウェアが言及されている。
論文 参考訳(メタデータ) (2021-08-20T08:53:03Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - Utilizing Citation Network Structure to Predict Citation Counts: A Deep
Learning Approach [0.0]
本稿では,情報カスケードの効果を組み合わせ,引用数予測問題に注目するエンド・ツー・エンドのディープラーニングネットワークであるDeepCCPを提案する。
6つの実データ集合の実験によると、DeepCCPは引用数予測の精度において最先端の手法よりも優れている。
論文 参考訳(メタデータ) (2020-09-06T05:27:50Z) - A Decade of In-text Citation Analysis based on Natural Language
Processing and Machine Learning Techniques: An overview of empirical studies [3.474275085556876]
情報科学者は、フルテキストデータ処理技術の進歩に踏み込んで、従来の書誌学をはるかに超えてきた。
本稿は、これらの発展に関する研究を物語的にレビューすることを目的としている。
その主な焦点は、自然言語処理と機械学習技術を使って引用を分析した出版物である。
論文 参考訳(メタデータ) (2020-08-29T17:27:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。