論文の概要: The Rise of Open Science: Tracking the Evolution and Perceived Value of
Data and Methods Link-Sharing Practices
- arxiv url: http://arxiv.org/abs/2310.03193v1
- Date: Wed, 4 Oct 2023 22:34:56 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-06 19:59:10.602436
- Title: The Rise of Open Science: Tracking the Evolution and Perceived Value of
Data and Methods Link-Sharing Practices
- Title(参考訳): オープンサイエンスの興隆 : データの進化と知覚の価値の追跡とリンク共有の実践
- Authors: Hancheng Cao, Jesse Dodge, Kyle Lo, Daniel A. McFarland, Lucy Lu Wang
- Abstract要約: 我々は、時間とともにデータとメソッドのリンク共有の実践が記事の受信に与える影響を分析する。
メソッドやデータへのリンク共有の実践は、より多くの論文が時間とともにそのようなURLを含めるにつれて広まっているという証拠を見つけます。
データとメソッドリンクを共有する記事は、引用数の観点から認識されやすくなり、共有リンクがアクティブになるとより効果が強くなります。
- 参考スコア(独自算出の注目度): 32.347696721495076
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, funding agencies and journals increasingly advocate for open
science practices (e.g. data and method sharing) to improve the transparency,
access, and reproducibility of science. However, quantifying these practices at
scale has proven difficult. In this work, we leverage a large-scale dataset of
1.1M papers from arXiv that are representative of the fields of physics, math,
and computer science to analyze the adoption of data and method link-sharing
practices over time and their impact on article reception. To identify links to
data and methods, we train a neural text classification model to automatically
classify URL types based on contextual mentions in papers. We find evidence
that the practice of link-sharing to methods and data is spreading as more
papers include such URLs over time. Reproducibility efforts may also be
spreading because the same links are being increasingly reused across papers
(especially in computer science); and these links are increasingly concentrated
within fewer web domains (e.g. Github) over time. Lastly, articles that share
data and method links receive increased recognition in terms of citation count,
with a stronger effect when the shared links are active (rather than defunct).
Together, these findings demonstrate the increased spread and perceived value
of data and method sharing practices in open science.
- Abstract(参考訳): 近年、資金提供機関や雑誌は、科学の透明性、アクセス、再現性を改善するためのオープンサイエンスの実践(例えば、データと方法の共有)をますます提唱している。
しかし、これらのプラクティスを大規模に定量化するのは難しいことが証明された。
本研究では、物理・数学・計算機科学の分野を代表するarXivの1.1M論文の大規模データセットを活用し、時間とともにデータやメソッドのリンク共有の実践が記事受信に与える影響を分析する。
データやメソッドへのリンクを識別するために,論文の文脈参照に基づくURLタイプの自動分類のために,ニューラルネットワークの分類モデルを訓練する。
メソッドやデータへのリンク共有の実践は、より多くの論文が時間とともにそのようなURLを含むようになってきている。
同じリンクが論文(特にコンピュータ科学)にまたがって再利用され、これらのリンクは時間とともに少ないWebドメイン(例えばGithub)に集中しているため、再現性への取り組みも広がりつつある。
最後に、データとメソッドリンクを共有する記事は、引用数の観点から認識が増大し、共有リンクがアクティブである場合(廃止ではなく)、より強い効果が得られる。
これらの知見は,オープンサイエンスにおけるデータの普及と認知的価値の増大と手法共有の実践を示すものである。
関連論文リスト
- Assessing Scientific Contributions in Data Sharing Spaces [64.16762375635842]
本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
論文 参考訳(メタデータ) (2023-03-18T19:17:47Z) - Email Spam Detection Using Hierarchical Attention Hybrid Deep Learning
Method [0.0]
本稿では,畳み込みニューラルネットワーク,リカレントユニット,アテンションゲート機構を組み合わせたメールスパム検出手法を提案する。
提案手法は最先端のモデルと比較し,本手法の方が優れたことを示す。
論文 参考訳(メタデータ) (2022-04-15T09:02:36Z) - Generating Local Maps of Science using Deep Bibliographic Coupling [1.7188280334580195]
グラフ拡散法を用いて深部近傍への結合を拡大することを提案する。
この方法では、任意の2つの論文間の類似性を定義することができ、科学の局所的な地図を生成することができる。
論文 参考訳(メタデータ) (2021-09-21T07:25:18Z) - CitationIE: Leveraging the Citation Graph for Scientific Information
Extraction [89.33938657493765]
引用論文と引用論文の参照リンクの引用グラフを使用する。
最先端技術に対するエンド・ツー・エンドの情報抽出の大幅な改善を観察する。
論文 参考訳(メタデータ) (2021-06-03T03:00:12Z) - Enhancing Scientific Papers Summarization with Citation Graph [78.65955304229863]
引用グラフを用いて科学論文の要約作業を再定義します。
我々は,141kの研究論文を異なる領域に格納した,新しい科学論文要約データセットセマンティックスタディネットワーク(ssn)を構築した。
我々のモデルは、事前訓練されたモデルと比較して競争性能を達成することができる。
論文 参考訳(メタデータ) (2021-04-07T11:13:35Z) - i-Mix: A Domain-Agnostic Strategy for Contrastive Representation
Learning [117.63815437385321]
対照的な表現学習を改善するために, 単純で効果的なドメインに依存しない正規化戦略i-Mixを提案する。
実験では、i-Mixはドメイン間の学習表現の質を一貫して改善することを示した。
論文 参考訳(メタデータ) (2020-10-17T23:32:26Z) - Learning from similarity and information extraction from structured
documents [0.0]
目的は、巨大な実世界の文書データセット上で、単語ごとの分類のマイクロF1を改善することである。
結果は、提案されたアーキテクチャ部品がすべて、以前の結果を上回るために必要であることを確認した。
最高のモデルは、F1スコアの8.25利得によって、前の最先端結果を改善する。
論文 参考訳(メタデータ) (2020-10-17T21:34:52Z) - Machine Identification of High Impact Research through Text and Image
Analysis [0.4737991126491218]
本稿では,引用の可能性が低い論文から高い論文を自動的に分離するシステムを提案する。
本システムでは,文書全体の外観を推測する視覚的分類器と,コンテンツインフォームド決定のためのテキスト分類器の両方を用いる。
論文 参考訳(メタデータ) (2020-05-20T19:12:24Z) - Knowledge graph based methods for record linkage [0.0]
本稿では,レコードリンケージ問題に対処するための知識グラフを提案する。
提案手法は,bf WERLと命名され,主知識グラフ特性を利用して,埋込ベクトルを学習し,国勢調査情報を符号化する。
我々は,この手法をベンチマークデータセット上で評価し,刺激的および満足な結果の関連手法と比較した。
論文 参考訳(メタデータ) (2020-03-06T11:09:44Z) - Distributed Learning in the Non-Convex World: From Batch to Streaming
Data, and Beyond [73.03743482037378]
分散学習は、多くの人々が想定する、大規模に接続された世界の重要な方向となっている。
本稿では、スケーラブルな分散処理とリアルタイムデータ計算の4つの重要な要素について論じる。
実践的な問題や今後の研究についても論じる。
論文 参考訳(メタデータ) (2020-01-14T14:11:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。