論文の概要: Measuring research data reuse in scholarly publications using generative artificial intelligence: Open Science Indicator development and preliminary results
- arxiv url: http://arxiv.org/abs/2604.28061v1
- Date: Thu, 30 Apr 2026 16:07:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-01 16:31:54.192456
- Title: Measuring research data reuse in scholarly publications using generative artificial intelligence: Open Science Indicator development and preliminary results
- Title(参考訳): 生成人工知能を用いた学術出版物における研究データ再利用の測定:オープンサイエンスインジケータの開発と予備研究結果
- Authors: Lauren Cadwallader, Iain Hrynaszkiewicz, parth sarin, Tim Vines,
- Abstract要約: PLOSとDataSeerは、オープンサイエンスの重要な効果、すなわち研究データの再利用を測定するための新しい指標を開発した。
その結果,既存の文献技術よりも高いデータ再利用率は43%であった。
- 参考スコア(独自算出の注目度): 0.764971671709743
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Numerous metascience studies and other initiatives have begun to monitor the prevalence of open science practices when it is more important to understand the 'downstream' effects or impacts of open science. PLOS and DataSeer have developed a new LLM-based indicator to measure an important effect of open science: the reuse of research data. Our results show a data reuse rate of 43%, which is higher than established bibliometric techniques. We show that data reuse can be measured at scale using LLMs and generative artificial intelligence. The positive effects of research data sharing and reuse may currently be underestimated.
- Abstract(参考訳): 多くのメタサイエンス研究やその他のイニシアチブが、オープンサイエンスの「下流」効果や影響を理解することがより重要であるときに、オープンサイエンスの実践の流行をモニターし始めている。
PLOSとDataSeerは、オープンサイエンスの重要な効果である研究データの再利用を測定するために、新しいLCMベースの指標を開発した。
その結果,既存の文献技術よりも高いデータ再利用率は43%であった。
LLMと生成人工知能を用いてデータの再利用を大規模に測定できることを示す。
現在、研究データの共有と再利用のポジティブな影響は過小評価されている。
関連論文リスト
- MegaScience: Pushing the Frontiers of Post-Training Datasets for Science Reasoning [32.21228080662089]
1kの大学レベルの教科書から抽出した真正な参照回答を特徴とするオープンデータセットであるTextbookReasoningを提案する。
私たちは、合計125万のインスタンスからなる高品質なオープンソースデータセットの大規模な混合であるMegaScienceを紹介します。
実験により,我々のデータセットはより簡潔な応答長で優れた性能と訓練効率が得られることを示した。
論文 参考訳(メタデータ) (2025-07-22T17:59:03Z) - ScienceMeter: Tracking Scientific Knowledge Updates in Language Models [79.33626657942169]
大規模言語モデル(LLM)は、科学研究を支援するためにますます使われているが、科学的進歩に関する彼らの知識は急速に時代遅れになる。
我々は,過去,現在,未来にまたがる科学的知識の更新手法を評価するための新しいフレームワークであるScienceMeterを紹介する。
論文 参考訳(メタデータ) (2025-05-30T07:28:20Z) - SciRIFF: A Resource to Enhance Language Model Instruction-Following over Scientific Literature [97.31347312130119]
SciRIFF(Scientific Resource for Instruction-Following and Finetuning)は、トレーニングと評価のための137K命令フォローインスタンスのデータセットで、54のタスクをカバーする。
これらのタスクは、情報抽出、要約、質問応答、クレーム検証、分類の5つの中核的な科学文献理解能力にまたがる。
SciRIFFは、さまざまな科学分野にわたる研究文献から情報を抽出し、合成するための、完全に専門家によって書かれた高品質な命令追跡データセットである。
論文 参考訳(メタデータ) (2024-06-10T21:22:08Z) - Dataset Mention Extraction in Scientific Articles Using Bi-LSTM-CRF Model [0.0]
データレポジトリや資金調達機関による最近の取り組みにもかかわらず、データセットの引用は一般的でも標準的でもないことが示されています。
この問題の潜在的な解決策は、科学論文からデータセットの言及を自動的に抽出することである。
本研究では,Bi-LSTM-CRFアーキテクチャに基づくニューラルネットワークを用いて,そのような抽出を実現することを提案する。
論文 参考訳(メタデータ) (2024-05-21T18:12:37Z) - Assessing Scientific Contributions in Data Sharing Spaces [64.16762375635842]
本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
論文 参考訳(メタデータ) (2023-03-18T19:17:47Z) - Citation Trajectory Prediction via Publication Influence Representation
Using Temporal Knowledge Graph [52.07771598974385]
既存のアプローチは主に学術論文の時間的データとグラフデータのマイニングに依存している。
本フレームワークは,差分保存グラフ埋め込み,きめ細かい影響表現,学習に基づく軌道計算という3つのモジュールから構成される。
APSアカデミックデータセットとAIPatentデータセットの両方で実験を行った。
論文 参考訳(メタデータ) (2022-10-02T07:43:26Z) - Attention: to Better Stand on the Shoulders of Giants [34.5017808610466]
本稿では,長期科学的影響予測のための注意機構を開発する。
実際の大規模引用データセットに基づいて,本手法の検証を行う。
論文 参考訳(メタデータ) (2020-05-27T00:25:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。