論文の概要: Assessing Scientific Contributions in Data Sharing Spaces
- arxiv url: http://arxiv.org/abs/2303.10476v1
- Date: Sat, 18 Mar 2023 19:17:47 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-21 18:58:09.903446
- Title: Assessing Scientific Contributions in Data Sharing Spaces
- Title(参考訳): データ共有空間における科学的貢献の評価
- Authors: Kacy Adams and Fernando Spadea and Conor Flynn and Oshani Seneviratne
- Abstract要約: 本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
- 参考スコア(独自算出の注目度): 64.16762375635842
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the present academic landscape, the process of collecting data is slow,
and the lax infrastructures for data collaborations lead to significant delays
in coming up with and disseminating conclusive findings. Therefore, there is an
increasing need for a secure, scalable, and trustworthy data-sharing ecosystem
that promotes and rewards collaborative data-sharing efforts among researchers,
and a robust incentive mechanism is required to achieve this objective.
Reputation-based incentives, such as the h-index, have historically played a
pivotal role in the academic community. However, the h-index suffers from
several limitations. This paper introduces the SCIENCE-index, a
blockchain-based metric measuring a researcher's scientific contributions.
Utilizing the Microsoft Academic Graph and machine learning techniques, the
SCIENCE-index predicts the progress made by a researcher over their career and
provides a soft incentive for sharing their datasets with peer researchers. To
incentivize researchers to share their data, the SCIENCE-index is augmented to
include a data-sharing parameter. DataCite, a database of openly available
datasets, proxies this parameter, which is further enhanced by including a
researcher's data-sharing activity. Our model is evaluated by comparing the
distribution of its output for geographically diverse researchers to that of
the h-index. We observe that it results in a much more even spread of
evaluations. The SCIENCE-index is a crucial component in constructing a
decentralized protocol that promotes trust-based data sharing, addressing the
current inequity in dataset sharing. The work outlined in this paper provides
the foundation for assessing scientific contributions in future data-sharing
spaces powered by decentralized applications.
- Abstract(参考訳): 現在の学術的な状況では、データ収集のプロセスは遅く、データコラボレーションのためのラックスインフラストラクチャーは決定的な発見を思いつき、広めるのにかなりの遅延をもたらす。
そのため、研究者間の協調的なデータ共有活動を促進し、報奨する安全でスケーラブルで信頼性の高いデータ共有エコシステムの必要性が高まり、この目的を達成するためには、強固なインセンティブ機構が必要である。
h-インデックスのような意見に基づくインセンティブは、歴史的に学術コミュニティにおいて重要な役割を担ってきた。
しかし、h-indexにはいくつかの制限がある。
本稿では、研究者の科学的貢献を測定するブロックチェーンベースのメトリクスであるSCIENCE-indexを紹介する。
Microsoft Academic Graphと機械学習技術を利用することで、SCIENCE-indexは研究者のキャリアにおける進歩を予測し、データセットを仲間の研究者と共有するためのソフトインセンティブを提供する。
研究者にデータ共有のインセンティブを与えるため、SCIENCE-indexはデータ共有パラメータを含むように拡張されている。
公開されているデータセットのデータベースであるDataCiteはこのパラメータをプロキシしており、研究者のデータ共有アクティビティを含めることでさらに強化されている。
本モデルは, 地理的に多様な研究者の出力分布とh-indexの分布を比較して評価する。
私たちは、それがより一層評価の広がりをもたらすことを観察する。
SCIENCE-indexは、データセット共有における現在の不平等に対処する、信頼ベースのデータ共有を促進する分散プロトコルを構築する上で、重要なコンポーネントである。
本稿では,分散アプリケーションを活用した将来のデータ共有空間における科学的貢献度を評価する基盤を提供する。
関連論文リスト
- Pennsieve: A Collaborative Platform for Translational Neuroscience and Beyond [0.5130659559809153]
Pennsieveはオープンソースでクラウドベースの科学データ管理プラットフォームである。
複雑なマルチモーダルデータセットをサポートし、データの視覚化と分析のためのツールを提供する。
Pennsieveは125TB以上の科学的データを格納し、350以上のハイインパクトデータセットで35TB以上のデータを公開している。
論文 参考訳(メタデータ) (2024-09-16T17:55:58Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - DataPerf: Benchmarks for Data-Centric AI Development [81.03754002516862]
DataPerfは、MLデータセットとデータ中心アルゴリズムを評価するための、コミュニティ主導のベンチマークスイートである。
私たちは、この反復的な開発をサポートするために、複数の課題を抱えたオープンなオンラインプラットフォームを提供しています。
ベンチマーク、オンライン評価プラットフォーム、ベースライン実装はオープンソースである。
論文 参考訳(メタデータ) (2022-07-20T17:47:54Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Subdivisions and Crossroads: Identifying Hidden Community Structures in
a Data Archive's Citation Network [1.6631602844999724]
本稿では学術出版物に引用されるデータセットの権威ネットワークのコミュニティ構造を解析する。
共有データを用いた社会科学データセットと研究分野のコミュニティを同定する。
本研究は、データ再利用の隠れ構造を明らかにし、学際的な研究コミュニティがデータセットを共有科学的なインプットとして構成する方法を実証する。
論文 参考訳(メタデータ) (2022-05-17T14:18:49Z) - DeepShovel: An Online Collaborative Platform for Data Extraction in
Geoscience Literature with AI Assistance [48.55345030503826]
地質学者は、関連する結果やデータを発見、抽出、集約するために膨大な量の文献を読む必要がある。
DeepShovelは、彼らのニーズをサポートするAI支援データ抽出システムである。
14人の研究者によるユーザ評価の結果、DeepShovelは科学データベース構築のためのデータ抽出の効率を改善した。
論文 参考訳(メタデータ) (2022-02-21T12:18:08Z) - Yes-Yes-Yes: Donation-based Peer Reviewing Data Collection for ACL
Rolling Review and Beyond [58.71736531356398]
本稿では、ピアレビューデータについて詳細な議論を行い、ピアレビューデータ収集のための倫理的・法的デシダータの概要を述べるとともに、最初の継続的な寄付ベースのデータ収集ワークフローを提案する。
本稿では、ACL Rolling Reviewにおいて、このワークフローの現在進行中の実装について報告し、新たに収集したデータから得られた最初の洞察を提供する。
論文 参考訳(メタデータ) (2022-01-27T11:02:43Z) - Reduced, Reused and Recycled: The Life of a Dataset in Machine Learning
Research [3.536605202672355]
我々は,データセットの利用パターンが,2015年から2020年にかけての機械学習サブコミュニティと時間にわたってどのように異なるかを検討した。
タスクコミュニティ内のデータセットに対する濃度の増加,タスクからのデータセットの大幅な採用,少数のエリート機関内に研究者が導入したデータセットへの集中,などが確認できた。
論文 参考訳(メタデータ) (2021-12-03T05:01:47Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。