論文の概要: Reproducibility Needs Reshape Scientific Data Governance
- arxiv url: http://arxiv.org/abs/2410.12800v1
- Date: Sun, 29 Sep 2024 22:13:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-20 10:10:20.618901
- Title: Reproducibility Needs Reshape Scientific Data Governance
- Title(参考訳): 再現性は科学データガバナンスを形作る必要がある
- Authors: Paul Meijer, Yousef Aggoune, Madeline Ambrose, Aldan Beaubien, James Harvey, Nicole Howard, Neelima Inala, Ed Johnson, Autumn Kelsey, Melissa Kinsey, Jessica Liang, Paul Mariz, Stark Pister, Sathya Subramanian, Vitalii Tereshchenko, Anne Vetto,
- Abstract要約: データガバナンスは、研究ライフサイクル全体を通してデータの有用性を最大化するのを優先すべきである。
積極的な分析とデータガバナンスは、研究ライフサイクル管理の不可欠な、相互接続されたコンポーネントである。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Scientific data governance should prioritize maximizing the utility of data throughout the research lifecycle. Research software systems that enable analysis reproducibility inform data governance policies and assist administrators in setting clear guidelines for data reuse, data retention, and the management of scientific computing needs. Proactive analysis reproducibility and data governance are integral and interconnected components of research lifecycle management.
- Abstract(参考訳): 科学データガバナンスは、研究ライフサイクルを通してデータの有用性を最大化することを優先すべきである。
分析再現性を実現する研究ソフトウェアシステムは、データガバナンスポリシーを通知し、データ再利用、データ保持、および科学計算のニーズの管理のための明確なガイドラインを設定する管理者を支援する。
積極的な分析再現性とデータガバナンスは、研究ライフサイクル管理の不可欠な、相互接続されたコンポーネントである。
関連論文リスト
- Continuous Analysis: Evolution of Software Engineering and Reproducibility for Science [0.0]
本稿では,科学研究における課題を解決するために,連続分析の概念を紹介する。
CAを採用することで、科学コミュニティは研究成果の妥当性と一般化性を確保することができる。
論文 参考訳(メタデータ) (2024-11-04T17:11:08Z) - Data-Centric AI in the Age of Large Language Models [51.20451986068925]
本稿では,大規模言語モデル(LLM)に着目した,AI研究におけるデータ中心の視点を提案する。
本研究では,LLMの発達段階(事前学習や微調整など)や推論段階(文脈内学習など)において,データが有効であることを示す。
データを中心とした4つのシナリオを特定し、データ中心のベンチマークとデータキュレーション、データ属性、知識伝達、推論コンテキスト化をカバーします。
論文 参考訳(メタデータ) (2024-06-20T16:34:07Z) - Exploring Data Management Challenges and Solutions in Agile Software Development: A Literature Review and Practitioner Survey [4.45543024542181]
ソフトウェア製品とその開発に関連するデータを管理することは、ソフトウェアプロジェクトやアジャイルチームにとって大きな課題となる。
課題には、さまざまなソースからのデータを統合し、継続的な変更と適応の観点からデータ品質を保証することが含まれる。
論文 参考訳(メタデータ) (2024-02-01T10:07:12Z) - Data Management For Training Large Language Models: A Survey [64.18200694790787]
大規模言語モデル(LLM)のトレーニングにおいて、データは基本的な役割を果たす
本調査は,LLMの事前学習および微調整段階におけるデータ管理の現状を概観するものである。
論文 参考訳(メタデータ) (2023-12-04T07:42:16Z) - Transforming Agriculture with Intelligent Data Management and Insights [3.027257459810039]
現代の農業は、気候変動と天然資源の枯渇の制約の下で、食料、燃料、飼料、繊維の需要の増加に対応するための大きな課題に直面している。
データ革新は、アグロエコシステムの生産性、持続可能性、レジリエンスの確保と改善に緊急に必要です。
論文 参考訳(メタデータ) (2023-11-07T22:02:54Z) - On Responsible Machine Learning Datasets with Fairness, Privacy, and Regulatory Norms [56.119374302685934]
AI技術の信頼性に関する深刻な懸念があった。
機械学習とディープラーニングのアルゴリズムは、開発に使用されるデータに大きく依存する。
本稿では,責任あるルーブリックを用いてデータセットを評価するフレームワークを提案する。
論文 参考訳(メタデータ) (2023-10-24T14:01:53Z) - Towards Data-centric Graph Machine Learning: Review and Outlook [120.64417630324378]
データ中心グラフ機械学習(DC-GML)という,グラフデータライフサイクルのすべての段階を包含する体系的なフレームワークを導入する。
各段階の完全な分類法が示され、3つの重要なグラフ中心の質問に答える。
我々は、DC-GMLドメインの将来展望を指摘し、その進歩と応用をナビゲートするための洞察を提供する。
論文 参考訳(メタデータ) (2023-09-20T00:40:13Z) - Mapping and Comparing Data Governance Frameworks: A benchmarking
exercise to inform global data governance deliberations [0.0]
この記事は、データの急速な成長と責任あるデータ利用と保護の必要性による、グローバルデータガバナンスの重要性の高まりについて説明する。
報告書は、データのグローバルフローを責任を持って、そして公共の関心のために管理するための、より包括的な、協調的なデータガバナンスアプローチの必要性を強調している。
論文 参考訳(メタデータ) (2023-02-27T12:56:25Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Nine Best Practices for Research Software Registries and Repositories: A
Concise Guide [63.52960372153386]
私たちは、マネージャが個々のレジストリやリポジトリを管理するスコープ、プラクティス、ルールを定義するのに役立つ9つのベストプラクティスのセットを提示します。
これらのベストプラクティスは、2011年と2012年にForce11ソフトウェア実装ワーキンググループのタスクフォースによって招集された、既存のリソースの作成者の経験から抽出された。
論文 参考訳(メタデータ) (2020-12-24T05:37:54Z) - DataFed: Towards Reproducible Research via Federated Data Management [0.0]
DataFedは軽量で分散した科学データ管理システムである。
それは、ゆるやかに結合された科学施設のネットワーク内のストレージシステムの連合にまたがる。
論文 参考訳(メタデータ) (2020-04-07T21:05:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。