論文の概要: Managing Software Provenance to Enhance Reproducibility in Computational
Research
- arxiv url: http://arxiv.org/abs/2308.15637v2
- Date: Wed, 20 Dec 2023 02:21:59 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-21 19:01:17.394613
- Title: Managing Software Provenance to Enhance Reproducibility in Computational
Research
- Title(参考訳): 計算研究における再現性を高めるためのソフトウェアプロヴァンス管理
- Authors: Akash Dhruv, Anshu Dubey
- Abstract要約: 計算に基づく科学研究の管理は、個人の好みと研究の性質に基づいて実験を設計する個々の研究者に委ねられることが多い。
我々は、研究者がトレーサビリティーの明確な記録を提供するための実行環境を明示的に作成することで、計算に基づく科学研究の品質、効率、そして改善できると考えている。
- 参考スコア(独自算出の注目度): 1.1421942894219899
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Scientific processes rely on software as an important tool for data
acquisition, analysis, and discovery. Over the years sustainable software
development practices have made progress in being considered as an integral
component of research. However, management of computation-based scientific
studies is often left to individual researchers who design their computational
experiments based on personal preferences and the nature of the study. We
believe that the quality, efficiency, and reproducibility of computation-based
scientific research can be improved by explicitly creating an execution
environment that allows researchers to provide a clear record of traceability.
This is particularly relevant to complex computational studies in
high-performance computing (HPC) environments. In this article, we review the
documentation required to maintain a comprehensive record of HPC computational
experiments for reproducibility. We also provide an overview of tools and
practices that we have developed to perform such studies around Flash-X, a
multi-physics scientific software.
- Abstract(参考訳): 科学的プロセスは、データ取得、分析、発見の重要なツールとしてソフトウェアに依存している。
長年にわたり、持続可能なソフトウェア開発の実践は、研究の不可欠なコンポーネントであると考えられてきた。
しかしながら、計算に基づく科学研究の管理は、個人の好みと研究の性質に基づいて計算実験を設計する個々の研究者に委ねられることが多い。
計算に基づく科学的研究の質、効率、再現性は、研究者がトレーサビリティの明確な記録を提供するための実行環境を明示的に作成することによって改善できると考えている。
これはハイパフォーマンスコンピューティング(HPC)環境での複雑な計算研究に特に関係している。
本稿では,hpc計算実験の包括的な記録と再現性を維持するために必要な文書について述べる。
我々はまた、多分野の科学ソフトウェアであるFlash-Xに関する研究を行うために開発したツールやプラクティスの概要も提供している。
関連論文リスト
- MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - MLXP: A Framework for Conducting Replicable Experiments in Python [63.37350735954699]
MLXPはPythonをベースとした,オープンソースの,シンプルで,軽量な実験管理ツールである。
実験プロセスを最小限のオーバーヘッドで合理化し、高いレベルの実践的オーバーヘッドを確保します。
論文 参考訳(メタデータ) (2024-02-21T14:22:20Z) - Ten simple rules for teaching sustainable software engineering [0.0]
高品質な研究ソフトウェアを開発するには、多くのソフトウェア開発スキルを開発する必要がある。
計算研究における基礎的・優れた開発プラクティスの確保に重点が置かれている。
10 Simple Rulesコレクションの最近の記事は、生物学の学生にコンピュータサイエンスとコーディング技術の教育について論じている。
我々は、科学者が持続可能なソフトウェアパッケージを開発するために必要なスキルを効果的に教えるための具体的な手順を説明することによって、この議論を進める。
論文 参考訳(メタデータ) (2024-02-07T10:16:20Z) - A pragmatic workflow for research software engineering in computational
science [0.0]
コンピュータサイエンス・エンジニアリング(CSE)の大学研究グループには、通常、研究ソフトウェア工学(RSE)のための専用の資金と人員が不足している。
RSEは、持続可能な研究ソフトウェア開発と再現可能な結果から焦点をシフトします。
本稿では,これらの課題に対処し,CSEにおける研究成果の質を向上させるためのRSEワークフローを提案する。
論文 参考訳(メタデータ) (2023-10-02T08:04:12Z) - Using Machine Learning To Identify Software Weaknesses From Software
Requirement Specifications [49.1574468325115]
本研究は、要求仕様からソフトウェア弱点を特定するための効率的な機械学習アルゴリズムを見つけることに焦点を当てる。
ProMISE_exp. Naive Bayes、サポートベクターマシン(SVM)、決定木、ニューラルネットワーク、畳み込みニューラルネットワーク(CNN)アルゴリズムをテストした。
論文 参考訳(メタデータ) (2023-08-10T13:19:10Z) - A Backend Platform for Supporting the Reproducibility of Computational
Experiments [2.1485350418225244]
同じフレームワークやコード、データソース、プログラミング言語、依存関係などを使って、同じ環境を再現することは困難です。
本研究では,実験の共有,構成,パッケージング,実行を可能にする統合開発環境を提案する。
これらの実験の20(80%)を再現し,その成果を最小限の努力で得られた。
論文 参考訳(メタデータ) (2023-06-29T10:29:11Z) - A Metadata-Based Ecosystem to Improve the FAIRness of Research Software [0.3185506103768896]
研究ソフトの再利用は、研究効率と学術交流の中心である。
DataDescエコシステムは、詳細でマシン操作可能なメタデータを備えたソフトウェアインターフェースのデータモデルを記述するためのアプローチである。
論文 参考訳(メタデータ) (2023-06-18T19:01:08Z) - PyExperimenter: Easily distribute experiments and track results [63.871474825689134]
PyExperimenterは、アルゴリズムの実験的な研究結果のセットアップ、ドキュメンテーション、実行、およびその後の評価を容易にするツールである。
人工知能の分野で研究者が使用することを意図しているが、それらに限定されていない。
論文 参考訳(メタデータ) (2023-01-16T10:43:02Z) - Caching and Reproducibility: Making Data Science experiments faster and
FAIRer [25.91002326340444]
小規模から中規模のデータサイエンス実験は、個々の科学者や小さなチームによってアドホックに開発された研究ソフトウェアに依存していることが多い。
コードの最初の行が書かれる前にも、キャッシュを研究ソフトウェア開発プロセスの不可欠な部分にすることを提案します。
論文 参考訳(メタデータ) (2022-11-08T07:11:02Z) - Research Trends and Applications of Data Augmentation Algorithms [77.34726150561087]
我々は,データ拡張アルゴリズムの適用分野,使用するアルゴリズムの種類,重要な研究動向,時間経過に伴う研究の進展,およびデータ拡張文学における研究ギャップを同定する。
我々は、読者がデータ拡張の可能性を理解し、将来の研究方向を特定し、データ拡張研究の中で質問を開くことを期待する。
論文 参考訳(メタデータ) (2022-07-18T11:38:32Z) - Distributed intelligence on the Edge-to-Cloud Continuum: A systematic
literature review [62.997667081978825]
このレビューは、現在利用可能な機械学習とデータ分析のための最先端ライブラリとフレームワークに関する包括的なビジョンを提供することを目的としている。
現在利用可能なEdge-to-Cloud Continuumに関する実験的な研究のための、主要なシミュレーション、エミュレーション、デプロイメントシステム、テストベッドも調査されている。
論文 参考訳(メタデータ) (2022-04-29T08:06:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。