Fugu-MT 論文翻訳(概要): Computational Reproducibility of R Code Supplements on OSF

論文の概要: Computational Reproducibility of R Code Supplements on OSF

arxiv url: http://arxiv.org/abs/2505.21590v1
Date: Tue, 27 May 2025 13:06:38 GMT
ステータス: 翻訳完了
システム内更新日: 2025-05-29 17:35:50.191859
Title: Computational Reproducibility of R Code Supplements on OSF
Title（参考訳）: OSF上のRコードサプリメントの計算的再現性
Authors: Lorraine Saju, Tobias Holtdirk, Meetkumar Pravinbhai Mangroliya, Arnim Bleier,
Abstract要約: 多くのコードサプリメントは、計算環境を再現するために必要なドキュメントを欠いている。本研究では,StatCodeSearchデータセットを用いて296のRプロジェクトの計算結果を評価する。プロジェクトソースコードから直接計算環境を再構築する自動パイプラインを開発した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Computational reproducibility is fundamental to scientific research, yet many published code supplements lack the necessary documentation to recreate their computational environments. While researchers increasingly share code alongside publications, the actual reproducibility of these materials remains poorly understood. In this work, we assess the computational reproducibility of 296 R projects using the StatCodeSearch dataset. Of these, only 264 were still retrievable, and 98.8% lacked formal dependency descriptions required for successful execution. To address this, we developed an automated pipeline that reconstructs computational environments directly from project source code. Applying this pipeline, we executed the R scripts within custom Docker containers and found that 25.87% completed successfully without error. We conducted a detailed analysis of execution failures, identifying reproducibility barriers such as undeclared dependencies, invalid file paths, and system-level issues. Our findings show that automated dependency inference and containerisation can support scalable verification of computational reproducibility and help identify practical obstacles to code reuse and transparency in scientific research.
Abstract（参考訳）: 計算再現性は科学研究の基本であるが、多くのコードサプリメントは計算環境を再現するために必要なドキュメントを欠いている。研究者は出版物とともにコードを共有する傾向にあるが、これらの資料の実際の再現性はいまだに理解されていない。本研究では,StatCodeSearchデータセットを用いて296のRプロジェクトの計算再現性を評価する。これらのうち、まだ264しか回収できず、98.8%は実行を成功させるために必要な公式な依存関係記述を欠いていた。そこで我々は,プロジェクトソースコードから直接計算環境を再構築する自動パイプラインを開発した。このパイプラインを適用して、カスタムDockerコンテナ内でRスクリプトを実行し、エラーなく25.87%が正常に完了したことが分かった。我々は、実行障害の詳細な分析を行い、未宣言の依存関係、無効なファイルパス、システムレベルの問題などの再現可能性障壁を特定した。自動依存関係推論とコンテナ化は、計算再現性のスケーラブルな検証を支援し、科学的研究におけるコードの再利用と透明性の実践的障害を特定するのに役立つことを示す。

関連論文リスト

AI Copilots for Reproducibility in Science: A Case Study [2.9057981978152116]
本稿では、研究者、レビュアー、読者をサポートするAIベースのプラットフォームであるOpenPubを紹介する。本研究では, 原稿, コード, 補足資料を分析し, 構造化Jupyterノートブックを生成するReproducibility Copilotを提案する。その結果、OpenPubは、計算再生に適した数値、表、結果の高カバレッジを実現しつつ、大幅な再生時間を短縮できることがわかった。
論文参考訳（メタデータ） (2025-06-25T04:56:28Z)
AutoReproduce: Automatic AI Experiment Reproduction with Paper Lineage [64.11446484075157]
AutoReproduceは、研究論文に記載された実験をエンドツーエンドで自動再生できるフレームワークである。結果は、AutoReproduceが平均的なパフォーマンスギャップを22.1%$で達成していることを示している。
論文参考訳（メタデータ） (2025-05-27T03:15:21Z)
SciReplicate-Bench: Benchmarking LLMs in Agent-driven Algorithmic Reproduction from Research Papers [16.80818230868491]
本研究では,最近のNLP論文のアルゴリズム記述からコードを生成する際の言語モデル (LLM) を評価する。厳密な評価を容易にするため、2024年に発行された36のNLP論文から100のタスクのベンチマークであるSciReplicate-Benchを紹介する。 SciReplicate-Bench上に構築されたSci-Reproducerは,論文からアルゴリズムの概念を解釈するPaper Agentと,リポジトリから依存関係を検索してソリューションを実装するCode Agentから構成されるマルチエージェントフレームワークである。
論文参考訳（メタデータ） (2025-03-31T22:02:24Z)
Can Language Models Replace Programmers for Coding? REPOCOD Says 'Not Yet' [9.48622608877252]
大規模言語モデル(LLM)の機能を評価するために、多くのリポジトリレベルのコード生成ベンチマークが登場した。これらのベンチマークは、短い補完、合成例、または限られたスケールのリポジトリに焦点を当て、現実世界のコーディングタスクを表現できない。実世界の大規模プロジェクトで現実的な依存関係を持つ複雑なタスクを含むPythonコード生成ベンチマークであるREPOCODを作成します。
論文参考訳（メタデータ） (2024-10-29T01:21:05Z)
Codev-Bench: How Do LLMs Understand Developer-Centric Code Completion? [60.84912551069379]
Code-Development Benchmark (Codev-Bench)は、細粒度で現実世界、リポジトリレベル、開発者中心の評価フレームワークです。 Codev-Agentは、リポジトリのクローリングを自動化し、実行環境を構築し、既存のユニットテストから動的呼び出しチェーンを抽出し、データ漏洩を避けるために新しいテストサンプルを生成するエージェントベースのシステムである。
論文参考訳（メタデータ） (2024-10-02T09:11:10Z)
Tractable Offline Learning of Regular Decision Processes [50.11277112628193]
この研究は、正則決定過程(RDP)と呼ばれる非マルコフ環境のクラスにおけるオフライン強化学習(RL)を研究する。インスは、未来の観測と過去の相互作用からの報酬の未知の依存を実験的に捉えることができる。多くのアルゴリズムは、まずこの未知の依存関係を自動学習技術を用いて再構築する。
論文参考訳（メタデータ） (2024-09-04T14:26:58Z)
Hierarchical Context Pruning: Optimizing Real-World Code Completion with Repository-Level Pretrained Code LLMs [24.00351065427465]
本稿では,階層型コンテキストプルーニング(HCP)という戦略を提案し,高い情報量を持つコンプリートプロンプトを構築する。 HCPは関数レベルでコードリポジトリをモデル化し、コードファイル間のトポロジ的な依存関係を維持しながら、大量の無関係なコードコンテンツを削除する。
論文参考訳（メタデータ） (2024-06-26T12:26:16Z)
On the Impacts of Contexts on Repository-Level Code Generation [5.641402231731082]
本稿ではレポジトリレベルのコード生成を評価するために設計された新しいベンチマークであるRepoExecを紹介する。実行可能性、包括的なテストケース生成による機能的正当性、ファイル間のコンテキストの正確な利用という3つの重要な側面に注目します。
論文参考訳（メタデータ） (2024-06-17T10:45:22Z)
On The Importance of Reasoning for Context Retrieval in Repository-Level Code Editing [82.96523584351314]
我々は、コンテキスト検索のタスクをリポジトリレベルのコード編集パイプラインの他のコンポーネントと分離する。我々は、推論が収集された文脈の精度を向上させるのに役立っているが、それでもその十分性を識別する能力は欠如していると結論づける。
論文参考訳（メタデータ） (2024-06-06T19:44:17Z)
RepoCoder: Repository-Level Code Completion Through Iterative Retrieval and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文参考訳（メタデータ） (2023-03-22T13:54:46Z)
Deconstructing Self-Supervised Monocular Reconstruction: The Design Decisions that Matter [63.5550818034739]
本稿では,自己教師付き単分子深度推定への最先端の貢献を評価するための枠組みを提案する。事前トレーニング、バックボーン、アーキテクチャ設計の選択、損失関数が含まれる。我々は16の最先端コントリビューションを再実装し、検証し、再評価し、新しいデータセットを導入します。
論文参考訳（メタデータ） (2022-08-02T14:38:53Z)
[not Rp] Reproducibility of 'Poincare dodecahedral space parameter estimates' [0.0]
本論文は,2008年に発表された宇宙トポロジ観測論文を再現する試みである。再生ステップは、無償ライセンスのgitリポジトリパッケージ "0807.4260" で正式に定義される。
論文参考訳（メタデータ） (2020-07-23T21:56:21Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。