論文の概要: ReproduceMeGit: A Visualization Tool for Analyzing Reproducibility of
Jupyter Notebooks
- arxiv url: http://arxiv.org/abs/2006.12110v1
- Date: Mon, 22 Jun 2020 10:05:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-13 05:20:20.153915
- Title: ReproduceMeGit: A Visualization Tool for Analyzing Reproducibility of
Jupyter Notebooks
- Title(参考訳): ReproduceMeGit:Jupyterノートブックの再現性を分析する可視化ツール
- Authors: Sheeba Samuel and Birgitta K\"onig-Ries
- Abstract要約: 本稿では、Jupyter NotebooksのGitHubを分析する可視化ツールであるReproduceMeGitを紹介する。
このツールは、再現可能なノートブックの数、例外となったノートブック数、オリジナルのノートブックと異なる結果を得たノートブック数などの情報を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational notebooks have gained widespread adoption among researchers
from academia and industry as they support reproducible science. These
notebooks allow users to combine code, text, and visualizations for easy
sharing of experiments and results. They are widely shared in GitHub, which
currently has more than 100 million repositories making it the largest host of
source code in the world. Recent reproducibility studies have indicated that
there exist good and bad practices in writing these notebooks which can affect
their overall reproducibility. We present ReproduceMeGit, a visualization tool
for analyzing the reproducibility of Jupyter Notebooks. This will help
repository users and owners to reproduce and directly analyze and assess the
reproducibility of any GitHub repository containing Jupyter Notebooks. The tool
provides information on the number of notebooks that were successfully
reproducible, those that resulted in exceptions, those with different results
from the original notebooks, etc. Each notebook in the repository along with
the provenance information of its execution can also be exported in RDF with
the integration of the ProvBook tool.
- Abstract(参考訳): 計算ノートは再現可能な科学をサポートするため、学術や産業の研究者の間で広く採用されている。
これらのノートブックを使えば、ユーザーはコード、テキスト、視覚化を組み合わせて実験結果を簡単に共有できる。
それらはgithubで広く共有されており、現在1億以上のリポジトリがあり、世界最大のソースコードホストとなっている。
最近の再現性研究では、これらのノートを書く際に、その全体的な再現性に影響を与える良い方法と悪い方法が存在することが示されている。
本稿では,Jupyter Notebookの再現性を分析する可視化ツールReproduceMeGitを紹介する。
これにより、リポジトリのユーザとオーナーは、Jupyter Notebooksを含むGitHubリポジトリの再現性を再現し、直接分析し、評価することができる。
このツールは、うまく再現できたノート数、例外が発生したノート数、元のノートと異なる結果を持つノート数などの情報を提供する。
リポジトリ内の各ノートブックとその実行のプロヴァンス情報とともに、provbookツールの統合によりrdfにエクスポートすることもできる。
関連論文リスト
- CodeRAG-Bench: Can Retrieval Augment Code Generation? [78.37076502395699]
検索拡張生成を用いたコード生成の系統的,大規模な解析を行う。
まず、コード生成タスクの3つのカテゴリを含む総合的な評価ベンチマークであるCodeRAG-Benchをキュレートする。
CodeRAG-Bench上のトップパフォーマンスモデルについて、1つまたは複数のソースから検索したコンテキストを提供することにより検討する。
論文 参考訳(メタデータ) (2024-06-20T16:59:52Z) - How to Understand Whole Software Repository? [64.19431011897515]
リポジトリ全体に対する優れた理解は、自動ソフトウェアエンジニアリング(ASE)への重要な道になるでしょう。
本研究では,リポジトリ全体を包括的に理解するためのエージェントによるRepoUnderstanderという新しい手法を開発した。
リポジトリレベルの知識をより活用するために、エージェントをまとめ、分析し、計画する。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - Collaborative, Code-Proximal Dynamic Software Visualization within Code
Editors [55.57032418885258]
本稿では,コードエディタに組み込むソフトウェアビジュアライゼーション手法の設計と実装について紹介する。
私たちのコントリビューションは、ソフトウェアシステムの実行時の動作の動的解析を使用するという点で、関連する作業と異なります。
私たちの視覚化アプローチは、一般的なリモートペアプログラミングツールを強化し、共有コード都市を利用することで協調的に使用できます。
論文 参考訳(メタデータ) (2023-08-30T06:35:40Z) - SuperNOVA: Design Strategies and Opportunities for Interactive Visualization in Computational Notebooks [34.04783941358773]
ノートブックの対話型可視化ツール163について分析する。
重要な設計上の意味とトレードオフを特定します。
我々は、研究者が既存のノートブック視覚化ツールを探索するのに役立つオープンソースのインタラクティブブラウザであるSuperNOVAを開発した。
論文 参考訳(メタデータ) (2023-05-04T17:57:54Z) - RepoCoder: Repository-Level Code Completion Through Iterative Retrieval
and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。
類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。
バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-03-22T13:54:46Z) - Static Analysis Driven Enhancements for Comprehension in Machine Learning Notebooks [7.142786325863891]
Jupyterノートブックを使えば、開発者はリッチテキストとインラインビジュアライゼーションでコードスニペットをインターリーブできる。
最近の研究では、Jupyterノートの大部分が文書化されておらず、物語構造が欠けていることが示されている。
本稿では、コードセルに分類型マークダウンヘッダーを付加する新しいツールベースのアプローチであるHeaderGenを提案する。
論文 参考訳(メタデータ) (2023-01-11T11:57:52Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Pynblint: a Static Analyzer for Python Jupyter Notebooks [10.190501703364234]
Pynblintは、Pythonで書かれたJupyterノートブックの静的アナライザである。
経験的に検証されたベストプラクティスのセットで、ノートブック(および周辺のリポジトリ)のコンプライアンスをチェックする。
論文 参考訳(メタデータ) (2022-05-24T09:56:03Z) - Repro: An Open-Source Library for Improving the Reproducibility and
Usability of Publicly Available Research Code [74.28810048824519]
Reproは、研究コードのユーザビリティ向上を目的とした、オープンソースのライブラリである。
Dockerコンテナ内で研究者がリリースしたソフトウェアを実行するための軽量Python APIを提供する。
論文 参考訳(メタデータ) (2022-04-29T01:54:54Z) - StickyLand: Breaking the Linear Presentation of Computational Notebooks [5.1175396458764855]
StickyLandはノートブックの拡張機能で、ユーザは自由にコードをリニアな方法で整理できる。
常に画面に表示される粘着性のあるセルを使えば、ユーザーはノートに素早くアクセスでき、実験結果をすぐに観察でき、インタラクティブなダッシュボードを簡単に構築できる。
論文 参考訳(メタデータ) (2022-02-22T18:25:54Z) - You Only Write Thrice: Creating Documents, Computational Notebooks and
Presentations From a Single Source [11.472707084860875]
学術的な取引では、異なるフォーマットで発行された同じコンテンツの複数の変種をジャグリングする必要がある。
本稿では,バージョン管理環境における単一ソース文書の維持により,この負担を大幅に軽減することを提案する。
私たちは、Jupyter Book(オンラインドキュメント)、Jupyter Notebook(計算物語)を構成する概念実証ワークフローを提供し、単一のマークダウンソースファイルから.jsスライドを明らかにする。
論文 参考訳(メタデータ) (2021-07-02T21:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。