論文の概要: ReproduceMeGit: A Visualization Tool for Analyzing Reproducibility of
Jupyter Notebooks
- arxiv url: http://arxiv.org/abs/2006.12110v1
- Date: Mon, 22 Jun 2020 10:05:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-13 05:20:20.153915
- Title: ReproduceMeGit: A Visualization Tool for Analyzing Reproducibility of
Jupyter Notebooks
- Title(参考訳): ReproduceMeGit:Jupyterノートブックの再現性を分析する可視化ツール
- Authors: Sheeba Samuel and Birgitta K\"onig-Ries
- Abstract要約: 本稿では、Jupyter NotebooksのGitHubを分析する可視化ツールであるReproduceMeGitを紹介する。
このツールは、再現可能なノートブックの数、例外となったノートブック数、オリジナルのノートブックと異なる結果を得たノートブック数などの情報を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Computational notebooks have gained widespread adoption among researchers
from academia and industry as they support reproducible science. These
notebooks allow users to combine code, text, and visualizations for easy
sharing of experiments and results. They are widely shared in GitHub, which
currently has more than 100 million repositories making it the largest host of
source code in the world. Recent reproducibility studies have indicated that
there exist good and bad practices in writing these notebooks which can affect
their overall reproducibility. We present ReproduceMeGit, a visualization tool
for analyzing the reproducibility of Jupyter Notebooks. This will help
repository users and owners to reproduce and directly analyze and assess the
reproducibility of any GitHub repository containing Jupyter Notebooks. The tool
provides information on the number of notebooks that were successfully
reproducible, those that resulted in exceptions, those with different results
from the original notebooks, etc. Each notebook in the repository along with
the provenance information of its execution can also be exported in RDF with
the integration of the ProvBook tool.
- Abstract(参考訳): 計算ノートは再現可能な科学をサポートするため、学術や産業の研究者の間で広く採用されている。
これらのノートブックを使えば、ユーザーはコード、テキスト、視覚化を組み合わせて実験結果を簡単に共有できる。
それらはgithubで広く共有されており、現在1億以上のリポジトリがあり、世界最大のソースコードホストとなっている。
最近の再現性研究では、これらのノートを書く際に、その全体的な再現性に影響を与える良い方法と悪い方法が存在することが示されている。
本稿では,Jupyter Notebookの再現性を分析する可視化ツールReproduceMeGitを紹介する。
これにより、リポジトリのユーザとオーナーは、Jupyter Notebooksを含むGitHubリポジトリの再現性を再現し、直接分析し、評価することができる。
このツールは、うまく再現できたノート数、例外が発生したノート数、元のノートと異なる結果を持つノート数などの情報を提供する。
リポジトリ内の各ノートブックとその実行のプロヴァンス情報とともに、provbookツールの統合によりrdfにエクスポートすることもできる。
関連論文リスト
- ReGAL: Refactoring Programs to Discover Generalizable Abstractions [66.37493420911979]
Generalizable Abstraction Learning (ReGAL)は、コードカプセル化によって再利用可能な関数のライブラリを学ぶ方法である。
ReGALによって発見された共有関数ライブラリは、プログラムが様々な領域で容易に予測できることを示している。
CodeLlama-13Bでは、ReGALはグラフィックスで11.5%、日付理解で26.1%、MinecraftベースのテキストゲームであるTextCraftで8.1%という絶対的な精度向上を実現している。
論文 参考訳(メタデータ) (2024-01-29T18:45:30Z) - Collaborative, Code-Proximal Dynamic Software Visualization within Code
Editors [55.57032418885258]
本稿では,コードエディタに組み込むソフトウェアビジュアライゼーション手法の設計と実装について紹介する。
私たちのコントリビューションは、ソフトウェアシステムの実行時の動作の動的解析を使用するという点で、関連する作業と異なります。
私たちの視覚化アプローチは、一般的なリモートペアプログラミングツールを強化し、共有コード都市を利用することで協調的に使用できます。
論文 参考訳(メタデータ) (2023-08-30T06:35:40Z) - Notably Inaccessible -- Data Driven Understanding of Data Science
Notebook (In)Accessibility [13.428631054625797]
各種アクセシビリティ問題を特定するために,10000 Jupyter ノートの大規模システム解析を行った。
ノートのアーティファクトのアクセシビリティ向上,オーサリングプラクティスの提案,ノートブックのアクセス性向上のためのインフラストラクチャの変更を提案する。
論文 参考訳(メタデータ) (2023-08-07T01:33:32Z) - Private-Library-Oriented Code Generation with Large Language Models [52.73999698194344]
本稿では,大規模言語モデル(LLM)をプライベートライブラリのコード生成に活用することに焦点を当てる。
プログラマがプライベートコードを書く過程をエミュレートする新しいフレームワークを提案する。
TorchDataEval、TorchDataComplexEval、MonkeyEval、BeatNumEvalの4つのプライベートライブラリベンチマークを作成しました。
論文 参考訳(メタデータ) (2023-07-28T07:43:13Z) - SuperNOVA: Design Strategies and Opportunities for Interactive
Visualization in Computational Notebooks [12.922842159000373]
ノートブックにおける視覚分析(VA)ツールの適切な設計について検討する。
本分析では,学術論文から得られた62のシステムと,55kのノートブックから得られた103のシステムを含む。
我々は、研究者が既存のノートブックVAツールを探索し、関連する作業を探すのに役立つオープンソースのインタラクティブツールであるSuperNOVAを開発した。
論文 参考訳(メタデータ) (2023-05-04T17:57:54Z) - RepoCoder: Repository-Level Code Completion Through Iterative Retrieval
and Generation [96.75695811963242]
RepoCoderはリポジトリレベルのコード補完プロセスを合理化するフレームワークである。
類似性ベースのレトリバーと、事前訓練されたコード言語モデルが組み込まれている。
バニラ検索で拡張されたコード補完アプローチよりも一貫して優れています。
論文 参考訳(メタデータ) (2023-03-22T13:54:46Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Pynblint: a Static Analyzer for Python Jupyter Notebooks [10.190501703364234]
Pynblintは、Pythonで書かれたJupyterノートブックの静的アナライザである。
経験的に検証されたベストプラクティスのセットで、ノートブック(および周辺のリポジトリ)のコンプライアンスをチェックする。
論文 参考訳(メタデータ) (2022-05-24T09:56:03Z) - Repro: An Open-Source Library for Improving the Reproducibility and
Usability of Publicly Available Research Code [74.28810048824519]
Reproは、研究コードのユーザビリティ向上を目的とした、オープンソースのライブラリである。
Dockerコンテナ内で研究者がリリースしたソフトウェアを実行するための軽量Python APIを提供する。
論文 参考訳(メタデータ) (2022-04-29T01:54:54Z) - StickyLand: Breaking the Linear Presentation of Computational Notebooks [5.1175396458764855]
StickyLandはノートブックの拡張機能で、ユーザは自由にコードをリニアな方法で整理できる。
常に画面に表示される粘着性のあるセルを使えば、ユーザーはノートに素早くアクセスでき、実験結果をすぐに観察でき、インタラクティブなダッシュボードを簡単に構築できる。
論文 参考訳(メタデータ) (2022-02-22T18:25:54Z) - You Only Write Thrice: Creating Documents, Computational Notebooks and
Presentations From a Single Source [11.472707084860875]
学術的な取引では、異なるフォーマットで発行された同じコンテンツの複数の変種をジャグリングする必要がある。
本稿では,バージョン管理環境における単一ソース文書の維持により,この負担を大幅に軽減することを提案する。
私たちは、Jupyter Book(オンラインドキュメント)、Jupyter Notebook(計算物語)を構成する概念実証ワークフローを提供し、単一のマークダウンソースファイルから.jsスライドを明らかにする。
論文 参考訳(メタデータ) (2021-07-02T21:02:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。