論文の概要: A Systematic Literature Review of Software Engineering Research on Jupyter Notebook
- arxiv url: http://arxiv.org/abs/2504.16180v1
- Date: Tue, 22 Apr 2025 18:12:04 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:52.887604
- Title: A Systematic Literature Review of Software Engineering Research on Jupyter Notebook
- Title(参考訳): ジュピターノートにおけるソフトウェア工学研究の体系的文献レビュー
- Authors: Md Saeed Siddik, Hao Li, Cor-Paul Bezemer,
- Abstract要約: 本研究の目的は,Jupyterノートのソフトウェア工学研究で使用されるトレンド,ギャップ,方法論を分析することである。
ジュピターノートのソフトウェア工学研究を出版する最も人気のある場所は、人間とコンピュータの相互作用に関するものである。
- 参考スコア(独自算出の注目度): 8.539234346904905
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Context: Jupyter Notebook has emerged as a versatile tool that transforms how researchers, developers, and data scientists conduct and communicate their work. As the adoption of Jupyter notebooks continues to rise, so does the interest from the software engineering research community in improving the software engineering practices for Jupyter notebooks. Objective: The purpose of this study is to analyze trends, gaps, and methodologies used in software engineering research on Jupyter notebooks. Method: We selected 146 relevant publications from the DBLP Computer Science Bibliography up to the end of 2024, following established systematic literature review guidelines. We explored publication trends, categorized them based on software engineering topics, and reported findings based on those topics. Results: The most popular venues for publishing software engineering research on Jupyter notebooks are related to human-computer interaction instead of traditional software engineering venues. Researchers have addressed a wide range of software engineering topics on notebooks, such as code reuse, readability, and execution environment. Although reusability is one of the research topics for Jupyter notebooks, only 64 of the 146 studies can be reused based on their provided URLs. Additionally, most replication packages are not hosted on permanent repositories for long-term availability and adherence to open science principles. Conclusion: Solutions specific to notebooks for software engineering issues, including testing, refactoring, and documentation, are underexplored. Future research opportunities exist in automatic testing frameworks, refactoring clones between notebooks, and generating group documentation for coherent code cells.
- Abstract(参考訳): コンテキスト: Jupyter Notebookは、研究者、開発者、データサイエンティストの行動やコミュニケーションの仕方を変える汎用的なツールとして登場した。
Jupyterノートブックの採用が拡大するにつれて、Jupyterノートブックのソフトウェアエンジニアリングプラクティスの改善に対するソフトウェアエンジニアリング研究コミュニティの関心も高まっている。
目的:本研究の目的は,Jupyterノートのソフトウェア工学研究で使用されるトレンド,ギャップ,方法論を分析することである。
方法: 体系的な文献レビューガイドラインに従って, 2024年末までDBLP Computer Science Bibliographyから146の関連論文を選定した。
我々は出版トレンドを考察し、ソフトウェア工学のトピックに基づいて分類し、それらのトピックに基づいて調査結果を報告した。
結果:Jupyterノートブックのソフトウェアエンジニアリング研究を出版する最も人気のある場所は、従来のソフトウェアエンジニアリングの会場ではなく、人間とコンピュータのインタラクションに関連している。
研究者は、コードの再利用、可読性、実行環境など、ノートブック上の幅広いソフトウェアエンジニアリングのトピックに対処してきた。
再利用性はJupyterノートブックの研究トピックの1つだが、提供されたURLに基づいて再利用できるのは146研究のうち64研究のみである。
さらに、ほとんどのレプリケーションパッケージは、長期的な可用性とオープンサイエンス原則の遵守のために永続的なリポジトリにホストされていない。
結論: テスト,リファクタリング,ドキュメントなど,ソフトウェアエンジニアリング上の問題に関するノートブックに特有のソリューションは,過小評価されている。
将来の研究の機会は、自動テストフレームワーク、ノートブック間のクローンのリファクタリング、一貫性のあるコードセルのためのグループドキュメントの生成である。
関連論文リスト
- Paper2Code: Automating Code Generation from Scientific Papers in Machine Learning [57.09163579304332]
機械学習論文を機能コードリポジトリに変換するフレームワークであるPaperCoderを紹介した。
PaperCoderは3つの段階で動作する。計画、図によるシステムアーキテクチャの設計、ファイル依存の特定、構成ファイルの生成である。
次に、モデルベースおよび人的評価の両方に基づいて、機械学習論文からコード実装を生成するPaperCoderを評価する。
論文 参考訳(メタデータ) (2025-04-24T01:57:01Z) - Teaching Empirical Research Methods in Software Engineering: An Editorial Introduction [2.518416353853374]
近年、経験的ソフトウェア工学が注目され、ソフトウェア工学における科学的実践のデファクトスタンダードとなった。
現在、経験的研究の設計、指揮、報告、レビューのための広範囲なガイドラインが提供されているが、経験的ソフトウェア工学の教育には、同様の注意が払われていない。
論文 参考訳(メタデータ) (2025-01-13T10:42:43Z) - Benchmarking Predictive Coding Networks -- Made Simple [48.652114040426625]
機械学習における予測符号化ネットワーク(PCN)の効率性とスケーラビリティの問題に取り組む。
そこで我々は,PCXと呼ばれる,パフォーマンスと簡易性を重視したライブラリを提案する。
我々は,PCNの既存アルゴリズムと,生物工学的な深層学習コミュニティで普及している他の手法を併用して,このようなベンチマークを広範囲に実施する。
論文 参考訳(メタデータ) (2024-07-01T10:33:44Z) - MASSW: A New Dataset and Benchmark Tasks for AI-Assisted Scientific Workflows [58.56005277371235]
我々は,Multi-Aspect Summarization of ScientificAspectsに関する総合テキストデータセットであるMASSWを紹介する。
MASSWには過去50年間にわたる17の主要なコンピュータサイエンスカンファレンスから152,000以上の査読論文が含まれている。
我々は、この新しいデータセットを用いてベンチマーク可能な、複数の新しい機械学習タスクを通じて、MASSWの有用性を実証する。
論文 参考訳(メタデータ) (2024-06-10T15:19:09Z) - Investigating Reproducibility in Deep Learning-Based Software Fault
Prediction [16.25827159504845]
ますます複雑な機械学習モデルが急速に採用されるようになると、学者が文献で報告される結果を再現することがますます困難になる。
特に、適用されたディープラーニングモデルと評価方法論が適切に文書化されていない場合と、コードとデータが共有されていない場合である。
我々は,2019年から2022年にかけて,トップレベルのソフトウェアエンジニアリングカンファレンスにおいて,現在の文献を体系的にレビューし,56件の研究論文のレベルを検討した。
論文 参考訳(メタデータ) (2024-02-08T13:00:18Z) - SuperNOVA: Design Strategies and Opportunities for Interactive Visualization in Computational Notebooks [34.04783941358773]
ノートブックの対話型可視化ツール163について分析する。
重要な設計上の意味とトレードオフを特定します。
我々は、研究者が既存のノートブック視覚化ツールを探索するのに役立つオープンソースのインタラクティブブラウザであるSuperNOVAを開発した。
論文 参考訳(メタデータ) (2023-05-04T17:57:54Z) - Literature Review: Computer Vision Applications in Transportation
Logistics and Warehousing [58.720142291102135]
輸送物流や倉庫におけるコンピュータビジョンの応用は、プロセスの自動化に大きな可能性を秘めている。
本稿では、この可能性を活用するために、この分野の研究に関する構造化された文献レビューを紹介する。
論文 参考訳(メタデータ) (2023-04-12T17:33:41Z) - Mining the Characteristics of Jupyter Notebooks in Data Science Projects [1.655246222110267]
計算ノートブック (Jupyter Notebook) は、実際はよく知られたデータサイエンスツールである。
本研究の目的は,Kaggle上のJupyter Notebooksと,GitHub上のデータサイエンスプロジェクトで人気の高いJupyter Notebooksの特徴を理解することである。
論文 参考訳(メタデータ) (2023-04-11T16:30:53Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Pynblint: a Static Analyzer for Python Jupyter Notebooks [10.190501703364234]
Pynblintは、Pythonで書かれたJupyterノートブックの静的アナライザである。
経験的に検証されたベストプラクティスのセットで、ノートブック(および周辺のリポジトリ)のコンプライアンスをチェックする。
論文 参考訳(メタデータ) (2022-05-24T09:56:03Z) - pymdp: A Python library for active inference in discrete state spaces [52.85819390191516]
pymdpはPythonでアクティブな推論をシミュレートするオープンソースパッケージである。
我々は,POMDPによるアクティブな推論をシミュレートする,最初のオープンソースパッケージを提供する。
論文 参考訳(メタデータ) (2022-01-11T12:18:44Z) - Machine Learning for Software Engineering: A Systematic Mapping [73.30245214374027]
ソフトウェア開発業界は、現代のソフトウェアシステムを高度にインテリジェントで自己学習システムに移行するために、機械学習を急速に採用している。
ソフトウェアエンジニアリングライフサイクルの段階にわたって機械学習の採用について、現状を探求する包括的な研究は存在しない。
本研究は,機械学習によるソフトウェア工学(MLSE)分類を,ソフトウェア工学ライフサイクルのさまざまな段階に適用性に応じて,最先端の機械学習技術に分類するものである。
論文 参考訳(メタデータ) (2020-05-27T11:56:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。