論文の概要: Are the Majority of Public Computational Notebooks Pathologically Non-Executable?
- arxiv url: http://arxiv.org/abs/2502.04184v2
- Date: Fri, 07 Feb 2025 02:16:40 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-10 11:34:33.914470
- Title: Are the Majority of Public Computational Notebooks Pathologically Non-Executable?
- Title(参考訳): 公開計算ノートの多数派は病理学的に非実行可能か?
- Authors: Tien Nguyen, Waris Gill, Muhammad Ali Gulzar,
- Abstract要約: 従来の実行可能性の概念は過度に厳格であり、多くのノートを誤って分類し、実行不可能性を過大評価している、と私たちは主張する。
本稿では,公立ノートの病的実行可能性問題について,様々な概念と実行可能性の度合いで検討する。
- 参考スコア(独自算出の注目度): 5.274411980510586
- License:
- Abstract: Computational notebooks are the de facto platforms for exploratory data science, offering an interactive programming environment where users can create, modify, and execute code cells in any sequence. However, this flexibility often introduces code quality issues, with prior studies showing that approximately 76% of public notebooks are non-executable, raising significant concerns about reusability. We argue that the traditional notion of executability - requiring a notebook to run fully and without error - is overly rigid, misclassifying many notebooks and overestimating their non-executability. This paper investigates pathological executability issues in public notebooks under varying notions and degrees of executability. Even partially improving executability can improve code comprehension and offer a pathway for dynamic analyses. With this insight, we first categorize notebooks into potentially restorable and pathological non-executable notebooks and then measure how removing misconfiguration and superficial execution issues in notebooks can improve their executability (i.e., additional cells executed without error). In a dataset of 42,546 popular public notebooks containing 34,659 non-executable notebooks, only 21.3% are truly pathologically non-executable. For restorable notebooks, LLM-based methods fully restore 5.4% of previously non-executable notebooks. Among the partially restored, the executability of notebooks improves by 42.7% and 28% by installing the correct modules and generating synthetic data. These findings challenge prior assumptions, suggesting that notebooks have higher executability than previously reported, many of which offer valuable partial execution, and that their executability should be evaluated within the interactive notebook paradigm rather than through traditional software executability standards.
- Abstract(参考訳): 計算ノートブックは探索データサイエンスのデファクトプラットフォームであり、ユーザーが任意のシーケンスでコードセルを作成し、修正し、実行することができる対話型プログラミング環境を提供する。
しかしながら、この柔軟性はコード品質の問題を引き起こすことが多く、以前の調査では、公開ノートブックの約76%が実行不可能であり、再利用性に関する重大な懸念を提起している。
従来の実行可能性という概念 – 完全にかつエラーなしにノートブックを実行する必要がある – は、過度に厳格であり、多くのノートブックを誤って分類し、実行不可能を過度に見積もっている、と私たちは主張する。
本稿では,公立ノートの病的実行可能性問題について,様々な概念と実行可能性の度合いで検討する。
実行可能性を部分的に改善しても、コードの理解が向上し、動的解析のための経路を提供する。
この知見により、まずノートブックを、潜在的に回復可能で病理学的に実行不可能なノートブックに分類し、次に、ノートブックにおける設定ミスや表面的実行の問題を取り除くことによって、実行可能性(すなわち、エラーなしに実行される追加セル)をいかに改善するかを測定する。
34,659個のノートを含む42,546個の人気のノートブックのデータセットでは21.3%が本当に手術不能である。
復元可能なノートブックの場合、LCMベースのメソッドは、以前は実行不可能だったノートブックの5.4%を完全に復元する。
部分的に修復されたノートブックでは、正しいモジュールをインストールして合成データを生成することで、42.7%と28%の改善がなされている。
これらの発見は、以前の仮定に異議を唱え、ノートブックが以前報告したよりも高い実行可能性を持ち、その多くが価値のある部分的実行を提供し、それらの実行可能性は、従来のソフトウェア実行可能性標準ではなく、インタラクティブなノートブックパラダイム内で評価されるべきである、と示唆している。
関連論文リスト
- ReF Decompile: Relabeling and Function Call Enhanced Decompile [50.86228893636785]
逆コンパイルの目標は、コンパイルされた低レベルコード(アセンブリコードなど)を高レベルプログラミング言語に変換することである。
このタスクは、脆弱性識別、マルウェア分析、レガシーソフトウェアマイグレーションなど、さまざまなリバースエンジニアリングアプリケーションをサポートする。
論文 参考訳(メタデータ) (2025-02-17T12:38:57Z) - Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。
改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文 参考訳(メタデータ) (2024-10-29T12:21:23Z) - Predicting the Understandability of Computational Notebooks through Code Metrics Analysis [0.5277756703318045]
我々は、コード理解性に関連するユーザコメントを識別するために、微調整のDistilBERT変換器を使用している。
UOCU(User Opinion Code Understandability)と呼ばれる基準を確立しました。
私たちは、メトリクスのみに基づいてノートのコード理解可能性を予測するために、機械学習モデルを訓練しました。
論文 参考訳(メタデータ) (2024-06-16T15:58:40Z) - FoC: Figure out the Cryptographic Functions in Stripped Binaries with LLMs [54.27040631527217]
削除されたバイナリの暗号関数を抽出するFoCと呼ばれる新しいフレームワークを提案する。
まず、自然言語における暗号関数のセマンティクスを要約するために、バイナリ大言語モデル(FoC-BinLLM)を構築した。
次に、FoC-BinLLM上にバイナリコード類似モデル(FoC-Sim)を構築し、変更に敏感な表現を作成し、データベース内の未知の暗号関数の類似実装を検索する。
論文 参考訳(メタデータ) (2024-03-27T09:45:33Z) - Untangling Knots: Leveraging LLM for Error Resolution in Computational Notebooks [4.318590074766604]
本稿では,反復型LCMエージェントを用いて,計算ノートブックの誤りを解消するための潜在的解決策を提案する。
本稿では,本手法によって提起された問題について議論し,バグを含む新しい計算ノートブックのデータセットを共有する。
論文 参考訳(メタデータ) (2024-03-26T18:53:17Z) - Notably Inaccessible -- Data Driven Understanding of Data Science
Notebook (In)Accessibility [13.428631054625797]
各種アクセシビリティ問題を特定するために,10000 Jupyter ノートの大規模システム解析を行った。
ノートのアーティファクトのアクセシビリティ向上,オーサリングプラクティスの提案,ノートブックのアクセス性向上のためのインフラストラクチャの変更を提案する。
論文 参考訳(メタデータ) (2023-08-07T01:33:32Z) - A Static Evaluation of Code Completion by Large Language Models [65.18008807383816]
単純なプログラミング問題に対するモデル生成コードの機能的正当性を評価するために,実行ベースベンチマークが提案されている。
プログラムを実行せずにエラーを検出するlinterのような静的解析ツールは、コード生成モデルを評価するために十分に研究されていない。
抽象構文木を利用して,Pythonのコード補完における静的エラーを定量化する静的評価フレームワークを提案する。
論文 参考訳(メタデータ) (2023-06-05T19:23:34Z) - ReACC: A Retrieval-Augmented Code Completion Framework [53.49707123661763]
本稿では,語彙のコピーと類似したセマンティクスを持つコード参照の両方を検索により活用する検索拡張コード補完フレームワークを提案する。
我々は,Python および Java プログラミング言語のコード補完タスクにおけるアプローチを評価し,CodeXGLUE ベンチマークで最先端のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2022-03-15T08:25:08Z) - StickyLand: Breaking the Linear Presentation of Computational Notebooks [5.1175396458764855]
StickyLandはノートブックの拡張機能で、ユーザは自由にコードをリニアな方法で整理できる。
常に画面に表示される粘着性のあるセルを使えば、ユーザーはノートに素早くアクセスでき、実験結果をすぐに観察でき、インタラクティブなダッシュボードを簡単に構築できる。
論文 参考訳(メタデータ) (2022-02-22T18:25:54Z) - Context-aware Execution Migration Tool for Data Science Jupyter
Notebooks on Hybrid Clouds [0.22908242575265025]
本稿では,Jupyter拡張として開発された,どのセルを選択するか,どのシナリオで,より適切な実行プラットフォームに移行するべきかを自動選択するソリューションを提案する。
地球科学(リモートセンシング)、画像認識、手書き桁識別(機械学習)のノートブックを用いて、本実験では、ノートブックの状態が最大55倍に低下し、ユーザとノートブックとの対話性が考慮された場合、移行決定が最大3.25倍に向上することを示す。
論文 参考訳(メタデータ) (2021-07-01T02:33:18Z) - Measuring Coding Challenge Competence With APPS [54.22600767666257]
コード生成のベンチマークであるAPPSを紹介する。
私たちのベンチマークには1万の問題が含まれています。
GPT-Neoのような最近のモデルでは、導入問題のテストケースの約15%をパスできる。
論文 参考訳(メタデータ) (2021-05-20T17:58:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。