Fugu-MT 論文翻訳(概要): Are the Majority of Public Computational Notebooks Pathologically Non-Executable?

論文の概要: Are the Majority of Public Computational Notebooks Pathologically Non-Executable?

arxiv url: http://arxiv.org/abs/2502.04184v2
Date: Fri, 07 Feb 2025 02:16:40 GMT
ステータス: 翻訳完了
システム内更新日: 2025-02-10 14:23:01.008417
Title: Are the Majority of Public Computational Notebooks Pathologically Non-Executable?
Title（参考訳）: 公開計算ノートの多数派は病理学的に非実行可能か?
Authors: Tien Nguyen, Waris Gill, Muhammad Ali Gulzar,
Abstract要約: 従来の実行可能性の概念は過度に厳格であり、多くのノートを誤って分類し、実行不可能性を過大評価している、と私たちは主張する。本稿では,公立ノートの病的実行可能性問題について,様々な概念と実行可能性の度合いで検討する。
参考スコア（独自算出の注目度）: 5.274411980510586
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Computational notebooks are the de facto platforms for exploratory data science, offering an interactive programming environment where users can create, modify, and execute code cells in any sequence. However, this flexibility often introduces code quality issues, with prior studies showing that approximately 76% of public notebooks are non-executable, raising significant concerns about reusability. We argue that the traditional notion of executability - requiring a notebook to run fully and without error - is overly rigid, misclassifying many notebooks and overestimating their non-executability. This paper investigates pathological executability issues in public notebooks under varying notions and degrees of executability. Even partially improving executability can improve code comprehension and offer a pathway for dynamic analyses. With this insight, we first categorize notebooks into potentially restorable and pathological non-executable notebooks and then measure how removing misconfiguration and superficial execution issues in notebooks can improve their executability (i.e., additional cells executed without error). In a dataset of 42,546 popular public notebooks containing 34,659 non-executable notebooks, only 21.3% are truly pathologically non-executable. For restorable notebooks, LLM-based methods fully restore 5.4% of previously non-executable notebooks. Among the partially restored, the executability of notebooks improves by 42.7% and 28% by installing the correct modules and generating synthetic data. These findings challenge prior assumptions, suggesting that notebooks have higher executability than previously reported, many of which offer valuable partial execution, and that their executability should be evaluated within the interactive notebook paradigm rather than through traditional software executability standards.
Abstract（参考訳）: 計算ノートブックは探索データサイエンスのデファクトプラットフォームであり、ユーザーが任意のシーケンスでコードセルを作成し、修正し、実行することができる対話型プログラミング環境を提供する。しかしながら、この柔軟性はコード品質の問題を引き起こすことが多く、以前の調査では、公開ノートブックの約76%が実行不可能であり、再利用性に関する重大な懸念を提起している。従来の実行可能性という概念 – 完全にかつエラーなしにノートブックを実行する必要がある – は、過度に厳格であり、多くのノートブックを誤って分類し、実行不可能を過度に見積もっている、と私たちは主張する。本稿では,公立ノートの病的実行可能性問題について,様々な概念と実行可能性の度合いで検討する。実行可能性を部分的に改善しても、コードの理解が向上し、動的解析のための経路を提供する。この知見により、まずノートブックを、潜在的に回復可能で病理学的に実行不可能なノートブックに分類し、次に、ノートブックにおける設定ミスや表面的実行の問題を取り除くことによって、実行可能性(すなわち、エラーなしに実行される追加セル)をいかに改善するかを測定する。 34,659個のノートを含む42,546個の人気のノートブックのデータセットでは21.3%が本当に手術不能である。復元可能なノートブックの場合、LCMベースのメソッドは、以前は実行不可能だったノートブックの5.4%を完全に復元する。部分的に修復されたノートブックでは、正しいモジュールをインストールして合成データを生成することで、42.7%と28%の改善がなされている。これらの発見は、以前の仮定に異議を唱え、ノートブックが以前報告したよりも高い実行可能性を持ち、その多くが価値のある部分的実行を提供し、それらの実行可能性は、従来のソフトウェア実行可能性標準ではなく、インタラクティブなノートブックパラダイム内で評価されるべきである、と示唆している。

関連論文リスト

Outrunning LLM Cutoffs: A Live Kernel Crash Resolution Benchmark for All [57.23434868678603]
Live-kBenchは、新たに発見されたカーネルバグのエージェントをスクラップし、評価するセルフ進化ベンチマークの評価フレームワークである。 kEnvは、カーネルのコンパイル、実行、フィードバックのためのエージェントに依存しないクラッシュ解決環境である。 kEnvを用いて3つの最先端エージェントをベンチマークし、最初の試行で74%のクラッシュを解決したことを示す。
論文参考訳（メタデータ） (2026-02-02T19:06:15Z)
When Are Reactive Notebooks Not Reactive? [2.1328771260762758]
リアクティブノートブックシステムは、修正時に最小限のセルを再実行することによって、ノートブック状態を現在のセルコードと同期するように努力する。本稿では,リアクティブノートシステム内での反応性機能について議論し,評価を行うための詳細なテストスイートであるRexを提案する。
論文参考訳（メタデータ） (2025-11-27T00:43:27Z)
QiMeng-NeuComBack: Self-Evolving Translation from IR to Assembly Code [52.66657751895655]
大規模言語モデル(LLM)は、ニューラルコンパイルという魅力的な新しいパラダイムを提供する。本稿では,IR-to-assemblyコンパイル用に設計された新しいベンチマークデータセットであるNeuComBackを紹介する。 LLMの内部的なプロンプト戦略を進化させる自己進化的プロンプト最適化法を提案する。
論文参考訳（メタデータ） (2025-11-03T03:20:26Z)
Exploring the Jupyter Ecosystem: An Empirical Study of Bugs and Vulnerabilities [3.4769545753909608]
本研究の目的は,Notebookエコシステムのバグと脆弱性に関する大規模な実証研究を提供することである。我々は2つの主要なプラットフォームからノートブックの大規模なデータセットを収集し分析した。
論文参考訳（メタデータ） (2025-07-24T22:09:21Z)
The Medium Is Not the Message: Deconfounding Text Embeddings via Linear Concept Erasure [91.01653854955286]
埋め込みベースの類似度メトリクスは、テキストのソースや言語のような刺激的な属性に影響される可能性がある。本稿では,エンコーダ表現から観測された共同創設者に関する情報を除去するデバイアスアルゴリズムにより,これらのバイアスを最小の計算コストで大幅に低減することを示す。
論文参考訳（メタデータ） (2025-07-01T23:17:12Z)
D-LiFT: Improving LLM-based Decompiler Backend via Code Quality-driven Fine-tuning [49.16469288280772]
D-LiFT(D-LiFT)は、LLMを活用して強化学習(RL)によるデコンパイルコードの品質向上を図る自動デコンパイラバックエンドである。 D-LiFTは、コンパイルされたコードの品質を高めるための鍵となる原則に準拠している。 D-LiFT の中心となる D-SCORE は、複数の側面から逆コンパイルされたコードを評価するための統合品質評価システムである。
論文参考訳（メタデータ） (2025-06-11T19:09:08Z)
CrashFixer: A crash resolution agent for the Linux kernel [58.152358195983155]
この作業は、システムレベルのLinuxカーネルバグのベンチマークと、Linuxカーネルで実験を実行するプラットフォームを共有するkGymの上に構築されている。 CrashFixerはLinuxカーネルのバグに適応する最初のLCMベースのソフトウェア修復エージェントである。
論文参考訳（メタデータ） (2025-04-29T04:18:51Z)
Verification Learning: Make Unsupervised Neuro-Symbolic System Feasible [49.084647802326366]
本稿では,Nesyにおけるラベルに基づく推論プロセスをラベルのない検証プロセスに変換する,新しい学習パラダイムであるVerification Learning(VL)を紹介する。 VLは、ラベルのないデータと、現在の予測が規則に準拠しているかどうかを検証する関数にのみ依存することにより、優れた学習結果を得る。提案するフレームワークは,追加,ソート,マッチ,チェスなど,教師なしのタスクによって検証され,それぞれが大幅な性能向上と効率向上を示す。
論文参考訳（メタデータ） (2025-03-17T08:28:58Z)
Understanding Code Understandability Improvements in Code Reviews [79.16476505761582]
GitHub上のJavaオープンソースプロジェクトからの2,401のコードレビューコメントを分析した。改善提案の83.9%が承認され、統合され、1%未満が後に復活した。
論文参考訳（メタデータ） (2024-10-29T12:21:23Z)
Predicting the Understandability of Computational Notebooks through Code Metrics Analysis [0.5277756703318045]
我々は、コード理解性に関連するユーザコメントを識別するために、微調整のDistilBERT変換器を使用している。 UOCU(User Opinion Code Understandability)と呼ばれる基準を確立しました。私たちは、メトリクスのみに基づいてノートのコード理解可能性を予測するために、機械学習モデルを訓練しました。
論文参考訳（メタデータ） (2024-06-16T15:58:40Z)
FoC: Figure out the Cryptographic Functions in Stripped Binaries with LLMs [54.27040631527217]
削除されたバイナリの暗号関数を抽出するFoCと呼ばれる新しいフレームワークを提案する。まず、自然言語における暗号関数のセマンティクスを要約するために、バイナリ大言語モデル(FoC-BinLLM)を構築した。次に、FoC-BinLLM上にバイナリコード類似モデル(FoC-Sim)を構築し、変更に敏感な表現を作成し、データベース内の未知の暗号関数の類似実装を検索する。
論文参考訳（メタデータ） (2024-03-27T09:45:33Z)
Untangling Knots: Leveraging LLM for Error Resolution in Computational Notebooks [4.318590074766604]
本稿では,反復型LCMエージェントを用いて,計算ノートブックの誤りを解消するための潜在的解決策を提案する。本稿では,本手法によって提起された問題について議論し,バグを含む新しい計算ノートブックのデータセットを共有する。
論文参考訳（メタデータ） (2024-03-26T18:53:17Z)
Notably Inaccessible -- Data Driven Understanding of Data Science Notebook (In)Accessibility [13.428631054625797]
各種アクセシビリティ問題を特定するために,10000 Jupyter ノートの大規模システム解析を行った。ノートのアーティファクトのアクセシビリティ向上,オーサリングプラクティスの提案,ノートブックのアクセス性向上のためのインフラストラクチャの変更を提案する。
論文参考訳（メタデータ） (2023-08-07T01:33:32Z)
A Static Evaluation of Code Completion by Large Language Models [65.18008807383816]
単純なプログラミング問題に対するモデル生成コードの機能的正当性を評価するために,実行ベースベンチマークが提案されている。プログラムを実行せずにエラーを検出するlinterのような静的解析ツールは、コード生成モデルを評価するために十分に研究されていない。抽象構文木を利用して,Pythonのコード補完における静的エラーを定量化する静的評価フレームワークを提案する。
論文参考訳（メタデータ） (2023-06-05T19:23:34Z)
StickyLand: Breaking the Linear Presentation of Computational Notebooks [5.1175396458764855]
StickyLandはノートブックの拡張機能で、ユーザは自由にコードをリニアな方法で整理できる。常に画面に表示される粘着性のあるセルを使えば、ユーザーはノートに素早くアクセスでき、実験結果をすぐに観察でき、インタラクティブなダッシュボードを簡単に構築できる。
論文参考訳（メタデータ） (2022-02-22T18:25:54Z)
Context-aware Execution Migration Tool for Data Science Jupyter Notebooks on Hybrid Clouds [0.22908242575265025]
本稿では,Jupyter拡張として開発された,どのセルを選択するか,どのシナリオで,より適切な実行プラットフォームに移行するべきかを自動選択するソリューションを提案する。地球科学(リモートセンシング)、画像認識、手書き桁識別(機械学習)のノートブックを用いて、本実験では、ノートブックの状態が最大55倍に低下し、ユーザとノートブックとの対話性が考慮された場合、移行決定が最大3.25倍に向上することを示す。
論文参考訳（メタデータ） (2021-07-01T02:33:18Z)
Measuring Coding Challenge Competence With APPS [54.22600767666257]
コード生成のベンチマークであるAPPSを紹介する。私たちのベンチマークには1万の問題が含まれています。 GPT-Neoのような最近のモデルでは、導入問題のテストケースの約15%をパスできる。
論文参考訳（メタデータ） (2021-05-20T17:58:42Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。