論文の概要: Stdlib or Third-Party? Empirical Performance and Correctness of LLM-Assisted Zero-Dependency Python Libraries
- arxiv url: http://arxiv.org/abs/2605.21405v1
- Date: Wed, 20 May 2026 17:02:54 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-21 19:19:56.798952
- Title: Stdlib or Third-Party? Empirical Performance and Correctness of LLM-Assisted Zero-Dependency Python Libraries
- Title(参考訳): Stdlibかサードパーティか? LLM支援ゼロ依存Pythonライブラリの実証的性能と正確性
- Authors: Peng Ding, Rick Stevens,
- Abstract要約: サードパーティのPythonライブラリは依存性管理のオーバーヘッド、サプライチェーンのリスク、デプロイメントの摩擦を導入している。
これは、人気の高いサードパーティライブラリのalibのみの再実装の増大するシングルファイルPythonモジュールのコレクションである。
シリアライゼーション、ネットワーキング、暗号、エージェントプロトコル、テキスト処理など、12のカテゴリにまたがる40以上のモジュールをスパンニングすることで、ゼロディープは2つの相互関連質問に対して制御されたテストベッドを提供する。
- 参考スコア(独自算出の注目度): 4.178382873374296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Third-party Python libraries introduce dependency management overhead, supply chain risk, and deployment friction in constrained environments. A natural question is how much of this ecosystem can be replicated using only Python's standard library -- and at what correctness and performance cost. We address this empirically through zerodep, a growing collection of single-file Python modules, each a stdlib-only reimplementation of a popular third-party library, developed with LLM assistance under strict constraints: no external imports, single file, drop-in API compatibility, and mandatory correctness validation against the reference library. Spanning over 40 modules across 12 categories -- including serialization, networking, cryptography, agent protocols, and text processing -- zerodep provides a controlled testbed for two interrelated questions: (1) Where does the stdlib suffice? and (2) Can LLMs effectively generate correct, performant code under tight symbolic constraints? Systematic benchmarking shows that stdlib-only implementations achieve performance parity (within 2x of the reference) in the majority of cases. The primary performance cliff is C-extension-backed computation (image processing, binary serialization, low-level crypto), not the inherent overhead of pure-Python third-party libraries. Conversely, many widely-used libraries carry architectural overhead that LLM-generated stdlib reimplementations avoid, yielding 5--115x speedups in several categories. We characterize the stdlib capability boundary across complexity tiers and library categories, discuss where LLM-assisted development succeeds and where it requires iterative human correction, and examine implications for dependency-free software engineering at scale. zerodep is open-source at https://github.com/Oaklight/zerodep.
- Abstract(参考訳): サードパーティのPythonライブラリは、制約のある環境での依存性管理のオーバーヘッド、サプライチェーンのリスク、デプロイメントの摩擦を導入している。
自然の疑問は、このエコシステムのどれ程をPythonの標準ライブラリを使って複製できるか、そしてどの正確性とパフォーマンスコストがかかるかである。
我々は、これを実証的に解決するために、シングルファイルPythonモジュールのコレクションである0depを通じて、人気のあるサードパーティライブラリのstdlibのみを再実装し、厳密な制約の下でLLMアシストで開発された。
シリアライゼーション、ネットワーキング、暗号、エージェントプロトコル、テキスト処理を含む12のカテゴリにわたる40以上のモジュールをスパンニングすることで、0depは2つの関係する質問に対してコントロールされたテストベッドを提供する。
LLMは、厳密なシンボリック制約の下で、効果的に正しいパフォーマンスコードを生成することができるのか?
システムベンチマークは、stdlibのみの実装が、ほとんどのケースでパフォーマンスの同等性(参照の2倍)を達成することを示している。
主なパフォーマンスの落とし穴は、純粋なPythonサードパーティライブラリの固有のオーバーヘッドではなく、C拡張ベースの計算(画像処理、バイナリシリアライゼーション、低レベル暗号)である。
逆に、多くの広く使われているライブラリは、LCMが生成したstdlibの再実装を避けるというアーキテクチャ上のオーバーヘッドを持ち、いくつかのカテゴリで5--115倍のスピードアップをもたらす。
我々は,複雑性階層とライブラリカテゴリ間のstdlib機能境界を特徴付け,LCM支援開発が成功する場所と,人間による反復的な修正を必要とする場所について議論し,大規模に依存性のないソフトウェア工学に影響を及ぼすかを検討する。
zerodepはhttps://github.com/Oaklight/zerodep.comでオープンソース化されている。
関連論文リスト
- Python Bindings for a Large C++ Robotics Library: The Case of OMPL [12.900006436558405]
Pythonバインディングは、高性能なC++ライブラリとPythonの柔軟性の間の重要な橋渡しである。
大きなものへのバインディングを生成するのは 面倒なプロセスです 少数のメンテナに 重荷を負わせます
本研究では,Large Language Models (LLMs) を用いてナノボンドラッパーの生成を支援する。
論文 参考訳(メタデータ) (2026-03-04T23:18:10Z) - GPT-4.1 Sets the Standard in Automated Experiment Design Using Novel Python Libraries [0.649540541957527]
大規模言語モデル(LLM)は、科学研究におけるコード生成を自動化するツールとして急速に進歩してきた。
本研究では,関数型Pythonコードを生成する上で,最先端のLLMの選択を体系的にベンチマークする。
結果は、モデルの小さなサブセットだけが一貫して正しい実行可能なコードを生成することを示している。
論文 参考訳(メタデータ) (2025-07-30T13:11:29Z) - The Last Dependency Crusade: Solving Python Dependency Conflicts with LLMs [10.800983456810165]
本稿では,Pythonプログラムの依存性問題を自動的に修復するLarge Language Models (LLMs) について検討する。
本稿では,新しい検索拡張世代 (RAG) アプローチであるHGM (plum) を提案する。
論文 参考訳(メタデータ) (2025-01-27T16:45:34Z) - PyPulse: A Python Library for Biosignal Imputation [58.35269251730328]
PyPulseは,臨床およびウェアラブルの両方のセンサ設定において生体信号の計算を行うPythonパッケージである。
PyPulseのフレームワークは、非機械学習バイオリサーバーを含む幅広いユーザーベースに対して、使い勝手の良いモジュラーで拡張可能なフレームワークを提供する。
PyPulseはMITライセンスでGithubとPyPIでリリースしました。
論文 参考訳(メタデータ) (2024-12-09T11:00:55Z) - torchgfn: A PyTorch GFlowNet library [44.94532429787822]
我々は、このニーズに対処することを目的としたPyTorchライブラリであるTorchgfnを紹介します。
その中核的な貢献は、環境、ニューラルネットワークモジュールを扱い、目標を交換可能なコンポーネントとしてトレーニングするモジュールで分離されたアーキテクチャである。
これによってユーザは、高速なプロトタイピングと新しい研究を容易にする、シンプルだが強力なAPIをユーザに提供する。
論文 参考訳(メタデータ) (2023-05-24T00:20:59Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - PyHHMM: A Python Library for Heterogeneous Hidden Markov Models [63.01207205641885]
PyHHMM は Heterogeneous-Hidden Markov Models (HHMM) のオブジェクト指向Python実装である。
PyHHMMは、異種観測モデル、データ推論の欠如、異なるモデルの順序選択基準、半教師付きトレーニングなど、同様のフレームワークではサポートされない機能を強調している。
PyHHMMは、numpy、scipy、scikit-learn、およびシーボーンPythonパッケージに依存しており、Apache-2.0ライセンスの下で配布されている。
論文 参考訳(メタデータ) (2022-01-12T07:32:36Z) - MRCpy: A Library for Minimax Risk Classifiers [10.380882297891272]
PythonライブラリであるMRCpyは、ロバストリスク最小化(RRM)アプローチに基づいて、ミニマックスリスク分類器(MRC)を実装している。
MRCpyは、Scikit-learnのような人気のあるPythonライブラリの標準に従い、可読性と使いやすさと、他のライブラリとのシームレスな統合を容易にする。
論文 参考訳(メタデータ) (2021-08-04T10:31:20Z) - Solo-learn: A Library of Self-supervised Methods for Visual
Representation Learning [83.02597612195966]
solo-learnは視覚表現学習のための自己指導型のメソッドのライブラリである。
Pythonで実装され、PytorchとPytorch Lightningを使用して、このライブラリは研究と業界のニーズの両方に適合する。
論文 参考訳(メタデータ) (2021-08-03T22:19:55Z) - DoubleML -- An Object-Oriented Implementation of Double Machine Learning
in Python [1.4911092205861822]
DoubleMLはオープンソースのPythonライブラリで、Chernozhukovらのダブル機械学習フレームワークを実装している。
パラメータの推定が機械学習手法に基づく場合、因果パラメータの統計的推測に有効な機能を含む。
このパッケージはMITライセンスで配布されており、科学的なPythonエコシステムのコアライブラリに依存している。
論文 参考訳(メタデータ) (2021-04-07T16:16:39Z) - Picasso: A Sparse Learning Library for High Dimensional Data Analysis in
R and Python [77.33905890197269]
本稿では,様々なスパース学習問題に対して,経路座標を統一的に最適化する新しいライブラリについて述べる。
ライブラリはR++でコード化されており、ユーザフレンドリーなスパース実験を行っている。
論文 参考訳(メタデータ) (2020-06-27T02:39:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。