論文の概要: Less is More? An Empirical Study on Configuration Issues in Python PyPI
Ecosystem
- arxiv url: http://arxiv.org/abs/2310.12598v1
- Date: Thu, 19 Oct 2023 09:07:51 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-21 14:51:42.131506
- Title: Less is More? An Empirical Study on Configuration Issues in Python PyPI
Ecosystem
- Title(参考訳): より少ないか?
Python PyPIエコシステムにおける構成問題に関する実証的研究
- Authors: Yun Peng, Ruida Hu, Ruoke Wang, Cuiyun Gao, Shuqing Li, Michael R. Lyu
- Abstract要約: Pythonはオープンソースコミュニティで広く使われている。
サードパーティのライブラリは依存関係の衝突を引き起こす可能性があるため、研究者は依存関係の衝突検知器を開発する必要がある。
依存関係を自動的に推論する試みが実施された。
- 参考スコア(独自算出の注目度): 38.44692482370243
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Python is widely used in the open-source community, largely owing to the
extensive support from diverse third-party libraries within the PyPI ecosystem.
Nevertheless, the utilization of third-party libraries can potentially lead to
conflicts in dependencies, prompting researchers to develop dependency conflict
detectors. Moreover, endeavors have been made to automatically infer
dependencies. These approaches focus on version-level checks and inference,
based on the assumption that configurations of libraries in the PyPI ecosystem
are correct. However, our study reveals that this assumption is not universally
valid, and relying solely on version-level checks proves inadequate in ensuring
compatible run-time environments. In this paper, we conduct an empirical study
to comprehensively study the configuration issues in the PyPI ecosystem.
Specifically, we propose PyCon, a source-level detector, for detecting
potential configuration issues. PyCon employs three distinct checks, targeting
the setup, packing, and usage stages of libraries, respectively. To evaluate
the effectiveness of the current automatic dependency inference approaches, we
build a benchmark called VLibs, comprising library releases that pass all three
checks of PyCon. We identify 15 kinds of configuration issues and find that
183,864 library releases suffer from potential configuration issues.
Remarkably, 68% of these issues can only be detected via the source-level
check. Our experiment results show that the most advanced automatic dependency
inference approach, PyEGo, can successfully infer dependencies for only 65% of
library releases. The primary failures stem from dependency conflicts and the
absence of required libraries in the generated configurations. Based on the
empirical results, we derive six findings and draw two implications for
open-source developers and future research in automatic dependency inference.
- Abstract(参考訳): pythonはオープンソースコミュニティで広く使われており、主にpypiエコシステム内のさまざまなサードパーティライブラリからの広範なサポートがある。
それにもかかわらず、サードパーティライブラリの利用は依存関係の衝突を引き起こす可能性があり、研究者は依存関係の競合検出器を開発することになる。
さらに、依存関係を自動的に推論する取り組みも行われている。
これらのアプローチは、PyPIエコシステム内のライブラリの設定が正しいという仮定に基づいて、バージョンレベルのチェックと推論に焦点を当てている。
しかし、本研究では、この仮定は普遍的に有効ではなく、バージョンレベルのチェックにのみ依存することは、互換性のある実行環境の確保に不十分であることを証明している。
本稿では,PyPIエコシステムの構成問題を包括的に研究するための実証的研究を行う。
具体的には、ソースレベルの検出器であるPyConを提案し、潜在的な構成問題を検出する。
PyConには3つの異なるチェックがあり、それぞれライブラリのセットアップ、パッケージング、利用ステージをターゲットとしている。
現在の自動依存性推論手法の有効性を評価するため、PyConの3つのチェックをすべてパスするライブラリリリースを含むVLibsというベンチマークを構築した。
15種類の構成問題を特定し、183,864のライブラリリリースが潜在的構成問題に悩まされていることを発見した。
注目すべきは、これらの問題の68%がソースレベルのチェックでのみ検出できることだ。
実験の結果,最も先進的な自動依存関係推論手法であるPyEGoは,ライブラリリリースの65%で依存性を推測できることがわかった。
主な障害は依存関係の競合と,生成されたコンフィギュレーションに必要なライブラリが存在しないことだ。
実験結果に基づき,6つの知見を導出し,オープンソース開発者に対する2つの示唆と,依存性の自動推論に関する今後の研究を導出する。
関連論文リスト
- A Preliminary Study on Self-Contained Libraries in the NPM Ecosystem [2.221643499902673]
現代のソフトウェアエコシステムにおけるライブラリの普及は、依存関係の複雑なネットワークを生み出します。
依存関係がゼロのライブラリは自己完結型になる。
本稿では,NPMエコシステムにおける自己完結型ライブラリの特徴について考察する。
論文 参考訳(メタデータ) (2024-06-17T09:33:49Z) - See to Believe: Using Visualization To Motivate Updating Third-party Dependencies [1.7914660044009358]
サードパーティの依存関係を使用したアプリケーションによって導入されたセキュリティ脆弱性が増加している。
開発者はライブラリのアップデートに注意を払っており、脆弱性の修正にも注意している。
本稿では、依存性グラフ可視化(DGV)アプローチが、開発者が更新を動機付けると仮定する。
論文 参考訳(メタデータ) (2024-05-15T03:57:27Z) - Analyzing the Accessibility of GitHub Repositories for PyPI and NPM Libraries [91.97201077607862]
産業アプリケーションはオープンソースソフトウェア(OSS)ライブラリに大きく依存しており、様々な利点を提供している。
このようなコミュニティの活動を監視するには、エコシステムのライブラリの包括的なリポジトリのリストにアクセスしなければなりません。
本研究では、PyPIライブラリとNPMライブラリのGitHubリポジトリのアクセシビリティを分析する。
論文 参考訳(メタデータ) (2024-04-26T13:27:04Z) - pyvene: A Library for Understanding and Improving PyTorch Models via
Interventions [79.72930339711478]
$textbfpyvene$は、さまざまなPyTorchモジュールに対するカスタマイズ可能な介入をサポートするオープンソースライブラリである。
私たちは、$textbfpyvene$が、ニューラルモデルへの介入を実行し、他のモデルとインターバルされたモデルを共有するための統一されたフレームワークを提供する方法を示します。
論文 参考訳(メタデータ) (2024-03-12T16:46:54Z) - An Empirical Study on Bugs Inside PyTorch: A Replication Study [10.848682558737494]
私たちは、非常に人気のあるディープラーニングフレームワークであるPyTorchライブラリのバグを特徴付けています。
私たちの結果は、PyTorchのバグはディープラーニングの特徴よりも、従来のソフトウェアプロジェクトのバグに近いことを強調しています。
論文 参考訳(メタデータ) (2023-07-25T19:23:55Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - Repro: An Open-Source Library for Improving the Reproducibility and
Usability of Publicly Available Research Code [74.28810048824519]
Reproは、研究コードのユーザビリティ向上を目的とした、オープンソースのライブラリである。
Dockerコンテナ内で研究者がリリースしたソフトウェアを実行するための軽量Python APIを提供する。
論文 参考訳(メタデータ) (2022-04-29T01:54:54Z) - PyHHMM: A Python Library for Heterogeneous Hidden Markov Models [63.01207205641885]
PyHHMM は Heterogeneous-Hidden Markov Models (HHMM) のオブジェクト指向Python実装である。
PyHHMMは、異種観測モデル、データ推論の欠如、異なるモデルの順序選択基準、半教師付きトレーニングなど、同様のフレームワークではサポートされない機能を強調している。
PyHHMMは、numpy、scipy、scikit-learn、およびシーボーンPythonパッケージに依存しており、Apache-2.0ライセンスの下で配布されている。
論文 参考訳(メタデータ) (2022-01-12T07:32:36Z) - PySAD: A Streaming Anomaly Detection Framework in Python [0.0]
PySADは、ストリーミングデータの異常検出のためのオープンソースのpythonフレームワークである。
PySADは、PyODやScikit-learnといった人気のあるオープンソースフレームワークの上に構築されている。
論文 参考訳(メタデータ) (2020-09-05T17:41:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。