論文の概要: PCREQ: Automated Inference of Compatible Requirements for Python Third-party Library Upgrades
- arxiv url: http://arxiv.org/abs/2508.02023v1
- Date: Mon, 04 Aug 2025 03:34:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 13:41:12.661261
- Title: PCREQ: Automated Inference of Compatible Requirements for Python Third-party Library Upgrades
- Title(参考訳): PCREQ: Pythonサードパーティ製ライブラリのアップグレードのための互換性のある要件の自動推論
- Authors: Huashan Lei, Guanping Xiao, Yepang Liu, Zheng Zheng,
- Abstract要約: Pythonのサードパーティライブラリ(TPL)は、現代のソフトウェア開発において必須であるが、アップグレードはしばしば互換性の問題を引き起こし、システム障害につながる。
既存のツールは依存性の衝突を主に検出するが、コードレベルの非互換性を見落としている。
PCREQは、バージョンとコード互換性の分析を組み合わせることで、互換性のある要求を自動的に推測する最初の手法である。
- 参考スコア(独自算出の注目度): 5.857193811761703
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Python third-party libraries (TPLs) are essential in modern software development, but upgrades often cause compatibility issues, leading to system failures. These issues fall into two categories: version compatibility issues (VCIs) and code compatibility issues (CCIs). Existing tools mainly detect dependency conflicts but overlook code-level incompatibilities, with no solution fully automating the inference of compatible versions for both VCIs and CCIs. To fill this gap, we propose PCREQ, the first approach to automatically infer compatible requirements by combining version and code compatibility analysis. PCREQ integrates six modules: knowledge acquisition, version compatibility assessment, invoked APIs and modules extraction, code compatibility assessment, version change, and missing TPL completion. PCREQ collects candidate versions, checks for conflicts, identifies API usage, evaluates code compatibility, and iteratively adjusts versions to generate a compatible requirements.txt with a detailed repair report. To evaluate PCREQ, we construct REQBench, a large-scale benchmark with 2,095 upgrade test cases (including 406 unsolvable by pip). Results show PCREQ achieves a 94.03% inference success rate, outperforming PyEGo (37.02%), ReadPyE (37.16%), and LLM-based approaches (GPT-4o, DeepSeek V3/R1) by 18-20%. PCREQ processes each case from REQBench in 60.79s on average, demonstrating practical efficiency. PCREQ significantly reduces manual effort in troubleshooting upgrades, advancing Python dependency maintenance automation.
- Abstract(参考訳): Pythonのサードパーティライブラリ(TPL)は、現代のソフトウェア開発において必須であるが、アップグレードはしばしば互換性の問題を引き起こし、システム障害につながる。
これらの問題は、バージョン互換性問題(VCI)とコード互換性問題(CCI)の2つのカテゴリに分類される。
既存のツールは依存性の競合を主に検出するが、VCIとCCIの両方で互換性のあるバージョンの推論を完全に自動化するソリューションがないため、コードレベルの非互換性を見落としている。
このギャップを埋めるために、バージョンとコード互換性分析を組み合わせることで互換性のある要求を自動的に推測する最初のアプローチであるPCREQを提案する。
PCREQは、知識獲得、バージョン互換性評価、呼び出しAPIとモジュール抽出、コード互換性評価、バージョン変更、TPL補完の欠如という6つのモジュールを統合している。
PCREQは、候補バージョンを収集し、競合をチェックし、APIの使用を識別し、コードの互換性を評価し、互換性のある要求を生成するためにバージョンを反復的に調整する。
PCREQを評価するために,2,095件のアップグレードテストケース(pipで解決できない406件を含む)を備えた大規模ベンチマークであるREQBenchを構築した。
その結果、PCREQは94.03%の推論成功率を獲得し、PyEGo(37.02%)、ReadPyE(37.16%)、LCMベースのアプローチ(GPT-4o、DeepSeek V3/R1)を18-20%上回った。
PCREQは平均60.79秒でREQBenchから各ケースを処理し、実用的な効率を示す。
PCREQは、アップグレードのトラブルシューティングにおける手作業を大幅に削減し、Pythonの依存性のメンテナンスを自動化する。
関連論文リスト
- SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。
従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文 参考訳(メタデータ) (2025-05-29T18:28:02Z) - SOPBench: Evaluating Language Agents at Following Standard Operating Procedures and Constraints [59.645885492637845]
SOPBenchは、各サービス固有のSOPコードプログラムを実行可能な関数の有向グラフに変換する評価パイプラインである。
提案手法では,各サービス固有のSOPコードプログラムを実行可能関数の有向グラフに変換し,自然言語SOP記述に基づいてこれらの関数を呼び出しなければならない。
我々は18の先行モデルを評価し、上位モデルでさえタスクが困難であることを示す。
論文 参考訳(メタデータ) (2025-03-11T17:53:02Z) - CLOVER: A Test Case Generation Benchmark with Coverage, Long-Context, and Verification [71.34070740261072]
本稿では,テストケースの生成と完成におけるモデルの能力を評価するためのベンチマークCLOVERを提案する。
ベンチマークはタスク間でのコード実行のためにコンテナ化されています。
論文 参考訳(メタデータ) (2025-02-12T21:42:56Z) - Raiders of the Lost Dependency: Fixing Dependency Conflicts in Python using LLMs [10.559292676550319]
Python開発者は、サードパーティモジュールとPythonインタプリタの環境依存性とバージョン制約を手動で識別し、解決する必要がある。
従来のアプローチでは、さまざまな依存性エラータイプ、可能なモジュールバージョンの大規模なセット、コンフリクトによる制限に直面していました。
本研究では,Pythonプログラムの依存性問題を自動的に修正するために,大規模言語モデル(LLM)を使用する可能性について検討する。
論文 参考訳(メタデータ) (2025-01-27T16:45:34Z) - PCART: Automated Repair of Python API Parameter Compatibility Issues [11.36053416670063]
Pythonのサードパーティライブラリは、特にディープラーニングや科学計算といった分野において、重要な役割を担っている。
これらのライブラリのAPIパラメータは進化の過程でしばしば変化し、特定のバージョンに依存したクライアントアプリケーションの互換性の問題を引き起こす。
Python APIパラメータの互換性問題を自動的に検出し、修正するツールは存在しない。
PCARTは、API抽出、コードインスツルメンテーション、APIマッピング確立、互換性評価、修復、バリデーションのプロセスを完全に自動化する最初のソリューションである。
論文 参考訳(メタデータ) (2024-06-06T08:15:12Z) - Less is More? An Empirical Study on Configuration Issues in Python PyPI
Ecosystem [38.44692482370243]
Pythonはオープンソースコミュニティで広く使われている。
サードパーティのライブラリは依存関係の衝突を引き起こす可能性があるため、研究者は依存関係の衝突検知器を開発する必要がある。
依存関係を自動的に推論する試みが実施された。
論文 参考訳(メタデータ) (2023-10-19T09:07:51Z) - SWE-bench: Can Language Models Resolve Real-World GitHub Issues? [80.52201658231895]
SWE-benchは、実際のGitHub問題から引き出された2,294ドルのソフトウェアエンジニアリング問題と、人気のあるPythonリポジトリ12ドルのプルリクエストで構成される評価フレームワークである。
我々は、最先端のプロプライエタリモデルと微調整モデルSWE-Llamaの両方が、最も単純な問題だけを解決できることを示します。
論文 参考訳(メタデータ) (2023-10-10T16:47:29Z) - Knowledge-Based Version Incompatibility Detection for Deep Learning [32.116361254082086]
我々は、Stack OverflowからDLバージョン問題に関する豊富な議論を活用して、バージョン非互換性の検出を容易にすることを提案する。
質問応答(QA)問題として知識抽出の問題を修正し,事前学習したQAモデルを用いてバージョン互換性知識を抽出する。
論文 参考訳(メタデータ) (2023-08-25T09:53:26Z) - UQpy v4.1: Uncertainty Quantification with Python [4.6405927770229]
本稿では、UQpyのバージョン4で導入された最新の改善、Pythonによる不確実性定量化、ライブラリについて述べる。
最新バージョンでは、コードは最新のPythonコーディング規約に従って再構成された。
UQpyの堅牢性を改善するために、ソフトウェアエンジニアリングのベストプラクティスが採用された。
論文 参考訳(メタデータ) (2023-05-16T16:11:04Z) - Latte: Cross-framework Python Package for Evaluation of Latent-Based
Generative Models [65.51757376525798]
Latteは、潜伏型生成モデルを評価するためのPythonライブラリである。
LatteはPyTorchと/Kerasの両方と互換性があり、関数型APIとモジュール型APIの両方を提供する。
論文 参考訳(メタデータ) (2021-12-20T16:00:28Z) - Compatibility-aware Heterogeneous Visual Search [93.90831195353333]
既存のシステムは、同じ埋め込みモデルを使用して、クエリとギャラリーイメージの表現(埋め込み)を計算します。
1つは埋め込みを計算する各モデルのパラメータを変更し、もう1つは埋め込みを計算するアーキテクチャを変更して実行します。
最大埋め込みモデル(パラゴン)を用いた通常の(均一な)ビジュアルサーチと比較して,CMP-NASは80倍,23倍のコスト削減を実現している。
論文 参考訳(メタデータ) (2021-05-13T02:30:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。