論文の概要: An ML-based Approach to Predicting Software Change Dependencies: Insights from an Empirical Study on OpenStack
- arxiv url: http://arxiv.org/abs/2508.05034v1
- Date: Thu, 07 Aug 2025 05:16:29 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-08 18:59:39.71418
- Title: An ML-based Approach to Predicting Software Change Dependencies: Insights from an Empirical Study on OpenStack
- Title(参考訳): ソフトウェア変更の依存関係を予測するMLベースのアプローチ:OpenStackに関する実証研究から
- Authors: Arabat, Ali, Sayagh, Mohammed, Hassine, Jameleddine,
- Abstract要約: 現代のソフトウェアシステムでは、依存関係はチーム間で複数のコンポーネントにまたがり、開発とデプロイメントの課題を生み出します。
2つのMLモデルを利用する半自動アプローチを提案する。
提案モデルでは,平均AUCスコアは79.33%,91.89%,Brierスコアは0.11,0.014であった。
- 参考スコア(独自算出の注目度): 0.41232474244672235
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: As software systems grow in complexity, accurately identifying and managing dependencies among changes becomes increasingly critical. For instance, a change that leverages a function must depend on the change that introduces it. Establishing such dependencies allows CI/CD pipelines to build and orchestrate changes effectively, preventing build failures and incomplete feature deployments. In modern software systems, dependencies often span multiple components across teams, creating challenges for development and deployment. They serve various purposes, from enabling new features to managing configurations, and can even involve traditionally independent changes like documentation updates. To address these challenges, we conducted a preliminary study on dependency management in OpenStack, a large-scale software system. Our study revealed that a substantial portion of software changes in OpenStack over the past 10 years are interdependent. Surprisingly, 51.08% of these dependencies are identified during the code review phase-after a median delay of 5.06 hours-rather than at the time of change creation. Developers often spend a median of 57.12 hours identifying dependencies, searching among a median of 463 other changes. To help developers proactively identify dependencies, we propose a semi-automated approach that leverages two ML models. The first model predicts the likelihood of dependencies among changes, while the second identifies the exact pairs of dependent changes. Our proposed models demonstrate strong performance, achieving average AUC scores of 79.33% and 91.89%, and Brier scores of 0.11 and 0.014, respectively. Indeed, the second model has a good top-k recall across all types of pairs, while the top-k precision has room for improvement.
- Abstract(参考訳): ソフトウェアシステムが複雑さを増すにつれて、変更間の依存関係を正確に識別し、管理することがますます重要になる。
例えば、関数を利用する変更は、それを導入する変更に依存する必要があります。
このような依存関係を確立することで、CI/CDパイプラインは変更を効果的にビルドおよびオーケストレーションすることができ、ビルドの失敗や不完全な機能デプロイメントを防止できる。
現代のソフトウェアシステムでは、依存関係はチーム間で複数のコンポーネントにまたがり、開発とデプロイメントの課題を生み出します。
新機能の有効化から構成管理に至るまで,さまざまな目的で機能すると同時に,ドキュメント更新など従来から独立した変更も含んでいる。
これらの課題に対処するため、我々は大規模なソフトウェアシステムであるOpenStackの依存性管理に関する予備的な研究を行った。
私たちの調査によると、過去10年間のOpenStackにおけるソフトウェア変更の大部分は、相互依存であることがわかった。
驚いたことに、これらの依存関係の51.08%は、コードレビューフェーズ中に特定される。
開発者は57.12時間の中央値で依存関係を識別し、中央値で463回の変更を検索することが多い。
開発者が依存関係を積極的に識別するために、2つのMLモデルを活用する半自動アプローチを提案する。
第1のモデルは変更間の依存関係の可能性を予測し、第2のモデルは依存する変更の正確なペアを特定する。
提案モデルでは,平均AUCスコアは79.33%,91.89%,Brierスコアは0.11,0.014であった。
実際、第2のモデルはあらゆる種類のトップkリコールを備えており、トップk精度は改善の余地がある。
関連論文リスト
- Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - Enhancing Software Maintenance: A Learning to Rank Approach for Co-changed Method Identification [0.7285835869818668]
本稿では、ソースコードの特徴と変更履歴を組み合わせて、プル-リクエストレベルで共変更したメソッドを予測・ランク付けする学習 to-rankアプローチを提案する。
150のオープンソースプロジェクトの実験では、合計4150万行のコードと634,216のプルリクエストがあり、Random ForestモデルはNDCG@5で2.5から12.8%、他のモデルを上回っている。
論文 参考訳(メタデータ) (2024-11-28T12:23:02Z) - DeMuVGN: Effective Software Defect Prediction Model by Learning Multi-view Software Dependency via Graph Neural Networks [37.928355252723996]
DeMuVGNは、グラフニューラルネットワークを介してマルチビューソフトウェア依存を学習する欠陥予測モデルである。
データ、呼び出し、開発者の依存関係を統合するマルチビューソフトウェア依存性グラフを導入します。
20バージョンにわたる8つのオープンソースプロジェクトのケーススタディでは、DeMuVGNが大幅に改善されている。
論文 参考訳(メタデータ) (2024-10-25T13:24:04Z) - See to Believe: Using Visualization To Motivate Updating Third-party Dependencies [1.7914660044009358]
サードパーティの依存関係を使用したアプリケーションによって導入されたセキュリティ脆弱性が増加している。
開発者はライブラリのアップデートに注意を払っており、脆弱性の修正にも注意している。
本稿では、依存性グラフ可視化(DGV)アプローチが、開発者が更新を動機付けると仮定する。
論文 参考訳(メタデータ) (2024-05-15T03:57:27Z) - Masked Thought: Simply Masking Partial Reasoning Steps Can Improve Mathematical Reasoning Learning of Language Models [102.72940700598055]
推論タスクでは、小さなエラーでも不正確な結果にカスケードすることができる。
入力の摂動に頼らず、外部リソースの導入を避ける手法を開発した。
私たちのトレーニングアプローチでは、思考の連鎖の中で特定のトークンをランダムにマスクします。
論文 参考訳(メタデータ) (2024-03-04T16:21:54Z) - Analyzing the Evolution of Inter-package Dependencies in Operating
Systems: A Case Study of Ubuntu [7.76541950830141]
オペレーティングシステム(OS)は複数の相互依存ソフトウェアパッケージを結合し、通常は独自に開発されたアーキテクチャを持つ。
進化的な努力のために、OSのデザイナや開発者たちは、個々のファイルにフォーカスするシステム全体の依存性を完全に理解することで、大きな恩恵を受けることができます。
本稿では,個々のバイナリファイルのレベルでの詳細なパッケージ関係の発見を目的としたフレームワークであるDepExを提案する。
論文 参考訳(メタデータ) (2023-07-10T10:12:21Z) - Dependency Update Strategies and Package Characteristics [5.119787101452765]
本研究は,パッケージ特性と依存者が選択した依存関係更新戦略との関係について検討する。
我々は112,000 npm以上のパッケージを調査し、19の特性を用いて、各パッケージの共通依存関係更新戦略を特定する予測モデルを構築した。
論文 参考訳(メタデータ) (2023-05-25T02:58:21Z) - DiffStack: A Differentiable and Modular Control Stack for Autonomous
Vehicles [75.43355868143209]
DiffStackは、予測、計画、制御のための、微分可能でモジュラーなスタックです。
nuScenesデータセットの結果から,DiffStackによるエンドツーエンドトレーニングは,オープンループおよびクローズループ計画の指標を大幅に改善することが示された。
論文 参考訳(メタデータ) (2022-12-13T09:05:21Z) - Deep learning model solves change point detection for multiple change
types [69.77452691994712]
変更点検出は、データ分散の急激な障害をキャッチすることを目的としている。
本稿では,マルチディストリビューションシナリオにおけるアプローチを提案する。
論文 参考訳(メタデータ) (2022-04-15T09:44:21Z) - Superiority of Simplicity: A Lightweight Model for Network Device
Workload Prediction [58.98112070128482]
本稿では,歴史観測に基づく時系列予測のための軽量な解を提案する。
ニューラルネットワークと平均予測器という2つのモデルからなる異種アンサンブル法で構成されている。
利用可能なFedCSIS 2020チャレンジデータセットの総合的なR2$スコア0.10を達成している。
論文 参考訳(メタデータ) (2020-07-07T15:44:16Z) - Connecting the Dots: Multivariate Time Series Forecasting with Graph
Neural Networks [91.65637773358347]
多変量時系列データに特化して設計された汎用グラフニューラルネットワークフレームワークを提案する。
グラフ学習モジュールを用いて,変数間の一方向関係を自動的に抽出する。
提案手法は,4つのベンチマークデータセットのうち3つにおいて,最先端のベースライン手法よりも優れている。
論文 参考訳(メタデータ) (2020-05-24T04:02:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。