論文の概要: An Empirical Validation of Open Source Repository Stability Metrics
- arxiv url: http://arxiv.org/abs/2508.01358v1
- Date: Sat, 02 Aug 2025 13:14:10 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-12 14:18:32.36822
- Title: An Empirical Validation of Open Source Repository Stability Metrics
- Title(参考訳): オープンソースのリポジトリ安定性指標の実証検証
- Authors: Elijah Kayode Adejumo, Brittany Johnson,
- Abstract要約: 提案する複合安定度指数(CSI)を,高度にランク付けされたGitHubレポジトリ100個を用いて実験し,最初の実証検証を行った。
その結果,(1)週毎のコミット頻度パターンのサンプリングは,レポジトリ間でのコミット頻度の安定性を評価する上で,より有効な尺度であることが示唆された。
これらの知見はいずれも、オープンソースの健康に対する制御理論レンズの有効性を確認し、実世界のプロジェクトモニタリングツールに具体的なエビデンス支援のアプリケーションを提供する。
- 参考スコア(独自算出の注目度): 5.69361786082969
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Over the past few decades, open source software has been continuously integrated into software supply chains worldwide, drastically increasing reliance and dependence. Because of the role this software plays, it is important to understand ways to measure and promote its stability and potential for sustainability. Recent work proposed the use of control theory to understand repository stability and evaluate repositories' ability to return to equilibrium after a disturbance such as the introduction of a new feature request, a spike in bug reports, or even the influx or departure of contributors. This approach leverages commit frequency patterns, issue resolution rate, pull request merge rate, and community activity engagement to provide a Composite Stability Index (CSI). While this framework has theoretical foundations, there is no empirical validation of the CSI in practice. In this paper, we present the first empirical validation of the proposed CSI by experimenting with 100 highly ranked GitHub repositories. Our results suggest that (1) sampling weekly commit frequency pattern instead of daily is a more feasible measure of commit frequency stability across repositories and (2) improved statistical inferences (swapping mean with median), particularly with ascertaining resolution and review times in issues and pull request, improves the overall issue and pull request stability index. Drawing on our empirical dataset, we also derive data-driven half-width parameters that better align stability scores with real project behavior. These findings both confirm the viability of a control-theoretic lens on open-source health and provide concrete, evidence-backed applications for real-world project monitoring tools.
- Abstract(参考訳): 過去数十年間、オープンソースソフトウェアは世界中のソフトウェアサプライチェーンに継続的に統合され、依存度と依存度が大幅に増加した。
このソフトウェアが果たす役割のため、その安定性と持続可能性の測定と促進の方法を理解することが重要である。
最近の研究は、リポジトリの安定性を理解し、新しい機能要求の導入、バグ報告の急増、さらにはコントリビュータの流入や離脱といった混乱の後、リポジトリが平衡に戻る能力を評価するために制御理論を使うことを提案した。
このアプローチでは、コミット頻度パターン、イシュー解決率、プルリクエストマージレート、コミュニティアクティビティエンゲージメントを活用して、複合安定性指標(CSI)を提供する。
この枠組みには理論的基礎があるが、実際にはCSIの実証的な検証は行われていない。
本稿では,100の高度にランク付けされたGitHubリポジトリを実験し,提案したCSIの実証検証を行った。
その結果,(1) 週毎のコミット頻度パターンのサンプリングは,レポジトリ間でのコミット頻度安定のより有効な尺度であり,(2) 統計的推測の改善(中央値のスワッピング平均),特に問題やプルリクエストの解決やレビュー時間の確認,全体的な問題の改善,およびプルリクエストの安定性指数の向上などが示唆された。
経験的データセットに基づいて、安定性スコアと実際のプロジェクトの振る舞いをよりよく整合させる、データ駆動半幅パラメータも導き出します。
これらの知見はいずれも、オープンソースの健康に対する制御理論レンズの有効性を確認し、実世界のプロジェクトモニタリングツールに具体的なエビデンス支援のアプリケーションを提供する。
関連論文リスト
- Commit Stability as a Signal for Risk in Open-Source Projects [7.742297876120563]
オープンソースソフトウェア(OSS)は数兆ドルもの経済的価値を生み出し、世界中の技術インフラにとって欠かせない存在となっている。
組織がOSSにますます依存するにつれて、プロジェクトの進化を理解することが重要です。
安定したコミットパターンは、成熟したガバナンス、持続的なコントリビュータ、レジリエンスを実現する堅牢な開発プロセスといった、根底にあるプロジェクト特性を反映する、という仮説を立てています。
論文 参考訳(メタデータ) (2025-08-04T14:58:39Z) - Introducing Repository Stability [5.211412628335315]
障害後の平衡に戻るためのリポジトリ活動能力であるリポジトリの安定性を理解するためのフレームワークを導入する。
このフレームワークは,コミットパターン,イシュー解決,プルリクエスト処理,コミュニティの関与という4つの指標を通じて,安定性を定量化する。
このフレームワークは制御理論の概念を現代の協調ソフトウェア開発と橋渡しし、将来の経験的検証の基礎を提供する。
論文 参考訳(メタデータ) (2025-04-01T08:47:29Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - Towards Robust Stability Prediction in Smart Grids: GAN-based Approach under Data Constraints and Adversarial Challenges [53.2306792009435]
本稿では,安定したデータのみを用いて,スマートグリッドの不安定性を検出する新しいフレームワークを提案する。
最大98.1%の精度でグリッド安定性を予測でき、98.9%で敵の攻撃を検知できる。
シングルボードコンピュータ上で実装され、7ms以下の平均応答時間でリアルタイムな意思決定を可能にする。
論文 参考訳(メタデータ) (2025-01-27T20:48:25Z) - Revealing the value of Repository Centrality in lifespan prediction of Open Source Software Projects [5.438725298163702]
ユーザ・リポジトリ・ネットワークから新しいメトリクスを提案し,プロジェクト・デプリケーション・予測器に適合させる。
2011年から2023年までの103,354の非フォークGitHub OSSプロジェクトを含む包括的なデータセットを構築しました。
本研究は,HITSの集中度指標とリポジトリの非推奨リスクの相関関係を明らかにする。
論文 参考訳(メタデータ) (2024-05-13T07:07:54Z) - Stability Evaluation via Distributional Perturbation Analysis [28.379994938809133]
分布摂動に基づく安定性評価基準を提案する。
我々の安定性評価基準は,エフェダデータの腐敗とエフェサブ人口シフトの両方に対処できる。
実証実験により,現実のアプリケーションにまたがる安定性評価基準の実用性を検証する。
論文 参考訳(メタデータ) (2024-05-06T06:47:14Z) - FedSkip: Combatting Statistical Heterogeneity with Federated Skip
Aggregation [95.85026305874824]
我々はFedSkipと呼ばれるデータ駆動型アプローチを導入し、フェデレーション平均化を定期的にスキップし、ローカルモデルをクロスデバイスに分散することで、クライアントの最適化を改善する。
我々は、FedSkipがはるかに高い精度、より良いアグリゲーション効率、競合する通信効率を達成することを示すために、さまざまなデータセットに関する広範な実験を行う。
論文 参考訳(メタデータ) (2022-12-14T13:57:01Z) - Regularization Guarantees Generalization in Bayesian Reinforcement
Learning through Algorithmic Stability [48.62272919754204]
ベイズ RL の一般化を、おそらくほぼ正しい (PAC) フレームワークで研究する。
我々の主な貢献は、正規化を加えることで、最適な政策が適切な意味で安定することを示しています。
論文 参考訳(メタデータ) (2021-09-24T07:48:34Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Evaluating Model Robustness and Stability to Dataset Shift [7.369475193451259]
機械学習モデルの安定性を解析するためのフレームワークを提案する。
本手法では,アルゴリズムが性能の悪い分布を決定するために,元の評価データを用いる。
我々は,アルゴリズムの性能を"Worst-case"分布で推定する。
論文 参考訳(メタデータ) (2020-10-28T17:35:39Z) - Fine-Grained Analysis of Stability and Generalization for Stochastic
Gradient Descent [55.85456985750134]
我々は,SGDの反復的リスクによって制御される新しい境界を開発する,平均モデル安定性と呼ばれる新しい安定性尺度を導入する。
これにより、最良のモデルの振舞いによって一般化境界が得られ、低雑音環境における最初の既知の高速境界が導かれる。
我々の知る限りでは、このことはSGDの微分不能な損失関数でさえも初めて知られている安定性と一般化を与える。
論文 参考訳(メタデータ) (2020-06-15T06:30:19Z) - GenDICE: Generalized Offline Estimation of Stationary Values [108.17309783125398]
重要なアプリケーションでは,効果的な推定が依然として可能であることを示す。
我々のアプローチは、定常分布と経験分布の差を補正する比率を推定することに基づいている。
結果として得られるアルゴリズム、GenDICEは単純で効果的である。
論文 参考訳(メタデータ) (2020-02-21T00:27:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。