論文の概要: Predicting Maintenance Cessation of Open Source Software Repositories with An Integrated Feature Framework
- arxiv url: http://arxiv.org/abs/2507.21678v1
- Date: Tue, 29 Jul 2025 10:45:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:56.049726
- Title: Predicting Maintenance Cessation of Open Source Software Repositories with An Integrated Feature Framework
- Title(参考訳): 統合機能フレームワークによるオープンソースソフトウェアリポジトリの保守シースレーション予測
- Authors: Yiming Xu, Runzhi He, Hengzhi Ye, Minghui Zhou, Huaimin Wang,
- Abstract要約: オープンソースソフトウェア(OSS)プロジェクトのメンテナンスリスクは、現代のソフトウェアサプライチェーンの品質、セキュリティ、レジリエンスに重大な脅威をもたらす。
プロジェクト文書の明示的なアーカイブ状態と厳密な意味分析に基づく「メンテナンス停止」を導入する。
本稿では,ユーザ中心の機能,メンテナ中心の機能,プロジェクト進化機能などを体系的に組み合わせ,メンテナンス停止を予測するための統合された多視点機能フレームワークを提案する。
- 参考スコア(独自算出の注目度): 14.346295005927347
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The maintenance risks of open source software (OSS) projects pose significant threats to the quality, security, and resilience of modern software supply chains. While prior research has proposed diverse approaches for predicting OSS maintenance risk -- leveraging signals ranging from surface features (e.g., stars, commits) to social network analyses and behavioral patterns -- existing methods often suffer from ambiguous operational definitions, limited interpretability, and datasets of insufficient scale or generalizability. In this work, we introduce ``maintenance cessation'', grounded in both explicit archival status and rigorous semantic analysis of project documentation. Building on this foundation, we curate a large-scale, longitudinal dataset of 115,466 GitHub repositories -- encompassing 57,733 confirmed cessation events -- complemented by comprehensive, timeline-based behavioral features. We propose an integrated, multi-perspective feature framework for predicting maintenance cessation, systematically combining user-centric features, maintainer-centric features and project evolution features. AFT survival analysis demonstrates a high C-index (0.846), substantially outperforming models relying only on surface features. Feature ablation and SHAP analysis further confirm the effectiveness and interpretability of our approach. Finally, we demonstrate real-world applicability by deploying a GBSA classifier in the openEuler ecosystem for proactive package risk screening. Our work establishes a scalable, interpretable foundation for maintenance-risk prediction, enabling reproducible risk management across large-scale open source ecosystems.
- Abstract(参考訳): オープンソースソフトウェア(OSS)プロジェクトのメンテナンスリスクは、現代のソフトウェアサプライチェーンの品質、セキュリティ、レジリエンスに重大な脅威をもたらします。
従来の研究では、表面的な特徴(例えば、星、コミット)から、ソーシャルネットワークの分析や行動パターンに至るまで、OSSのメンテナンスリスクを予測するためのさまざまなアプローチが提案されているが、既存の方法は、あいまいな運用定義、限定的な解釈可能性、スケールや一般化性の不十分なデータセットに悩まされていることが多い。
本稿では,プロジェクト文書の明示的なアーカイブ状態と厳密なセマンティック分析の両方を基盤とした「保守停止」を紹介する。
この基盤の上に構築された115,466のGitHubレポジトリの大規模な時系列データセット — 57,733の確認された停止イベントを含む — は、包括的なタイムラインベースの行動機能によって補完される。
本稿では,ユーザ中心の機能,メンテナ中心の機能,プロジェクト進化機能などを体系的に組み合わせ,メンテナンス停止を予測するための統合された多視点機能フレームワークを提案する。
AFTサバイバル分析は、表面の特徴のみに依存するモデルよりもかなり優れた高いC-インデックス(0.846)を示す。
特徴アブレーションとSHAP分析により,本手法の有効性と解釈性をさらに確認した。
最後に, GBSA分類器をopenEulerエコシステムにデプロイして, 積極的にパッケージのリスクスクリーニングを行うことで, 実世界の適用性を実証する。
我々の研究は、メンテナンスリスク予測のためのスケーラブルで解釈可能な基盤を確立し、大規模なオープンソースエコシステムにおける再現可能なリスク管理を可能にします。
関連論文リスト
- An Accurate and Efficient Vulnerability Propagation Analysis Framework [13.051314477680902]
ソフトウェアサプライチェーンにおける脆弱性の影響範囲と進化を定量化する新しい手法を提案する。
Java Mavenエコシステムで私たちのアプローチのプロトタイプを実装し、100の現実世界の脆弱性で評価します。
論文 参考訳(メタデータ) (2025-06-02T05:55:45Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - SurvHive: a package to consistently access multiple survival-analysis packages [0.0]
SurvHiveはPythonベースのフレームワークで、Scikit-learnをモデルとしたコヒーレントかつインターフェース内でサバイバル分析メソッドを統合するように設計されている。
SurvHiveは古典的な統計モデルと最先端のディープラーニングアプローチを統合しており、トランスフォーマーベースのアーキテクチャやパラメトリックサバイバルモデルを含んでいる。
論文 参考訳(メタデータ) (2025-02-04T11:02:40Z) - Trustworthiness in Retrieval-Augmented Generation Systems: A Survey [59.26328612791924]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の開発において、急速に重要なパラダイムへと成長してきた。
本稿では,RAGシステムの信頼性を,事実性,堅牢性,公正性,透明性,説明責任,プライバシの6つの面で評価する統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2024-09-16T09:06:44Z) - Revealing the value of Repository Centrality in lifespan prediction of Open Source Software Projects [5.438725298163702]
ユーザ・リポジトリ・ネットワークから新しいメトリクスを提案し,プロジェクト・デプリケーション・予測器に適合させる。
2011年から2023年までの103,354の非フォークGitHub OSSプロジェクトを含む包括的なデータセットを構築しました。
本研究は,HITSの集中度指標とリポジトリの非推奨リスクの相関関係を明らかにする。
論文 参考訳(メタデータ) (2024-05-13T07:07:54Z) - Profile of Vulnerability Remediations in Dependencies Using Graph
Analysis [40.35284812745255]
本研究では,グラフ解析手法と改良型グラフ注意畳み込みニューラルネットワーク(GAT)モデルを提案する。
制御フローグラフを分析して、脆弱性の修正を目的とした依存性のアップグレードから発生するアプリケーションの変更をプロファイルします。
結果は、コード脆弱性のリレーショナルダイナミクスに関する微妙な洞察を提供する上で、強化されたGATモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-03-08T02:01:47Z) - Distributionally Robust Statistical Verification with Imprecise Neural Networks [3.9456691693452552]
AI安全性における特に困難な問題は、高次元自律システムの振る舞いを保証することだ。
本稿では,確率の概念を用いた不確実性定量化に基づく新しい手法を提案する。
提案手法は高次元システムに対して有用かつスケーラブルな保証を提供できることを示す。
論文 参考訳(メタデータ) (2023-08-28T18:06:24Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Is Vertical Logistic Regression Privacy-Preserving? A Comprehensive
Privacy Analysis and Beyond [57.10914865054868]
垂直ロジスティック回帰(VLR)をミニバッチ降下勾配で訓練した。
我々は、オープンソースのフェデレーション学習フレームワークのクラスにおいて、VLRの包括的で厳密なプライバシー分析を提供する。
論文 参考訳(メタデータ) (2022-07-19T05:47:30Z) - Learning Output Embeddings in Structured Prediction [73.99064151691597]
構造化予測に対する強力で柔軟なアプローチは、予測される構造化対象を潜在的に無限次元の特徴空間に埋め込むことである。
原空間における予測は、前像問題の解法により計算される。
本研究では,新しい特徴空間に出力埋め込みと回帰関数の有限近似を共同で学習することを提案する。
論文 参考訳(メタデータ) (2020-07-29T09:32:53Z) - An Uncertainty-based Human-in-the-loop System for Industrial Tool Wear
Analysis [68.8204255655161]
人間のループシステムにおけるモンテカルロのドロップアウトに基づく不確実性対策により,システムの透明性と性能が向上することを示す。
シミュレーション研究により、不確実性に基づく「ループ内人間システム」は、様々なレベルの人間の関与に対する性能を高めることが示されている。
論文 参考訳(メタデータ) (2020-07-14T15:47:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。