論文の概要: Predicting Abandonment of Open Source Software Projects with An Integrated Feature Framework
- arxiv url: http://arxiv.org/abs/2507.21678v2
- Date: Wed, 29 Oct 2025 15:15:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-30 20:20:46.439779
- Title: Predicting Abandonment of Open Source Software Projects with An Integrated Feature Framework
- Title(参考訳): 統合機能フレームワークによるオープンソースプロジェクトの廃止予測
- Authors: Yiming Xu, Runzhi He, Hengzhi Ye, Minghui Zhou, Huaimin Wang,
- Abstract要約: オープンソースソフトウェア(OSS)は、現代のソフトウェア開発の基盤であるが、OSSプロジェクトの放棄が増加し、世界的なサプライチェーンが脅かされている。
本研究では,OSSプロジェクトの放棄を2つのアプローチで確実に検出することで,これらの課題に対処する。
この基盤の上に構築され、ユーザ中心、メンテナ中心、プロジェクトの進化的特徴をキャプチャする、放棄予測のための統合されたマルチパースペクティブな機能フレームワークを導入します。
私たちの仕事は、大規模なOSSエコシステムにおける放棄リスクを理解し管理するための再現性、拡張性、実践者指向のサポートを提供します。
- 参考スコア(独自算出の注目度): 15.50732865972961
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Open Source Software (OSS) is a cornerstone of contemporary software development, yet the increasing prevalence of OSS project abandonment threatens global software supply chains. Although previous research has explored abandonment prediction methods, these methods often demonstrate unsatisfactory predictive performance, further plagued by imprecise abandonment discrimination, limited interpretability, and a lack of large, generalizable datasets. In this work, we address these challenges by reliably detecting OSS project abandonment through a dual approach: explicit archival status and rigorous semantic analysis of project documentation or description. Leveraging a precise and scalable labeling pipeline, we curate a comprehensive longitudinal dataset of 115,466 GitHub repositories, encompassing 57,733 confirmed abandonment repositories, enriched with detailed, timeline-based behavioral features. Building on this foundation, we introduce an integrated, multi-perspective feature framework for abandonment prediction, capturing user-centric, maintainer-centric, and project evolution features. Survival analysis using an AFT model yields a high C-index of 0.846, substantially outperforming models confined to surface features. Further, feature ablation and SHAP analyses confirm both the predictive power and interpretability of our approach. We further demonstrate practical deployment of a GBSA classifier for package risk in openEuler. By unifying precise labeling, multi-perspective features, and interpretable modeling, our work provides reproducible, scalable, and practitioner-oriented support for understanding and managing abandonment risk in large OSS ecosystems. Our tool not only predicts abandonment but also enhances program comprehension by providing actionable insights into the health and sustainability of OSS projects.
- Abstract(参考訳): オープンソースソフトウェア(OSS)は、現代のソフトウェア開発の基盤であるが、OSSプロジェクトの放棄が増加し、グローバルなソフトウェアサプライチェーンが脅かされている。
従来の研究では、放棄予測手法を検討しているが、これらの手法は、不正確な放棄差別、限定的な解釈可能性、大規模で一般化可能なデータセットの欠如によってさらに悩まされている、満足のいく予測性能を示すことが多い。
本研究では,OSSプロジェクトの放棄を2つのアプローチで確実に検出することで,これらの課題に対処する。
正確でスケーラブルなラベリングパイプラインを活用して、57,733の確認された放棄レポジトリを含む、115,466のGitHubレポジトリの包括的な時系列データセットをキュレートします。
この基盤の上に構築され、ユーザ中心、メンテナ中心、プロジェクトの進化的特徴をキャプチャする、放棄予測のための統合されたマルチパースペクティブな機能フレームワークを導入します。
AFTモデルを用いた生存分析では、表面特性に制限されたモデルよりもかなり優れた0.846の高C指数が得られる。
さらに,特徴アブレーションとSHAP分析は,我々のアプローチの予測力と解釈可能性の両方を裏付けるものである。
さらに,openEulerのパッケージリスクに対するGBSA分類器の実用的展開を示す。
正確なラベル付け、マルチパースペクティブ機能、解釈可能なモデリングを統一することにより、当社の作業は、大規模なOSSエコシステムにおける放棄リスクを理解し管理するための再現性、スケーラブル、実践者指向のサポートを提供します。
我々のツールは放棄を予測するだけでなく、OSSプロジェクトの健全性と持続可能性に関する実用的な洞察を提供することによって、プログラムの理解を高める。
関連論文リスト
- An Accurate and Efficient Vulnerability Propagation Analysis Framework [13.051314477680902]
ソフトウェアサプライチェーンにおける脆弱性の影響範囲と進化を定量化する新しい手法を提案する。
Java Mavenエコシステムで私たちのアプローチのプロトタイプを実装し、100の現実世界の脆弱性で評価します。
論文 参考訳(メタデータ) (2025-06-02T05:55:45Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - Reasoning with LLMs for Zero-Shot Vulnerability Detection [0.9208007322096533]
textbfVulnSageは,多種多様な大規模オープンソースソフトウェアプロジェクトから収集した,総合的な評価フレームワークである。
このフレームワークは、関数レベル、ファイルレベル、関数間の複数の粒度解析をサポートする。
Baseline、Chain-of-context、Think、Think & verifyの4つの異なるゼロショットプロンプト戦略を採用している。
論文 参考訳(メタデータ) (2025-03-22T23:59:17Z) - SurvHive: a package to consistently access multiple survival-analysis packages [0.0]
SurvHiveはPythonベースのフレームワークで、Scikit-learnをモデルとしたコヒーレントかつインターフェース内でサバイバル分析メソッドを統合するように設計されている。
SurvHiveは古典的な統計モデルと最先端のディープラーニングアプローチを統合しており、トランスフォーマーベースのアーキテクチャやパラメトリックサバイバルモデルを含んでいる。
論文 参考訳(メタデータ) (2025-02-04T11:02:40Z) - Trustworthiness in Retrieval-Augmented Generation Systems: A Survey [59.26328612791924]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)の開発において、急速に重要なパラダイムへと成長してきた。
本稿では,RAGシステムの信頼性を,事実性,堅牢性,公正性,透明性,説明責任,プライバシの6つの面で評価する統一的な枠組みを提案する。
論文 参考訳(メタデータ) (2024-09-16T09:06:44Z) - Revealing the value of Repository Centrality in lifespan prediction of Open Source Software Projects [5.438725298163702]
ユーザ・リポジトリ・ネットワークから新しいメトリクスを提案し,プロジェクト・デプリケーション・予測器に適合させる。
2011年から2023年までの103,354の非フォークGitHub OSSプロジェクトを含む包括的なデータセットを構築しました。
本研究は,HITSの集中度指標とリポジトリの非推奨リスクの相関関係を明らかにする。
論文 参考訳(メタデータ) (2024-05-13T07:07:54Z) - Profile of Vulnerability Remediations in Dependencies Using Graph
Analysis [40.35284812745255]
本研究では,グラフ解析手法と改良型グラフ注意畳み込みニューラルネットワーク(GAT)モデルを提案する。
制御フローグラフを分析して、脆弱性の修正を目的とした依存性のアップグレードから発生するアプリケーションの変更をプロファイルします。
結果は、コード脆弱性のリレーショナルダイナミクスに関する微妙な洞察を提供する上で、強化されたGATモデルの有効性を示す。
論文 参考訳(メタデータ) (2024-03-08T02:01:47Z) - Distributionally Robust Statistical Verification with Imprecise Neural Networks [3.9456691693452552]
AI安全性における特に困難な問題は、高次元自律システムの振る舞いを保証することだ。
本稿では,確率の概念を用いた不確実性定量化に基づく新しい手法を提案する。
提案手法は高次元システムに対して有用かつスケーラブルな保証を提供できることを示す。
論文 参考訳(メタデータ) (2023-08-28T18:06:24Z) - Recursively Feasible Probabilistic Safe Online Learning with Control Barrier Functions [60.26921219698514]
CBFをベースとした安全クリティカルコントローラのモデル不確実性を考慮した再構成を提案する。
次に、結果の安全制御器のポイントワイズ実現可能性条件を示す。
これらの条件を利用して、イベントトリガーによるオンラインデータ収集戦略を考案する。
論文 参考訳(メタデータ) (2022-08-23T05:02:09Z) - Is Vertical Logistic Regression Privacy-Preserving? A Comprehensive
Privacy Analysis and Beyond [57.10914865054868]
垂直ロジスティック回帰(VLR)をミニバッチ降下勾配で訓練した。
我々は、オープンソースのフェデレーション学習フレームワークのクラスにおいて、VLRの包括的で厳密なプライバシー分析を提供する。
論文 参考訳(メタデータ) (2022-07-19T05:47:30Z) - Learning Output Embeddings in Structured Prediction [73.99064151691597]
構造化予測に対する強力で柔軟なアプローチは、予測される構造化対象を潜在的に無限次元の特徴空間に埋め込むことである。
原空間における予測は、前像問題の解法により計算される。
本研究では,新しい特徴空間に出力埋め込みと回帰関数の有限近似を共同で学習することを提案する。
論文 参考訳(メタデータ) (2020-07-29T09:32:53Z) - An Uncertainty-based Human-in-the-loop System for Industrial Tool Wear
Analysis [68.8204255655161]
人間のループシステムにおけるモンテカルロのドロップアウトに基づく不確実性対策により,システムの透明性と性能が向上することを示す。
シミュレーション研究により、不確実性に基づく「ループ内人間システム」は、様々なレベルの人間の関与に対する性能を高めることが示されている。
論文 参考訳(メタデータ) (2020-07-14T15:47:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。