論文の概要: Guiding Effort Allocation in Open-Source Software Projects Using Bus
Factor Analysis
- arxiv url: http://arxiv.org/abs/2401.03303v1
- Date: Sat, 6 Jan 2024 20:55:40 GMT
- ステータス: 処理完了
- システム内更新日: 2024-01-09 19:25:17.050973
- Title: Guiding Effort Allocation in Open-Source Software Projects Using Bus
Factor Analysis
- Title(参考訳): バスファクター分析を用いたオープンソースソフトウェアプロジェクトの取り組み
- Authors: Aliza Lisan, Boyana Norris
- Abstract要約: プロジェクトのバスファクタ(BF)は、「プロジェクトが進めないよう無力化する必要がある主要な開発者の数」と定義されている。
コード変更行(LOCC)やコード行のコサイン差(change-size-cos)といった他のメトリクスを用いてBFを計算することを提案する。
- 参考スコア(独自算出の注目度): 1.0878040851638
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A critical issue faced by open-source software projects is the risk of key
personnel leaving the project. This risk is exacerbated in large projects that
have been under development for a long time and experienced growth in their
development teams. One way to quantify this risk is to measure the
concentration of knowledge about the project among its developers. Formally
known as the Bus Factor (BF) of a project and defined as 'the number of key
developers who would need to be incapacitated to make a project unable to
proceed'. Most of the proposed algorithms for BF calculation measure a
developer's knowledge of a file based on the number of commits. In this work,
we propose using other metrics like lines of code changes (LOCC) and cosine
difference of lines of code (change-size-cos) to calculate the BF. We use these
metrics for BF calculation for five open-source GitHub projects using the CST
algorithm and the RIG algorithm, which is git-blame-based. Moreover, we
calculate the BF on project sub-directories that have seen the most active
development recently. Lastly, we compare the results of the two algorithms in
accuracy, similarity in results, execution time, and trends in BF values over
time.
- Abstract(参考訳): オープンソースプロジェクトが直面する重要な問題は、主要な人材がプロジェクトを離れるリスクである。
このリスクは、長い間開発が続けられ、開発チームが成長してきた大規模プロジェクトで悪化します。
このリスクを定量化するひとつの方法は、プロジェクトに関する知識の集中度を測定することだ。
正式にはプロジェクトのバスファクタ(BF)と呼ばれ、"プロジェクトが進行できないようにするのに無力になる必要のある主要な開発者の数"と定義されている。
提案したBF計算アルゴリズムのほとんどは、コミット数に基づいて、開発者のファイルの知識を測定する。
本研究では,コードの変更行数(locc)やコード行数のコサイン差(change-size-cos)などのメトリクスを用いてbfを計算する。
CSTアルゴリズムとRIGアルゴリズム(git-blame-based)を用いて、これらのメトリクスをオープンソースの5つのGitHubプロジェクトでBF計算に使用します。
また,近年最も活発な開発が見られたプロジェクトサブディレクトリ上でbfを算出する。
最後に,2つのアルゴリズムの精度,結果の類似性,実行時間,時間経過に伴うBF値の傾向を比較した。
関連論文リスト
- DevEval: Evaluating Code Generation in Practical Software Projects [52.16841274646796]
我々はDevEvalという名の新しいベンチマークを提案し、実践プロジェクトにおける開発者の経験と一致している。
DevEvalは、119の実用的なプロジェクトから2,690のサンプルを含む厳格なパイプラインを通じて収集される。
DevEvalの5つの人気のあるLCMを評価し、コード生成における実際の能力を明らかにする。
論文 参考訳(メタデータ) (2024-01-12T06:51:30Z) - Code Ownership in Open-Source AI Software Security [18.779538756226298]
コードオーナシップのメトリクスを使用して、5つの著名なオープンソースAIソフトウェアプロジェクトにおける潜在的な脆弱性との相関を調査します。
この結果は、ハイレベルなオーナシップ(マイナーなコントリビュータの数が限られている)と脆弱性の減少との間に肯定的な関係があることを示唆している。
これらの新しいコードオーナシップメトリクスによって、プロジェクトキュレーターや品質保証の専門家が現場プロジェクトを評価し、ベンチマークするのを助けるために、Pythonベースのコマンドラインアプリケーションを実装しました。
論文 参考訳(メタデータ) (2023-12-18T00:37:29Z) - How Early Participation Determines Long-Term Sustained Activity in
GitHub Projects? [20.236570418427533]
早期参加要因と長期プロジェクト持続可能性との関係を検討することを目的とする。
我々は、290,255のGitHubプロジェクトの持続可能性を予測するために、Blumbergのパフォーマンスモデルと機械学習を組み合わせた新しい方法論を活用する。
OSSプロジェクトのインキュベーションに先行経験があれば,早期参加者がプロジェクトの将来の持続的活動に肯定的な影響を与えることを定量的に示す。
論文 参考訳(メタデータ) (2023-08-11T08:24:41Z) - Fast Optimal Locally Private Mean Estimation via Random Projections [58.603579803010796]
ユークリッド球における高次元ベクトルの局所的プライベート平均推定の問題について検討する。
プライベート平均推定のための新しいアルゴリズムフレームワークであるProjUnitを提案する。
各ランダム化器はその入力をランダムな低次元部分空間に投影し、結果を正規化し、最適なアルゴリズムを実行する。
論文 参考訳(メタデータ) (2023-06-07T14:07:35Z) - Leveraging Data Mining Algorithms to Recommend Source Code Changes [7.959841510571622]
本論文では、4つのデータマイニングアルゴリズムを用いてソースコード変更を推奨する自動手法を提案する。
性能(精度,リコール,F測定)と実行時間の比較を行った。
Aprioriは大規模プロジェクトに適しているように見えるが、Eclatは小規模プロジェクトに適しているようだ。
論文 参考訳(メタデータ) (2023-04-29T18:38:23Z) - The Cascaded Forward Algorithm for Neural Network Training [61.06444586991505]
本稿では,ニューラルネットワークのための新しい学習フレームワークであるCascaded Forward(CaFo)アルゴリズムを提案する。
FFとは異なり、我々のフレームワークは各カスケードブロックのラベル分布を直接出力する。
我々のフレームワークでは、各ブロックは独立して訓練できるので、並列加速度システムに容易に展開できる。
論文 参考訳(メタデータ) (2023-03-17T02:01:11Z) - Scalable Batch Acquisition for Deep Bayesian Active Learning [70.68403899432198]
ディープラーニングでは、各ステップでマークアップする複数の例を選択することが重要です。
BatchBALDのような既存のソリューションでは、多くの例を選択する際に大きな制限がある。
本稿では,より計算効率のよいLarge BatchBALDアルゴリズムを提案する。
論文 参考訳(メタデータ) (2023-01-13T11:45:17Z) - Code Recommendation for Open Source Software Developers [32.181023933552694]
CODERは、オープンソースのソフトウェア開発者のための新しいグラフベースのコードレコメンデーションフレームワークである。
本フレームワークは,プロジェクト内,クロスプロジェクト,コールドスタートレコメンデーションなど,様々な実験環境下での優れた性能を実現する。
論文 参考訳(メタデータ) (2022-10-15T16:40:36Z) - Big Data = Big Insights? Operationalising Brooks' Law in a Massive
GitHub Data Set [1.1470070927586014]
大規模リポジトリデータにおける開発者の生産性に関する最近の研究の相違を説明できる課題について検討する。
私たちは、私たちの知る限り、チームのサイズやコラボレーションパターンが個人的および集団的生産性に与える影響を調べるために、GitHubプロジェクトの最大の、キュレートされたコーパスを提供しています。
論文 参考訳(メタデータ) (2022-01-12T17:25:30Z) - AsySQN: Faster Vertical Federated Learning Algorithms with Better
Computation Resource Utilization [159.75564904944707]
垂直連合学習(VFL)のための非同期準ニュートン(AsySQN)フレームワークを提案する。
提案アルゴリズムは、逆ヘッセン行列を明示的に計算することなく、近似して降下ステップをスケールする。
本稿では,非同期計算を採用することにより,計算資源の有効利用が期待できることを示す。
論文 参考訳(メタデータ) (2021-09-26T07:56:10Z) - Efficient Computation of Expectations under Spanning Tree Distributions [67.71280539312536]
本稿では,エッジファクター,非プロジェクティブ・スパンニングツリーモデルにおいて,一階期待と二階期待の重要なケースに対する統一アルゴリズムを提案する。
我々のアルゴリズムは勾配と期待の基本的な関係を利用しており、効率的なアルゴリズムを導出することができる。
論文 参考訳(メタデータ) (2020-08-29T14:58:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。