論文の概要: Fork Entropy: Assessing the Diversity of Open Source Software Projects'
Forks
- arxiv url: http://arxiv.org/abs/2205.09931v2
- Date: Tue, 19 Sep 2023 13:24:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-24 15:25:59.611978
- Title: Fork Entropy: Assessing the Diversity of Open Source Software Projects'
Forks
- Title(参考訳): fork entropy: オープンソースソフトウェアのフォークの多様性を評価する
- Authors: Liang Wang, Zhiwen Zheng, Xiangchen Wu, Baihui Sang, Jierui Zhang,
Xianping Tao
- Abstract要約: OSSプロジェクトのフォーク(フォーク人口)の多様性を測定するためのアプローチを提案する。
このような多様性を測定するために、ラオの二次エントロピーに基づく新しいフォークエントロピー計量を考案する。
対称性、連続性、単調性などの特性により、提案されたフォークエントロピー計量は、プロジェクトのフォーク人口の多様性を定量化するのに有効である。
- 参考スコア(独自算出の注目度): 5.731244417287598
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: On open source software (OSS) platforms such as GitHub, forking and accepting
pull-requests is an important approach for OSS projects to receive
contributions, especially from external contributors who cannot directly commit
into the source repositories. Having a large number of forks is often
considered as an indicator of a project being popular. While extensive studies
have been conducted to understand the reasons of forking, communications
between forks, features and impacts of forks, there are few quantitative
measures that can provide a simple yet informative way to gain insights about
an OSS project's forks besides their count. Inspired by studies on biodiversity
and OSS team diversity, in this paper, we propose an approach to measure the
diversity of an OSS project's forks (i.e., its fork population). We devise a
novel fork entropy metric based on Rao's quadratic entropy to measure such
diversity according to the forks' modifications to project files. With
properties including symmetry, continuity, and monotonicity, the proposed fork
entropy metric is effective in quantifying the diversity of a project's fork
population. To further examine the usefulness of the proposed metric, we
conduct empirical studies with data retrieved from fifty projects on GitHub. We
observe significant correlations between a project's fork entropy and different
outcome variables including the project's external productivity measured by the
number of external contributors' commits, acceptance rate of external
contributors' pull-requests, and the number of reported bugs. We also observe
significant interactions between fork entropy and other factors such as the
number of forks. The results suggest that fork entropy effectively enriches our
understanding of OSS projects' forks beyond the simple number of forks, and can
potentially support further research and applications.
- Abstract(参考訳): githubのようなオープンソースソフトウェア(oss)プラットフォーム上では、プルリクエストのフォークと受け付けは、ossプロジェクトにとって、特に、ソースリポジトリに直接コミットできない外部コントリビュータから、コントリビューションを受け取るための重要なアプローチである。
多数のフォークを持つことは、しばしば、プロジェクトが人気になっていることの指標と見なされる。
フォークの理由、フォーク間のコミュニケーション、フォークの特徴、影響を理解するために広範囲にわたる研究が行われてきたが、OSSプロジェクトのフォークに関する洞察を得るための、単純かつ情報的な方法を提供する定量的な尺度は、数量以外にも少ない。
本稿では,生物多様性とOSSチームの多様性の研究から着想を得て,OSSプロジェクトのフォーク(フォーク人口)の多様性を測定するアプローチを提案する。
我々は,raoの二次エントロピーに基づく新たなフォークエントロピーメトリックを考案し,フォークのプロジェクトファイルへの修正による多様性を測定する。
対称性、連続性、単調性などの特性により、提案されたフォークエントロピー計量は、プロジェクトのフォーク人口の多様性を定量化するのに有効である。
提案手法の有用性をさらに検証するため,github上の50プロジェクトから得られたデータを用いて実証実験を行った。
プロジェクトのフォークエントロピーと、外部コントリビュータのコミット数、外部コントリビュータのプルリクエストの受け入れ率、報告されたバグの数によるプロジェクトの外部生産性など、さまざまな結果変数との間に有意な相関が観察される。
また,フォークエントロピーとフォーク数などの他の因子との有意な相互作用も観察した。
結果として、フォークエントロピーは、単純なフォークの数を超えたOSSプロジェクトのフォークの理解を効果的に強化し、さらなる研究やアプリケーションを支援する可能性があることが示唆された。
関連論文リスト
- The New Dynamics of Open Source: Relicensing, Forks, & Community Impact [0.0]
ベンダーは、人気のあるオープンソースプロジェクトをより制限的なライセンスに再ライセンスし、より多くの収益を生み出すことを期待している。
本研究は,フォークによるライセンス変更に基づく3つのケーススタディの組織関連データを比較した。
研究によると、これらの過激な出来事から生じるフォークは、当初のプロジェクトよりも組織的な多様性が増している。
論文 参考訳(メタデータ) (2024-11-07T14:21:45Z) - Impact of the Availability of ChatGPT on Software Development: A Synthetic Difference in Differences Estimation using GitHub Data [49.1574468325115]
ChatGPTは、ソフトウェア生産効率を向上させるAIツールである。
10万人あたりのgitプッシュ数、リポジトリ数、ユニークな開発者数に対するChatGPTの影響を見積もっています。
これらの結果は、ChatGPTのようなAIツールが開発者の生産性を大幅に向上させる可能性があることを示唆している。
論文 参考訳(メタデータ) (2024-06-16T19:11:15Z) - A Novel Approach for Automated Design Information Mining from Issue Logs [3.5665328754813768]
DRMinerは、オープンソースコミュニティにおける開発者のライブディスカッションから、潜在設計の根拠を自動的に掘り下げる新しい方法である。
私たちはJiraのCassandra、Flink、Solrリポジトリからイシューログを取得し、それを注釈付けして厳格なスキームで処理します。
DRMinerは設計の合理性についてF1スコアを65%獲得し、GPT-4.0よりも7%向上した。
論文 参考訳(メタデータ) (2024-05-30T02:20:04Z) - A Unified Causal View of Instruction Tuning [76.1000380429553]
メタ構造因果モデル(meta-SCM)を開発し、異なるNLPタスクをデータの単一因果構造の下で統合する。
主なアイデアは、タスク要求因果関係を学習し、タスクの予測にのみそれらを使用することである。
論文 参考訳(メタデータ) (2024-02-09T07:12:56Z) - Mitigating Shortcut Learning with Diffusion Counterfactuals and Diverse Ensembles [95.49699178874683]
拡散確率モデル(DPM)を利用したアンサンブル多様化フレームワークDiffDivを提案する。
DPMは、相関した入力特徴を示すサンプルを用いて訓練しても、新しい特徴の組み合わせで画像を生成することができることを示す。
そこで本研究では,DPM誘導の多様化は,教師付き信号の追加を必要とせず,ショートカットキューへの依存を取り除くのに十分であることを示す。
論文 参考訳(メタデータ) (2023-11-23T15:47:33Z) - Towards a Structural Equation Model of Open Source Blockchain Software
Health [0.0]
この研究は探索的因子分析を用いて、一般大衆の関心やソフトウェアの人気を表す潜在構造を特定する。
私たちはGitHubリポジトリでスター、フォーク、テキストの言及が組み合わさっているのに対して、堅牢性のための第2の要因は臨界スコアで構成されていることに気付きました。
ソフトウェアヘルスの構造モデルが提案され、一般の関心が開発者のエンゲージメントに肯定的な影響を与え、ソフトウェアの堅牢性を肯定的に予測する。
論文 参考訳(メタデータ) (2023-10-31T08:47:41Z) - Outlier Suppression: Pushing the Limit of Low-bit Transformer Language
Models [57.933500846742234]
最近の研究は、構造化された外れ値が量子化性能の重要なボトルネックであることを認識している。
本稿では,Gamma Migration と Token-Wise Clipping の2つのコンポーネントを含む外部抑制フレームワークを提案する。
このフレームワークは、アウトレイラを効果的に抑制し、プラグアンドプレイモードで使用することができる。
論文 参考訳(メタデータ) (2022-09-27T12:05:59Z) - LAGOON: An Analysis Tool for Open Source Communities [7.3861897382622015]
LAGOONはオープンソースソフトウェア(OSS)コミュニティのエコシステムを理解するためのオープンソースプラットフォームである。
LAGOONはソースコードリポジトリ、イシュートラッカ、メーリングリスト、ウェブサイトからのコンテンツスクラップなど、いくつかの一般的なソースからアーティファクトを取り込みます。
OSSプロジェクトの完全な社会技術グラフの可視化と探索のためのユーザインターフェースを提供する。
論文 参考訳(メタデータ) (2022-01-26T18:52:11Z) - MetaKernel: Learning Variational Random Features with Limited Labels [120.90737681252594]
少数の注釈付きサンプルから学習し、新しいタスクでうまく一般化できるという根本的かつ困難な問題に、少数のショットラーニングが対処します。
マルチショット学習のためのランダムなフーリエ機能を備えたメタラーニングカーネルをMeta Kernelと呼びます。
論文 参考訳(メタデータ) (2021-05-08T21:24:09Z) - Which contributions count? Analysis of attribution in open source [0.0]
我々は、何千ものプロジェクトを分析することで、オープンソースにおけるコントリビュータ認定モデルを特徴づける。
コミュニティが作成したコントリビューション承認システムによって,アイデア生成やバグ発見といった作業がより可視化されることが分かりました。
論文 参考訳(メタデータ) (2021-03-19T20:14:40Z) - KILT: a Benchmark for Knowledge Intensive Language Tasks [102.33046195554886]
知識集約型言語タスク(KILT)のベンチマークを示す。
KILTのすべてのタスクはウィキペディアのスナップショットと同じだ。
共有密度ベクトル指数とSeq2seqモデルとの結合が強いベースラインであることが分かる。
論文 参考訳(メタデータ) (2020-09-04T15:32:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。