論文の概要: Individual context-free online community health indicators fail to identify open source software sustainability
- arxiv url: http://arxiv.org/abs/2309.12120v3
- Date: Thu, 9 May 2024 14:34:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-05-10 18:19:06.781791
- Title: Individual context-free online community health indicators fail to identify open source software sustainability
- Title(参考訳): 個別の文脈のないオンラインコミュニティの健康指標がオープンソースソフトウェアサステナビリティの特定に失敗
- Authors: Yo Yehudi, Carole Goble, Caroline Jay,
- Abstract要約: 私たちは1年間に38のオープンソースプロジェクトを監視しました。
この期間に計画は放棄されず、計画された1つのプロジェクトのみが閉鎖された。
結果は極めて異質で、ドキュメント間の共通性はほとんどなく、イシューやコードコントリビューションに対するレスポンス時間の平均、資金/スタッフリソースが利用可能でした。
- 参考スコア(独自算出の注目度): 3.192308005611312
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The global value of open source software is estimated to be in the billions or trillions worldwide1, but despite this, it is often under-resourced and subject to high-impact security vulnerabilities and stability failures2,3. In order to investigate factors contributing to open source community longevity, we monitored thirty-eight open source projects over the period of a year, focusing primarily, but not exclusively, on open science-related online code-oriented communities. We measured performance indicators, using both subjective and qualitative measures (participant surveys), as well as using computational scripts to retrieve and analyse indicators associated with these projects' online source control codebases. None of the projects were abandoned during this period, and only one project entered a planned shutdown. Project ages spanned from under one year to over forty years old at the start of the study, and results were highly heterogeneous, showing little commonality across documentation, mean response times for issues and code contributions, and available funding/staffing resources. Whilst source code-based indicators were able to offer some insights into project activity, we observed that similar indicators across different projects often had very different meanings when context was taken into account. We conclude that the individual context-free metrics we studied were not sufficient or essential for project longevity and sustainability, and might even become detrimental if used to support high-stakes decision making. When attempting to understand an online open community's longer-term sustainability, we recommend that researchers avoid cross-project quantitative comparisons, and advise instead that they use single-project-level assessments which combine quantitative measures with contextualising qualitative data.
- Abstract(参考訳): オープンソースソフトウェアのグローバルな価値は、全世界で数十億、数十億と見積もられているが、それにもかかわらず、過度にリソースが不足し、高負荷のセキュリティ脆弱性と安定性の障害が2,3。
オープンソースコミュニティの長寿に寄与する要因を調べるため、我々は1年間に38のオープンソースプロジェクトを監視し、主にオープンサイエンス関連のオンラインコード指向コミュニティに焦点を当てた。
我々は,主観的,定性的な指標(参加者調査)と,これらのプロジェクトのオンラインソース管理コードベースに関連する指標を検索・分析するための計算スクリプトを用いて,パフォーマンス指標を測定した。
この期間に計画は放棄されず、計画された1つのプロジェクトのみが閉鎖された。
研究開始から1年足らずのプロジェクト年齢は40歳を超え、結果は極めて異質で、ドキュメント間の共通性はほとんどなく、問題やコードのコントリビューションに対するレスポンス時間の平均が低く、資金やスタッフのリソースが利用可能でした。
ソースコードベースのインジケータはプロジェクトのアクティビティについていくつかの洞察を与えることができたが、異なるプロジェクトにわたる同様のインジケータは、コンテキストを考慮した場合、しばしば全く異なる意味を持つ。
調査した文脈フリーのメトリクスは、プロジェクトの長寿と持続可能性には不十分で、高い意思決定を支援するために使うと有害になる可能性があると結論付けました。
オンラインオープンコミュニティの長期的な持続可能性を理解しようとする場合、研究者はクロスプロジェクト定量的比較を避けて、定量的尺度と質的データを組み合わせた単一プロジェクトレベルのアセスメントを使用することを推奨する。
関連論文リスト
- Leveraging Large Language Models for Efficient Failure Analysis in Game Development [47.618236610219554]
本稿では,テストの失敗の原因となるコードの変更を自動的に識別する手法を提案する。
このメソッドは、LLM(Large Language Models)を利用して、エラーメッセージと対応するコード変更を関連付ける。
当社のアプローチは新たに作成したデータセットで71%の精度に達しています。
論文 参考訳(メタデータ) (2024-06-11T09:21:50Z) - Free Open Source Communities Sustainability: Does It Make a Difference
in Software Quality? [2.981092370528753]
本研究は,サステナビリティの異なる側面がソフトウェア品質に与える影響を実証的に検討することを目的とする。
4つのカテゴリにわたる16のサステナビリティ指標をサンプリングし、217のOSSプロジェクトに適用した。
論文 参考訳(メタデータ) (2024-02-10T09:37:44Z) - Guiding Effort Allocation in Open-Source Software Projects Using Bus
Factor Analysis [1.0878040851638]
プロジェクトのバスファクタ(BF)は、「プロジェクトが進めないよう無力化する必要がある主要な開発者の数」と定義されている。
コード変更行(LOCC)やコード行のコサイン差(change-size-cos)といった他のメトリクスを用いてBFを計算することを提案する。
論文 参考訳(メタデータ) (2024-01-06T20:55:40Z) - Towards Learning Geometric Eigen-Lengths Crucial for Fitting Tasks [62.89746245940464]
低次元であるが決定的な幾何固有長は幾何的タスクの成功を決定することが多い。
人間はそのような重要な幾何学的固有長を共通の意味で具現化してきた。
学習システムに同様の能力が備わっているかは、いまだ不明で未解明のままである。
論文 参考訳(メタデータ) (2023-12-25T04:41:52Z) - Code Ownership in Open-Source AI Software Security [18.779538756226298]
コードオーナシップのメトリクスを使用して、5つの著名なオープンソースAIソフトウェアプロジェクトにおける潜在的な脆弱性との相関を調査します。
この結果は、ハイレベルなオーナシップ(マイナーなコントリビュータの数が限られている)と脆弱性の減少との間に肯定的な関係があることを示唆している。
これらの新しいコードオーナシップメトリクスによって、プロジェクトキュレーターや品質保証の専門家が現場プロジェクトを評価し、ベンチマークするのを助けるために、Pythonベースのコマンドラインアプリケーションを実装しました。
論文 参考訳(メタデータ) (2023-12-18T00:37:29Z) - Empowering Many, Biasing a Few: Generalist Credit Scoring through Large
Language Models [53.620827459684094]
大規模言語モデル(LLM)は、複数のタスクにまたがる強力な一般化能力を持つ信用スコアリングタスクにおいて大きな可能性を秘めている。
クレジットスコアリングのための LLM を探索する,初のオープンソース包括的フレームワークを提案する。
そこで我々は,各種金融リスク評価タスクの煩雑な要求に合わせて,指導チューニングによる最初の信用・リスク評価大言語モデル(CALM)を提案する。
論文 参考訳(メタデータ) (2023-10-01T03:50:34Z) - How Early Participation Determines Long-Term Sustained Activity in
GitHub Projects? [20.236570418427533]
早期参加要因と長期プロジェクト持続可能性との関係を検討することを目的とする。
我々は、290,255のGitHubプロジェクトの持続可能性を予測するために、Blumbergのパフォーマンスモデルと機械学習を組み合わせた新しい方法論を活用する。
OSSプロジェクトのインキュベーションに先行経験があれば,早期参加者がプロジェクトの将来の持続的活動に肯定的な影響を与えることを定量的に示す。
論文 参考訳(メタデータ) (2023-08-11T08:24:41Z) - L-Eval: Instituting Standardized Evaluation for Long Context Language
Models [91.05820785008527]
長い文脈言語モデル(LCLM)のより標準化された評価を行うためにL-Evalを提案する。
20のサブタスク、508の長いドキュメント、2000以上の人間ラベルのクエリ応答対を含む新しい評価スイートを構築した。
その結果、一般的なn-gramマッチングの指標は人間の判断とよく相関しないことがわかった。
論文 参考訳(メタデータ) (2023-07-20T17:59:41Z) - Towards a Critical Open-Source Software Database [0.0]
CrOSSDプロジェクトはOSSプロジェクトのデータベースを構築し、現在のプロジェクトの"健康"状態を測定することを目的としている。
定量的メトリクスは、コントリビュータ数、コミット数、コード行数などのメタデータの自動クローリングを通じて収集される。
手動の分析と自動化ツールによって、選択した“クリティカル”プロジェクトの質的なメトリクスが収集される。
論文 参考訳(メタデータ) (2023-05-02T10:43:21Z) - Dimensions of Commonsense Knowledge [60.49243784752026]
我々は,その関係に特に焦点をあてて,広く普及しているコモンセンスソースを調査した。
我々はこれらの関係を13の知識次元に集約し、それぞれがソースにあるより具体的な関係を抽象化する。
論文 参考訳(メタデータ) (2021-01-12T17:52:39Z) - CNN-based Density Estimation and Crowd Counting: A Survey [65.06491415951193]
本稿では,主にCNNに基づく密度マップ推定法において,群集数モデルについて包括的に検討する。
評価指標から, 観客数データセットで上位3人のパフォーマーを選択した。
我々は、今後のクラウドカウントの展開について、合理的な推測と予測を行うことを期待する。
論文 参考訳(メタデータ) (2020-03-28T13:17:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。