論文の概要: Ecosystem-wide influences on pull request decisions: insights from NPM
- arxiv url: http://arxiv.org/abs/2410.14695v1
- Date: Fri, 04 Oct 2024 13:14:39 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-27 05:40:49.364087
- Title: Ecosystem-wide influences on pull request decisions: insights from NPM
- Title(参考訳): プルリクエスト決定における生態系全体の影響--NPMによる考察
- Authors: Willem Meijer, Mirela Riveni, Ayushi Rastogi,
- Abstract要約: プルベースの開発モデルは、オープンソースプロジェクトにおけるグローバルなコラボレーションを促進する。
NPMエコシステム内の20,052のGitHubプロジェクトから、約1.8万のプルリクエストと2100万のイシューのデータセットを収集しています。
これらのうち98%はデータセット内の別のプロジェクトに依存しており、依存するプロジェクト間のコラボレーションを研究することができる。
- 参考スコア(独自算出の注目度): 1.7205106391379021
- License:
- Abstract: The pull-based development model facilitates global collaboration within open-source software projects. Most research on the pull request decision-making process explored factors within projects, not the broader software ecosystem they comprise. We uncover ecosystem-wide factors that influence pull request acceptance decisions. We collected a dataset of approximately 1.8 million pull requests and 2.1 million issues from 20,052 GitHub projects within the NPM ecosystem. Of these, 98% depend on another project in the dataset, enabling studying collaboration across dependent projects. We employed social network analysis to create a collaboration network in the ecosystem, and mixed effects logistic regression and random forest techniques to measure the impact and predictive strength of the tested features. We find that gaining experience within the software ecosystem through active participation in issue-tracking systems, submitting pull requests, and collaborating with pull request integrators and experienced developers benefits all open-source contributors, especially project newcomers. The results show that combining ecosystem-wide factors with features studied in previous work to predict the outcome of pull requests reached an overall F1 score of 0.92.
- Abstract(参考訳): プルベースの開発モデルは、オープンソースプロジェクト内のグローバルなコラボレーションを促進する。
プルリクエスト決定プロセスに関するほとんどの研究は、彼らが構成するより広範なソフトウェアエコシステムではなく、プロジェクト内の要因を調査した。
我々は、プルリクエストの受け入れ決定に影響を与えるエコシステム全体の要因を明らかにする。
NPMエコシステム内の20,052のGitHubプロジェクトから、約1.8万のプルリクエストと2100万のイシューのデータセットを収集しました。
これらのうち98%はデータセット内の別のプロジェクトに依存しており、依存するプロジェクト間のコラボレーションを研究することができる。
我々は,生態系における協調ネットワークの構築にソーシャルネットワーク分析を用い,ロジスティック回帰法とランダム森林法を併用して,テスト対象の特徴の影響と予測強度を測定した。
私たちは、イシュートラッキングシステムへの積極的な参加、プルリクエストの提出、プルリクエストインテグレータや経験豊富な開発者とのコラボレーションを通じて、ソフトウェアエコシステム内での経験を積むことが、オープンソースコントリビュータ、特にプロジェクト新参者にとってメリットであることに気付きました。
その結果, 生態系全体の要因と過去の研究で検討された特徴を組み合わせることで, プルリクエストの結果を予測することができ, F1総合スコアは0.92となった。
関連論文リスト
- Lingma SWE-GPT: An Open Development-Process-Centric Language Model for Automated Software Improvement [62.94719119451089]
Lingma SWE-GPTシリーズは、現実世界のコード提出活動から学び、シミュレーションする。
Lingma SWE-GPT 72BはGitHubの30.20%の問題を解決する。
論文 参考訳(メタデータ) (2024-11-01T14:27:16Z) - Characterising Open Source Co-opetition in Company-hosted Open Source Software Projects: The Cases of PyTorch, TensorFlow, and Transformers [5.2337753974570616]
市場競争相手を含む企業は、長い間、オープンソースソフトウェア(OSS)の開発に協力してきた。
オープン・ソース・コ・ペティション」は「オープンソース・コ・ペティション」として知られる協力・競争の絡み合いをもたらす
論文 参考訳(メタデータ) (2024-10-23T19:35:41Z) - Multi-domain Knowledge Graph Collaborative Pre-training and Prompt Tuning for Diverse Downstream Tasks [48.102084345907095]
知識グラフ事前学習(KGP)は、大規模知識グラフ(KG)上でニューラルネットワークを事前訓練することを目的としている
MuDoKは、異なる下流タスクバックボーンに適応可能な、プラグインとプレイのプロンプト学習アプローチである。
私たちのフレームワークは、その汎用性、効率性、転送可能性とともに、大幅なパフォーマンス向上をもたらします。
論文 参考訳(メタデータ) (2024-05-21T08:22:14Z) - The GitHub Development Workflow Automation Ecosystems [47.818229204130596]
大規模なソフトウェア開発は、非常に協力的な取り組みになっています。
この章では、開発ボットとGitHub Actionsのエコシステムについて解説する。
この領域における最先端技術に関する広範な調査を提供する。
論文 参考訳(メタデータ) (2023-05-08T15:24:23Z) - Studying the Characteristics of AIOps Projects on GitHub [14.58848716249407]
我々は、AIOpsの実践的特性を理解するために、オープンソースのAIOpsプロジェクトの詳細な分析を行います。
私たちは、GitHubからAIOpsプロジェクトのセットを特定し、リポジトリメトリクスを分析します。
最後に、バグの数などの異なる品質指標を用いて、これらのプロジェクトの品質を評価します。
論文 参考訳(メタデータ) (2022-12-26T18:24:45Z) - Outsourcing Training without Uploading Data via Efficient Collaborative
Open-Source Sampling [49.87637449243698]
従来のアウトソーシングでは、デバイスデータをクラウドサーバにアップロードする必要がある。
我々は、公開および異種ソースから収集された膨大なデータセットである、広く利用可能なオープンソースデータを活用することを提案する。
我々は,オープンソースデータからクラウドトレーニングのためのプロキシデータセットを構築するための,ECOS(Efficient Collaborative Open-source Sampling)と呼ばれる新しい戦略を開発した。
論文 参考訳(メタデータ) (2022-10-23T00:12:18Z) - Code Recommendation for Open Source Software Developers [32.181023933552694]
CODERは、オープンソースのソフトウェア開発者のための新しいグラフベースのコードレコメンデーションフレームワークである。
本フレームワークは,プロジェクト内,クロスプロジェクト,コールドスタートレコメンデーションなど,様々な実験環境下での優れた性能を実現する。
論文 参考訳(メタデータ) (2022-10-15T16:40:36Z) - Nemo: Guiding and Contextualizing Weak Supervision for Interactive Data
Programming [77.38174112525168]
私たちは、WS 学習パイプラインの全体的な生産性を、一般的な WS 監督アプローチと比較して平均20%(最大 47% のタスク)改善する、エンドツーエンドのインタラクティブなスーパービジョンシステムである Nemo を紹介します。
論文 参考訳(メタデータ) (2022-03-02T19:57:32Z) - Estimating Fund-Raising Performance for Start-up Projects from a Market
Graph Perspective [58.353799280109904]
市場環境を利用して未公開プロジェクトの資金調達実績を予測するためのグラフベースの市場環境(GME)モデルを提案する。
具体的には、市場環境を利用して未公開プロジェクトの資金調達実績を予測するグラフベースの市場環境(GME)モデルを提案する。
論文 参考訳(メタデータ) (2021-05-27T02:39:30Z) - Enabling collaborative data science development with the Ballet
framework [9.424574945499844]
本稿では,データサイエンスのコラボレーションをスケールするための新しい概念的フレームワークとmlプログラミングモデルを提案する。
Balletはオープンソースのデータサイエンスを共同で行うための軽量ソフトウェアフレームワークです。
論文 参考訳(メタデータ) (2020-12-14T18:51:23Z) - Representation of Developer Expertise in Open Source Software [12.583969739954526]
We use the World of Code infrastructure to extract the complete set of APIs in the file changed by the open source developer。
次に、API、開発者、プロジェクトのベクター表現にDoc2Vecの埋め込みを使用します。
これらの埋め込みがスキル空間の仮定トポロジを反映しているかどうかを評価する。
論文 参考訳(メタデータ) (2020-05-20T16:36:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。