論文の概要: Measuring Software Innovation with Open Source Software Development Data
- arxiv url: http://arxiv.org/abs/2411.05087v2
- Date: Mon, 30 Jun 2025 14:52:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 15:08:38.632409
- Title: Measuring Software Innovation with Open Source Software Development Data
- Title(参考訳): オープンソースソフトウェア開発データによるソフトウェアイノベーションの測定
- Authors: Eva Maxfield Brown, Cailean Osborne, Peter Cihon, Moritz Böhmecke-Schwafert, Kevin Xu, Mirko Boehm, Knut Blind,
- Abstract要約: 本稿では,GitHub上のオープンソースソフトウェア(OSS)開発活動に基づいた,ソフトウェア革新の新たな尺度を紹介する。
リリース後2年間で、JavaScript、Python、Rubyエコシステムにまたがる33,000のユニークなパッケージから35万のユニークなリリースで、依存関係の成長とリリースの複雑さを調べます。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Existing innovation metrics inadequately capture software innovation, creating blind spots for researchers and policymakers seeking to understand and foster technological innovation in an increasingly software-defined economy. This paper introduces a novel measure of software innovation based on open source software (OSS) development activity on GitHub. We examine the dependency growth and release complexity among 350,000 unique releases from 33,000 unique packages across the JavaScript, Python, and Ruby ecosystems over two years post-release. We find that the semantic versioning types of OSS releases exhibit ecosystem-specific and maturity-dependent patterns in predicting one-year dependency growth, with minor releases showing relatively consistent adoption across contexts while major and patch releases vary significantly by ecosystem and package size. In addition, while semantic versioning correlates with the technical complexity of the change-set, complexity itself shows minimal correlation with downstream adoption, suggesting that versioning signals rather than technical change drive dependency growth. Overall, while semantic versioning release information can be used as a unit of innovation in OSS development complementary to common sources for innovation metrics (e.g. scientific publications, patents, and standards), this measure should be weighted by ecosystem culture, package maturity, and release type to accurately capture innovation dynamics. We conclude with a discussion of the theoretical and practical implications of this novel measure of software innovation as well as future research directions.
- Abstract(参考訳): 既存のイノベーションメトリクスは、ソフトウェア革新を不適切に捉え、ますますソフトウェア定義経済における技術革新を理解し、発展させようとする研究者や政策立案者にとって盲点を生み出します。
本稿では,GitHub上のオープンソースソフトウェア(OSS)開発活動に基づいた,ソフトウェア革新の新たな尺度を紹介する。
リリース後2年間で、JavaScript、Python、Rubyエコシステムにまたがる33,000のユニークなパッケージから35万のユニークなリリースで、依存関係の成長とリリースの複雑さを調べます。
OSSリリースのセマンティックバージョニングタイプは、エコシステム固有の、成熟度に依存したパターンを示し、マイナーリリースでは、コンテキスト間で比較的一貫した採用が見られ、メジャーリリースとパッチリリースは、エコシステムとパッケージサイズによって大きく異なります。
さらに、セマンティックバージョニングは変更セットの技術的な複雑さと相関するが、複雑性自体は下流の採用と最小限の相関を示す。
全体として、セマンティックバージョニングリリース情報は、イノベーションメトリクス(例えば、科学出版物、特許、標準)の共通情報源を補完するOSS開発におけるイノベーションの単位として使用できるが、この指標は、イノベーションのダイナミクスを正確に捉えるために、エコシステム文化、パッケージの成熟度、リリースタイプによって重み付けられるべきである。
我々は,このソフトウェア革新の新たな尺度の理論的および実践的意義と,今後の研究方向性について論じる。
関連論文リスト
- The Evaluation of Open Source Software Innovativeness [0.0]
これは、機能付加価値の概念に支えられたイノベーションのタイプロジーを示唆している。
この研究は、広く使われているイノベーション指標の欠点を示すことによって、各セクターに特有な革新性評価の新しいアプローチを支持する。
論文 参考訳(メタデータ) (2025-05-06T07:53:11Z) - Edge-Cloud Collaborative Computing on Distributed Intelligence and Model Optimization: A Survey [59.52058740470727]
エッジクラウドコラボレーティブコンピューティング(ECCC)は、現代のインテリジェントアプリケーションの計算要求に対処するための重要なパラダイムとして登場した。
AIの最近の進歩、特にディープラーニングと大規模言語モデル(LLM)は、これらの分散システムの能力を劇的に向上させてきた。
この調査は、基本的なアーキテクチャ、技術の実現、新しいアプリケーションに関する構造化されたチュートリアルを提供する。
論文 参考訳(メタデータ) (2025-05-03T13:55:38Z) - Open Source Software Lifecycle Classification: Developing Wrangling Techniques for Complex Sociotechnical Systems [0.0]
本稿では、オープンソースソフトウェアや他の組織エコシステムを分類する以前の試みについてレビューする。
オープンソースプロジェクトを分類するための、多種多様で時には相反する目的と、これらの競合する関心が、オープンソースソフトウェアプロジェクトや企業がどのように機能するかを包括的に理解する上で、私たちの進歩を妨げているかを調べます。
論文 参考訳(メタデータ) (2025-04-23T12:37:53Z) - Thinking Longer, Not Larger: Enhancing Software Engineering Agents via Scaling Test-Time Compute [61.00662702026523]
より大規模なモデルではなく、推論時間の増加を活用する統合されたテスト時間計算スケーリングフレームワークを提案する。
当社のフレームワークには,内部TTCと外部TTCの2つの補完戦略が組み込まれている。
当社の textbf32B モデルは,DeepSeek R1 671B や OpenAI o1 など,はるかに大きなモデルを上回る 46% の課題解決率を実現している。
論文 参考訳(メタデータ) (2025-03-31T07:31:32Z) - Open Source at a Crossroads: The Future of Licensing Driven by Monetization [11.149764135999437]
オープンソースソフトウェアライセンス(OSSライセンス)は、ロイヤリティや手数料を必要とせずに、様々なソースからの集約プログラムの一部としてソフトウェアを販売または配布することを保証する。
オープンソースはクロスロードであり、ライセンスモデルを再定義し、コミュニティと重要なソフトウェアをサポートする必要性が高まっています。
論文 参考訳(メタデータ) (2025-03-04T17:44:01Z) - Towards a Classification of Open-Source ML Models and Datasets for Software Engineering [52.257764273141184]
オープンソースの事前訓練モデル(PTM)とデータセットは、さまざまな機械学習(ML)タスクに広範なリソースを提供する。
これらのリソースには、ソフトウェア工学(SE)のニーズに合わせた分類がない。
我々は、人気のあるオープンソースのMLリポジトリであるHugging Face (HF)上で、SE指向の分類をPTMとデータセットに適用し、時間とともにPTMの進化を分析する。
論文 参考訳(メタデータ) (2024-11-14T18:52:05Z) - Toward a Cohesive AI and Simulation Software Ecosystem for Scientific Innovation [2.0580344655030554]
我々は,人工知能(AI)とモデリング・シミュレーション(ModSim)ツールを統合し,科学的発見を促進する統合ソフトウェアスタックの必要性について論じる。
注目すべき課題は、AIとModSimの異なるニーズのバランス、特にソフトウェアビルドプラクティスや依存性管理、互換性の面でのバランスだ。
論文 参考訳(メタデータ) (2024-11-14T15:17:50Z) - Lingma SWE-GPT: An Open Development-Process-Centric Language Model for Automated Software Improvement [62.94719119451089]
Lingma SWE-GPTシリーズは、現実世界のコード提出活動から学び、シミュレーションする。
Lingma SWE-GPT 72BはGitHubの30.20%の問題を解決する。
論文 参考訳(メタデータ) (2024-11-01T14:27:16Z) - Characterising Open Source Co-opetition in Company-hosted Open Source Software Projects: The Cases of PyTorch, TensorFlow, and Transformers [5.2337753974570616]
市場競争相手を含む企業は、長い間、オープンソースソフトウェア(OSS)の開発に協力してきた。
オープン・ソース・コ・ペティション」は「オープンソース・コ・ペティション」として知られる協力・競争の絡み合いをもたらす
論文 参考訳(メタデータ) (2024-10-23T19:35:41Z) - An Overview and Catalogue of Dependency Challenges in Open Source Software Package Registries [52.23798016734889]
この記事では、OSSパッケージやライブラリに依存する依存関係関連の課題のカタログを提供する。
このカタログは、これらの課題を理解し、定量化し、克服するために行われた経験的研究に関する科学文献に基づいている。
論文 参考訳(メタデータ) (2024-09-27T16:20:20Z) - The Impact of Large Language Models on Open-source Innovation: Evidence from GitHub Copilot [0.0]
大規模言語モデル(LLM)は、ガイド付き設定における個人の生産性を高めることが示されている。
本稿では,LLMが協調作業の2つの側面,すなわち能力革新と反復的イノベーションに影響を及ぼすかどうかを考察する。
GitHub Copilotの選択的なロールアウトに関する自然な実験を活用することで、GitHub上のオープンソースプロジェクトに注力しています。
コントリビューション全体の飛躍的な増加を観察し、LLMが非ガイド環境で協調的なイノベーションを効果的に増強することを示唆している。
論文 参考訳(メタデータ) (2024-09-12T19:59:54Z) - PVAC: Package Version Activity Categorizer, Leveraging Semantic Versioning in a Heterogeneous System [0.0]
本研究の目的は、異種パッケージマネージャエコシステム内のバージョンアクティビティを評価するための体系的手法とプロトタイプツールの導入である。
3つのコンポーネントからなるパッケージバージョンアクティビティカテゴリ(PVAC)を開発した。
PVACは、さまざまなパッケージバージョン文字列からセマンティックバージョニングの詳細を解析し、一貫した分類とバージョン変更の定量的評価を可能にする。
論文 参考訳(メタデータ) (2024-09-06T19:58:20Z) - Contemporary Software Modernization: Perspectives and Challenges to Deal with Legacy Systems [48.33168695898682]
2000年代初頭に研究テーマとして「ソフトウェア近代化」が登場した。
文学では膨大な量の著作があるにもかかわらず、かなりの限界がある。
論文 参考訳(メタデータ) (2024-07-04T15:49:52Z) - VersiCode: Towards Version-controllable Code Generation [58.82709231906735]
大規模言語モデル(LLM)は、コード生成において大きな進歩を遂げていますが、既存の研究は、ソフトウェア開発の動的な性質を説明できません。
バージョン別コード補完(VSCC)とバージョン別コードマイグレーション(VACM)の2つの新しいタスクを提案する。
VersiCodeについて広範な評価を行い、バージョン管理可能なコード生成が確かに重要な課題であることを示した。
論文 参考訳(メタデータ) (2024-06-11T16:15:06Z) - Towards a Structural Equation Model of Open Source Blockchain Software
Health [0.0]
この研究は探索的因子分析を用いて、一般大衆の関心やソフトウェアの人気を表す潜在構造を特定する。
私たちはGitHubリポジトリでスター、フォーク、テキストの言及が組み合わさっているのに対して、堅牢性のための第2の要因は臨界スコアで構成されていることに気付きました。
ソフトウェアヘルスの構造モデルが提案され、一般の関心が開発者のエンゲージメントに肯定的な影響を与え、ソフトウェアの堅牢性を肯定的に予測する。
論文 参考訳(メタデータ) (2023-10-31T08:47:41Z) - The Software Heritage Open Science Ecosystem [0.0]
ソフトウェア遺産 (Software Heritage) は、ソフトウェアソースコードと関連する開発履歴の公開アーカイブである。
2億5000万以上の共同開発プロジェクトから得られた16億以上のユニークなソースコードファイルをアーカイブしている。
1つのメルクル直接非巡回グラフで公開コードの開発履歴を実体化することで、ソフトウェアに関する実証的研究を支援する。
実験を行うソフトウェアに依存するあらゆる分野において、ソフトウェアアーチファクトのソースコードの可用性と整合性を保証する。
論文 参考訳(メタデータ) (2023-10-16T11:32:03Z) - SoTaNa: The Open-Source Software Development Assistant [81.86136560157266]
SoTaNaはオープンソースのソフトウェア開発アシスタントだ。
ソフトウェア工学の分野のための高品質な命令ベースのデータを生成する。
オープンソースの基盤モデルであるLLaMAを強化するためにパラメータ効率のよい微調整アプローチを採用している。
論文 参考訳(メタデータ) (2023-08-25T14:56:21Z) - The GitHub Development Workflow Automation Ecosystems [47.818229204130596]
大規模なソフトウェア開発は、非常に協力的な取り組みになっています。
この章では、開発ボットとGitHub Actionsのエコシステムについて解説する。
この領域における最先端技術に関する広範な調査を提供する。
論文 参考訳(メタデータ) (2023-05-08T15:24:23Z) - Underproduction: An Approach for Measuring Risk in Open Source Software [9.701036831490766]
「アンダープロダクション」は、ソフトウェアエンジニアリングの労働力の供給が、生産されたソフトウェアに依存している人々の要求と一致しないときに起こる。
本稿では、ソフトウェアにおける相対的アンダープロダクションを特定するための概念的フレームワークと、我々のフレームワークを包括的データセットに適用するための統計的手法を提案する。
論文 参考訳(メタデータ) (2021-02-27T23:18:21Z) - An Empirical Analysis of the R Package Ecosystem [0.0]
私たちは20年間で25,000以上のパッケージ、15万のリリース、1500万ファイルを分析しました。
生態系の歴史的成長は、あらゆる手段の下で堅牢であることに気付きました。
論文 参考訳(メタデータ) (2021-02-19T12:55:18Z) - Benchmarking Graph Neural Networks [75.42159546060509]
グラフニューラルネットワーク(GNN)は、グラフ上のデータから分析および学習するための標準ツールキットとなっている。
成功している分野が主流で信頼性を持つようになるためには、進捗を定量化するためにベンチマークを開発する必要がある。
GitHubリポジトリは1,800のスターと339のフォークに到達し、提案されているオープンソースフレームワークの有用性を実証している。
論文 参考訳(メタデータ) (2020-03-02T15:58:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。