論文の概要: The Dynamics of Innovation in Open Source Software Ecosystems
- arxiv url: http://arxiv.org/abs/2411.14894v1
- Date: Fri, 22 Nov 2024 12:31:25 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-25 15:03:23.148099
- Title: The Dynamics of Innovation in Open Source Software Ecosystems
- Title(参考訳): オープンソースソフトウェアエコシステムにおけるイノベーションのダイナミクス
- Authors: Gábor Mészáros, Johannes Wachs,
- Abstract要約: 新しいライブラリは、ポスト当たりのエコシステム内で驚くほど予測可能なサブ線形レートで出現する。
最も広く使われている図書館は、平均よりも何倍も頻繁に使われている。
新しいユーザは、新しいライブラリと新しい組み合わせを使うことが多い。
- 参考スコア(独自算出の注目度): 0.8594140167290099
- License:
- Abstract: Software libraries are the elementary building blocks of open source software ecosystems, extending the capabilities of programming languages beyond their standard libraries. Although ecosystem health is often quantified using data on libraries and their interdependencies, we know little about the rate at which new libraries are developed and used. Here we study imports of libraries in 12 different programming language ecosystems within millions of Stack Overflow posts over a 15 year period. New libraries emerge at a remarkably predictable sub-linear rate within ecosystems per post. As a consequence, the distribution of the frequency of use of libraries in all ecosystems is highly concentrated: the most widely used libraries are used many times more often than the average. Although new libraries come out more slowly over time, novel combinations of libraries appear at an approximately linear rate, suggesting that recombination is a key innovation process in software. Newer users are more likely to use new libraries and new combinations, and we find significant variation in the rates of innovation between countries. Our work links the evolution of OSS ecosystems to the literature on the dynamics of innovation, revealing how ecosystems grow and highlighting implications for sustainability.
- Abstract(参考訳): ソフトウェアライブラリは、オープンソースのソフトウェアエコシステムの基本的な構成要素であり、プログラミング言語の能力を標準ライブラリを超えて拡張している。
生態系の健全性は、しばしばライブラリとその相互依存性のデータを用いて定量化されるが、新しいライブラリの開発と使用率についてはほとんど分かっていない。
ここでは、12の異なるプログラミング言語エコシステムにおけるライブラリのインポートを、15年間に数百万のStack Overflowポストで調査する。
新しいライブラリは、ポスト当たりのエコシステム内で驚くほど予測可能なサブ線形レートで出現する。
その結果、全ての生態系におけるライブラリの使用頻度の分布は高度に集中しており、最も広く使われているライブラリは平均よりも何倍も頻繁に使用される。
新しいライブラリは時間が経つにつれて徐々に出てくるが、ライブラリの新たな組み合わせは概して線形な速度で現れ、再結合がソフトウェアにおける重要な革新プロセスであることを示唆している。
新しいユーザーは、新しいライブラリや新しい組み合わせを使う傾向が高く、国間でのイノベーションの率に大きな変化が見られる。
私たちの研究は、OSSエコシステムの進化とイノベーションのダイナミクスに関する文献を結び付け、エコシステムがどのように成長し、持続可能性に影響を及ぼすかを明らかにします。
関連論文リスト
- Understanding Abandonment and Slowdown Dynamics in the Maven Ecosystem [3.8393951813478076]
4つに1つの図書館は創設年を超えて生き残れない。
放棄された図書館の中には、ライフサイクルの後半に頻繁なリリース活動のバーストを示すものもある。
論文 参考訳(メタデータ) (2025-02-02T00:47:55Z) - Contributing Back to the Ecosystem: A User Survey of NPM Developers [10.154686574810501]
NPMエコシステムの49人の開発者を対象とした調査。
開発者は、エコシステムにコントリビュートするよりも、独自のパッケージをメンテナンスする傾向にあります。
当社の成果は,これらのエコシステムを維持するためのツールサポートと研究への新たな道を開くものである。
論文 参考訳(メタデータ) (2024-07-01T00:15:55Z) - Ecosystem of Large Language Models for Code [7.7454423388704745]
本稿では,コードモデルエコシステムの先駆的分析を紹介する。
まず、人気があり影響力のあるデータセット、モデル、コントリビュータを特定します。
最も人気のある3つの再利用タイプは、微調整、アーキテクチャ共有、量子化である。
論文 参考訳(メタデータ) (2024-05-27T01:31:30Z) - LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文 参考訳(メタデータ) (2023-10-30T17:55:02Z) - Promises and Perils of Mining Software Package Ecosystem Data [10.787686237395816]
サードパーティのパッケージは、依存関係間の迷路を伴う大規模なソフトウェアパッケージエコシステムの出現につながっている。
パッケージエコシステムのインフラストラクチャとダイナミクスを理解することで、コード再利用の改善、自動更新、脆弱性の回避といったアプローチが生まれました。
この章では、ソフトウェア工学研究者が利用可能なソフトウェアパッケージエコシステムに関連する豊富なデータをマイニングする約束と危険性についてレビューします。
論文 参考訳(メタデータ) (2023-05-29T03:09:48Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - Deep learning for table detection and structure recognition: A survey [49.09628624903334]
本調査の目的は,テーブル検出の分野での大きな進展を深く理解することである。
この分野における古典的アプリケーションと新しいアプリケーションの両方について分析する。
既存のモデルのデータセットとソースコードは、読者にこの膨大な文献のコンパスを提供するために組織されている。
論文 参考訳(メタデータ) (2022-11-15T19:42:27Z) - Code Librarian: A Software Package Recommendation System [65.05559087332347]
オープンソースライブラリ用のリコメンデーションエンジンであるLibrarianを提示する。
1)プログラムのインポートライブラリで頻繁に使用されること、2)プログラムのインポートライブラリと似た機能を持つこと、3)開発者の実装と似た機能を持つこと、4)提供されるコードのコンテキストで効率的に使用できること、である。
論文 参考訳(メタデータ) (2022-10-11T12:30:05Z) - Bridging the Language Gap: An Empirical Study of Bindings for Open Source Machine Learning Libraries Across Software Package Ecosystems [9.339419442638983]
機械学習ライブラリにより、開発者は自身のアプリケーションに高度なML機能を統合できる。
しかし、一般的なMLライブラリは、すべてのプログラミング言語やソフトウェアパッケージエコシステムで利用できない。
13のソフトウェアパッケージエコシステムにまたがる546のMLライブラリに対して,2,436のクロスエコシステムバインディングを収集します。
論文 参考訳(メタデータ) (2022-01-18T18:53:21Z) - Datasets: A Community Library for Natural Language Processing [55.48866401721244]
データセットは、現代のNLPのためのコミュニティライブラリである。
このライブラリには650以上のユニークなデータセットが含まれており、250以上のコントリビュータを抱えており、さまざまな新しいクロスデータセット研究プロジェクトを支援している。
論文 参考訳(メタデータ) (2021-09-07T03:59:22Z) - Bayesian active learning for production, a systematic study and a
reusable library [85.32971950095742]
本稿では,現在のアクティブラーニング技術の主な欠点について分析する。
実世界のデータセットの最も一般的な課題が深層能動学習プロセスに与える影響について,系統的研究を行った。
部分的不確実性サンプリングやより大きいクエリサイズといった,アクティブな学習ループを高速化する2つの手法を導出する。
論文 参考訳(メタデータ) (2020-06-17T14:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。