論文の概要: Bridging the Language Gap: An Empirical Study of Bindings for Open Source Machine Learning Libraries Across Software Package Ecosystems
- arxiv url: http://arxiv.org/abs/2201.07201v2
- Date: Mon, 19 Aug 2024 23:34:50 GMT
- ステータス: 処理完了
- システム内更新日: 2024-08-21 21:10:37.023985
- Title: Bridging the Language Gap: An Empirical Study of Bindings for Open Source Machine Learning Libraries Across Software Package Ecosystems
- Title(参考訳): 言語ギャップのブリッジ: ソフトウェアパッケージエコシステム全体にわたるオープンソース機械学習ライブラリのバインディングに関する実証的研究
- Authors: Hao Li, Cor-Paul Bezemer,
- Abstract要約: 機械学習ライブラリにより、開発者は自身のアプリケーションに高度なML機能を統合できる。
しかし、一般的なMLライブラリは、すべてのプログラミング言語やソフトウェアパッケージエコシステムで利用できない。
13のソフトウェアパッケージエコシステムにまたがる546のMLライブラリに対して,2,436のクロスエコシステムバインディングを収集します。
- 参考スコア(独自算出の注目度): 9.339419442638983
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Open source machine learning (ML) libraries enable developers to integrate advanced ML functionality into their own applications. However, popular ML libraries, such as TensorFlow, are not available natively in all programming languages and software package ecosystems. Hence, developers who wish to use an ML library which is not available in their programming language or ecosystem of choice, may need to resort to using a so-called binding library (or binding). Bindings provide support across programming languages and package ecosystems for reusing a host library. For example, the Keras .NET binding provides support for the Keras library in the NuGet (.NET) ecosystem even though the Keras library was written in Python. In this paper, we collect 2,436 cross-ecosystem bindings for 546 ML libraries across 13 software package ecosystems by using an approach called BindFind, which can automatically identify bindings and link them to their host libraries. Furthermore, we conduct an in-depth study of 133 cross-ecosystem bindings and their development for 40 popular open source ML libraries. Our findings reveal that the majority of ML library bindings are maintained by the community, with npm being the most popular ecosystem for these bindings. Our study also indicates that most bindings cover only a limited range of the host library's releases, often experience considerable delays in supporting new releases, and have widespread technical lag. Our findings highlight key factors to consider for developers integrating bindings for ML libraries and open avenues for researchers to further investigate bindings in software package ecosystems.
- Abstract(参考訳): オープンソースの機械学習(ML)ライブラリにより、開発者は自身のアプリケーションに高度なML機能を統合できる。
しかし、TensorFlowのような一般的なMLライブラリは、すべてのプログラミング言語やソフトウェアパッケージエコシステムでネイティブに利用できるわけではない。
したがって、プログラミング言語や選択するエコシステムでは利用できないMLライブラリを使いたい開発者は、いわゆるバインディングライブラリ(あるいはバインディング)を使う必要があるかもしれない。
バインディングは、ホストライブラリを再利用するためのプログラミング言語とパッケージエコシステムをまたいだサポートを提供する。
例えば、Keras 。
NETバインディングは、Pythonで書かれたKerasライブラリであっても、NuGet(.NET)エコシステムでKerasライブラリをサポートする。
本稿では,BindFindというアプローチを用いて,ソフトウェアパッケージのエコシステムにまたがる546のMLライブラリに対して,2,436のクロスエコシステムバインディングを収集する。
さらに,40のオープンソースMLライブラリを対象とした133のクロスエコシステムバインディングとその開発について,詳細な研究を行っている。
この結果,MLライブラリバインディングの大部分はコミュニティが管理しており,npmはこれらのバインディングの最も人気のあるエコシステムであることがわかった。
我々の研究は、ほとんどのバインディングがホストライブラリのリリースの限られた範囲のみをカバーすることを示し、しばしば新しいリリースをサポートするのにかなりの遅延を経験し、広範囲の技術的遅延があることを示している。
この結果から,MLライブラリのバインディング統合や,ソフトウェアパッケージエコシステムにおけるバインディングのさらなる調査を行うためのオープンな方法を検討する上で,開発者が考慮すべき重要な要素を浮き彫りにした。
関連論文リスト
- Contributing Back to the Ecosystem: A User Survey of NPM Developers [10.154686574810501]
NPMエコシステムの49人の開発者を対象とした調査。
開発者は、エコシステムにコントリビュートするよりも、独自のパッケージをメンテナンスする傾向にあります。
当社の成果は,これらのエコシステムを維持するためのツールサポートと研究への新たな道を開くものである。
論文 参考訳(メタデータ) (2024-07-01T00:15:55Z) - PufferLib: Making Reinforcement Learning Libraries and Environments Play Nice [0.8702432681310401]
PufferLibは、一般的な互換性問題を排除したワンライン環境ラッパーを提供する。
PufferLibを使えば、CleanRLやSB3といった慣れ親しんだライブラリを使って、AtariやProcgenといった古典的なベンチマークからNetHackやNeural MMOのような複雑なシミュレータまでスケールすることができる。
私たちのコードはすべて、MITライセンスの下でフリーでオープンソースのソフトウェアです。
論文 参考訳(メタデータ) (2024-06-11T21:13:34Z) - Analyzing the Accessibility of GitHub Repositories for PyPI and NPM Libraries [91.97201077607862]
産業アプリケーションはオープンソースソフトウェア(OSS)ライブラリに大きく依存しており、様々な利点を提供している。
このようなコミュニティの活動を監視するには、エコシステムのライブラリの包括的なリポジトリのリストにアクセスしなければなりません。
本研究では、PyPIライブラリとNPMライブラリのGitHubリポジトリのアクセシビリティを分析する。
論文 参考訳(メタデータ) (2024-04-26T13:27:04Z) - LILO: Learning Interpretable Libraries by Compressing and Documenting Code [71.55208585024198]
LILOは、反復的に合成、圧縮、文書化を行う、ニューロシンボリックなフレームワークである。
LILOは、LLM誘導プログラム合成と、Stitchから自動化された最近のアルゴリズムの進歩を組み合わせたものである。
LILOのシンセサイザーが学習した抽象化を解釈し、デプロイするのを手助けすることで、AutoDocがパフォーマンスを向上させることが分かりました。
論文 参考訳(メタデータ) (2023-10-30T17:55:02Z) - ExeKGLib: Knowledge Graphs-Empowered Machine Learning Analytics [6.739841914490015]
ExeKGLibは、最小限の機械学習知識を持つユーザがMLパイプラインを構築することができるPythonライブラリです。
ExeKGLibの使用例を示し、その利点を示すために従来のMLコードと比較する。
論文 参考訳(メタデータ) (2023-05-04T16:10:22Z) - SequeL: A Continual Learning Library in PyTorch and JAX [50.33956216274694]
SequeLは継続学習のためのライブラリで、PyTorchとJAXフレームワークの両方をサポートする。
それは、正規化ベースのアプローチ、リプレイベースのアプローチ、ハイブリッドアプローチを含む、幅広い連続学習アルゴリズムのための統一インターフェースを提供する。
私たちはSequeLをオープンソースライブラリとしてリリースし、研究者や開発者が自身の目的で簡単にライブラリを実験し拡張することができます。
論文 参考訳(メタデータ) (2023-04-21T10:00:22Z) - Code Librarian: A Software Package Recommendation System [65.05559087332347]
オープンソースライブラリ用のリコメンデーションエンジンであるLibrarianを提示する。
1)プログラムのインポートライブラリで頻繁に使用されること、2)プログラムのインポートライブラリと似た機能を持つこと、3)開発者の実装と似た機能を持つこと、4)提供されるコードのコンテキストで効率的に使用できること、である。
論文 参考訳(メタデータ) (2022-10-11T12:30:05Z) - Repro: An Open-Source Library for Improving the Reproducibility and
Usability of Publicly Available Research Code [74.28810048824519]
Reproは、研究コードのユーザビリティ向上を目的とした、オープンソースのライブラリである。
Dockerコンテナ内で研究者がリリースしたソフトウェアを実行するための軽量Python APIを提供する。
論文 参考訳(メタデータ) (2022-04-29T01:54:54Z) - skrl: Modular and Flexible Library for Reinforcement Learning [0.0]
skrlはPythonで書かれた強化学習のためのオープンソースのモジュールライブラリである。
NVIDIA Isaac Gym環境のロード、設定、操作を可能にする。
論文 参考訳(メタデータ) (2022-02-08T12:43:31Z) - Solo-learn: A Library of Self-supervised Methods for Visual
Representation Learning [83.02597612195966]
solo-learnは視覚表現学習のための自己指導型のメソッドのライブラリである。
Pythonで実装され、PytorchとPytorch Lightningを使用して、このライブラリは研究と業界のニーズの両方に適合する。
論文 参考訳(メタデータ) (2021-08-03T22:19:55Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。