論文の概要: Promises and Perils of Mining Software Package Ecosystem Data
- arxiv url: http://arxiv.org/abs/2306.10021v1
- Date: Mon, 29 May 2023 03:09:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-10-23 19:25:33.566104
- Title: Promises and Perils of Mining Software Package Ecosystem Data
- Title(参考訳): ソフトウェアパッケージエコシステムデータのマイニングの約束と義務
- Authors: Raula Gaikovina Kula, Katsuro Inoue, and Christoph Treude
- Abstract要約: サードパーティのパッケージは、依存関係間の迷路を伴う大規模なソフトウェアパッケージエコシステムの出現につながっている。
パッケージエコシステムのインフラストラクチャとダイナミクスを理解することで、コード再利用の改善、自動更新、脆弱性の回避といったアプローチが生まれました。
この章では、ソフトウェア工学研究者が利用可能なソフトウェアパッケージエコシステムに関連する豊富なデータをマイニングする約束と危険性についてレビューします。
- 参考スコア(独自算出の注目度): 10.787686237395816
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of third-party packages is becoming increasingly popular and has led
to the emergence of large software package ecosystems with a maze of
inter-dependencies. Since the reliance on these ecosystems enables developers
to reduce development effort and increase productivity, it has attracted the
interest of researchers: understanding the infrastructure and dynamics of
package ecosystems has given rise to approaches for better code reuse,
automated updates, and the avoidance of vulnerabilities, to name a few
examples. But the reality of these ecosystems also poses challenges to software
engineering researchers, such as: How do we obtain the complete network of
dependencies along with the corresponding versioning information? What are the
boundaries of these package ecosystems? How do we consistently detect
dependencies that are declared but not used? How do we consistently identify
developers within a package ecosystem? How much of the ecosystem do we need to
understand to analyse a single component? How well do our approaches generalise
across different programming languages and package ecosystems? In this chapter,
we review promises and perils of mining the rich data related to software
package ecosystems available to software engineering researchers.
- Abstract(参考訳): サードパーティパッケージの使用はますます人気を集めており、依存関係間の迷路を伴う大規模なソフトウェアパッケージエコシステムの出現につながっている。
パッケージエコシステムのインフラストラクチャとダイナミクスを理解することで、コードの再利用性の向上、自動更新、脆弱性回避のためのアプローチが生まれ、いくつかの例を挙げることができます。
しかし、これらのエコシステムの現実は、ソフトウエアエンジニアリング研究者にも、次のような課題をもたらしている。
これらのパッケージエコシステムの境界は何でしょう?
宣言されているが使われていない依存関係をどうやって一貫して検出するのか?
パッケージエコシステム内の開発者をどうやって一貫して識別するのか?
ひとつのコンポーネントを分析する上で,どの程度のエコシステムを理解する必要があるのでしょう?
私たちのアプローチは、さまざまなプログラミング言語やパッケージエコシステムにまたがって、どの程度うまく行きますか?
本章では,ソフトウェア工学研究者が利用可能なソフトウェアパッケージエコシステムに関連する豊富なデータマイニングの約束と周辺を概説する。
関連論文リスト
- Why Authors and Maintainers Link (or Don't Link) Their PyPI Libraries to Code Repositories and Donation Platforms [83.16077040470975]
Python Package Index(PyPI)上のライブラリのメタデータは、オープンソースライブラリの透明性、信頼性、持続性をサポートする上で重要な役割を果たす。
本稿は,5万PyPIの著者とメンテナに送付された2つの対象調査を組み合わせた大規模実証研究である。
我々は,大規模言語モデル(LLM)に基づくトピックモデリングを用いて1,400以上の応答を分析し,リポジトリと寄付プラットフォームのリンクに関連する重要なモチベーションと障壁を明らかにする。
論文 参考訳(メタデータ) (2026-01-21T16:13:57Z) - Pixi: Unified Software Development and Distribution for Robotics and AI [41.29131868930693]
ロボットアルゴリズムの最大70%は、独立したチームでは再生できない。
プロジェクトレベルのロックファイルの正確な依存状態をキャプチャする統合パッケージ管理フレームワークであるPixiを紹介します。
2023年から5300以上のプロジェクトで採用されているPixiは、セットアップ時間を数時間から数分に短縮し、世界中の研究者の技術的な障壁を低くする。
論文 参考訳(メタデータ) (2025-11-06T21:29:04Z) - SoK: Towards Reproducibility for Software Packages in Scripting Language Ecosystems [0.0]
このSoKは、今後の方向性を明らかにすることを目的として、既存の研究の概要を提供する。
私たちは、現在の研究における重要な側面を解明し、ソフトウェアの課題を特定し、エコシステム間でそれらをマッピングします。
文献は希少であり、個々の問題や生態系に焦点が当てられている。
論文 参考訳(メタデータ) (2025-03-27T17:10:38Z) - Extending Lifetime of Embedded Systems by WebAssembly-based Functional Extensions Including Drivers [46.538276603099916]
WebAssembly(Wasm)コンテナ内の周辺I/O操作を容易にするために設計されたフレームワークであるWasm-IOを紹介する。
プラットフォームに依存しない周辺構成をWasmバイナリ内に埋め込むための同期I/Oと手法について詳述する。
論文 参考訳(メタデータ) (2025-03-10T17:22:00Z) - Tracking Down Software Cluster Bombs: A Current State Analysis of the Free/Libre and Open Source Software (FLOSS) Ecosystem [0.43981305860983705]
本稿では,FLOSSパッケージリポジトリの現状について概説する。
ソフトウェアエコシステム内の問題領域を特定するという課題に対処する。
その結果,FLOSSエコシステム内には保守性の高いプロジェクトが存在する一方で,サプライチェーンアタックの影響を受けやすいプロジェクトも存在していることが示唆された。
論文 参考訳(メタデータ) (2025-02-12T08:57:57Z) - RepoGraph: Enhancing AI Software Engineering with Repository-level Code Graph [63.87660059104077]
RepoGraphは、現代のAIソフトウェアエンジニアリングソリューションのためのリポジトリレベルの構造を管理するプラグインモジュールである。
RepoGraphはすべてのシステムのパフォーマンスを大幅に向上させ、オープンソースフレームワークの間で新たな最先端技術を生み出している。
論文 参考訳(メタデータ) (2024-10-03T05:45:26Z) - An Overview and Catalogue of Dependency Challenges in Open Source Software Package Registries [52.23798016734889]
この記事では、OSSパッケージやライブラリに依存する依存関係関連の課題のカタログを提供する。
このカタログは、これらの課題を理解し、定量化し、克服するために行われた経験的研究に関する科学文献に基づいている。
論文 参考訳(メタデータ) (2024-09-27T16:20:20Z) - Uncovering and Mitigating the Impact of Frozen Package Versions for Fixed-Release Linux [38.53185042161599]
ミラーの進化に伴う固定リリースLinuxのエコシステムギャップについて検討する。
そこで本研究では,Debianのネイティブミラーをベースとした,依存環境の分離を実現する新しいパッケージ管理手法を提案する。
我々は、現在のツールの不十分さを効果的に改善できる、ccenvという名の作業プロトタイプを提示する。
論文 参考訳(メタデータ) (2024-08-21T14:01:46Z) - An Empirical Study on Package-Level Deprecation in Python Ecosystem [6.0347124337922144]
広く採用されているプログラミング言語であるPythonは、広範囲で多様なサードパーティ製パッケージエコシステムで有名である。
Pythonエコシステム内のOSSパッケージのかなりの数は、メンテナンスが不十分で、機能やセキュリティの潜在的なリスクにつながっている。
本稿では,Pythonエコシステムにおけるパッケージレベルの非推奨事項の公表,受信,処理に関する現在の実践について検討する。
論文 参考訳(メタデータ) (2024-08-19T18:08:21Z) - Contributing Back to the Ecosystem: A User Survey of NPM Developers [10.154686574810501]
NPMエコシステムの49人の開発者を対象とした調査。
開発者は、エコシステムにコントリビュートするよりも、独自のパッケージをメンテナンスする傾向にあります。
当社の成果は,これらのエコシステムを維持するためのツールサポートと研究への新たな道を開くものである。
論文 参考訳(メタデータ) (2024-07-01T00:15:55Z) - How to Understand Whole Software Repository? [64.19431011897515]
リポジトリ全体に対する優れた理解は、自動ソフトウェアエンジニアリング(ASE)への重要な道になるでしょう。
本研究では,リポジトリ全体を包括的に理解するためのエージェントによるRepoUnderstanderという新しい手法を開発した。
リポジトリレベルの知識をより活用するために、エージェントをまとめ、分析し、計画する。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - Biomedical Open Source Software: Crucial Packages and Hidden Heroes [2.3960586265742574]
バイオメディカルペーパーで使用されるソフトウェアの依存関係をマップし、ソフトウェアエコシステムに不可欠なパッケージを見つけます。
ソフトウェア依存ネットワークの集中度指標を提案し,3つのエコシステム(PyPi,CRAN,Bioconductor)を分析し,最も集中度の高いパッケージを決定する。
論文 参考訳(メタデータ) (2024-04-10T01:22:02Z) - FREE: The Foundational Semantic Recognition for Modeling Environmental Ecosystems [56.0640340392818]
我々は、様々な特徴と利用可能な情報を使ってユニバーサルモデルを訓練するフレームワーク、FREEを導入する。
その中核となる考え方は、利用可能な環境データをテキスト空間にマッピングし、環境科学における従来の予測モデリングタスクを意味認識問題に変換することである。
河川水温予測と収穫量予測という2つの社会学的に重要な実世界の応用に対する評価は、FREEが複数のベースラインよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-11-17T00:53:09Z) - An Introduction to Software Ecosystems [7.574742446357262]
この章では、さまざまな種類のソフトウェアエコシステムを定義し、提示する。
ソフトウェアエコシステムの開発、ツーリング、分析に重点を置いている。
この章では、これらのエコシステムを理解し、分析するのに必要な関連用語も紹介し、明らかにしている。
論文 参考訳(メタデータ) (2023-07-28T17:58:59Z) - The Life and Death of Software Ecosystems [5.043784941542819]
我々は、アトラクション(と減退)と生態系の死に関連する、健全な生態系に寄与する2つの側面を探求する。
機能し、生き残るためには、生態系は人々を惹きつけ、それらを船に乗せて維持する必要がある。
論文 参考訳(メタデータ) (2023-05-28T23:43:19Z) - The GitHub Development Workflow Automation Ecosystems [47.818229204130596]
大規模なソフトウェア開発は、非常に協力的な取り組みになっています。
この章では、開発ボットとGitHub Actionsのエコシステムについて解説する。
この領域における最先端技術に関する広範な調査を提供する。
論文 参考訳(メタデータ) (2023-05-08T15:24:23Z) - Ecosystem Graphs: The Social Footprint of Foundation Models [64.02855828418608]
このエコシステムの知識を透過的に集中化するためのドキュメンテーションフレームワークとして,Ecosystem Graphsを提案する。
Ecosystem Graphs は、技術的(例えば Bing は GPT-4 に依存している)と社会的(例えば Microsoft は OpenAI に依存している)の関係を示す依存関係によってリンクされた資産(データセット、モデル、アプリケーション)で構成されている。
論文 参考訳(メタデータ) (2023-03-28T07:18:29Z) - Data Science for Engineers: A Teaching Ecosystem [59.00739310930656]
チリ大学物理学・数学学部の技術者にデータサイエンスを教えるエコシステムについて述べる。
このイニシアチブは、学術的・専門的な環境からDS資格の需要が高まっていることに動機づけられている。
DS教育の原則と我々のアプローチの革新的な構成要素を共有することで、自分たちのDSプログラムやエコシステムを開発する人たちにとって、私たちの経験が役に立つことを願っています。
論文 参考訳(メタデータ) (2021-01-14T14:17:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。