論文の概要: Promises and Perils of Mining Software Package Ecosystem Data
- arxiv url: http://arxiv.org/abs/2306.10021v1
- Date: Mon, 29 May 2023 03:09:48 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-23 19:25:33.566104
- Title: Promises and Perils of Mining Software Package Ecosystem Data
- Title(参考訳): ソフトウェアパッケージエコシステムデータのマイニングの約束と義務
- Authors: Raula Gaikovina Kula, Katsuro Inoue, and Christoph Treude
- Abstract要約: サードパーティのパッケージは、依存関係間の迷路を伴う大規模なソフトウェアパッケージエコシステムの出現につながっている。
パッケージエコシステムのインフラストラクチャとダイナミクスを理解することで、コード再利用の改善、自動更新、脆弱性の回避といったアプローチが生まれました。
この章では、ソフトウェア工学研究者が利用可能なソフトウェアパッケージエコシステムに関連する豊富なデータをマイニングする約束と危険性についてレビューします。
- 参考スコア(独自算出の注目度): 10.787686237395816
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The use of third-party packages is becoming increasingly popular and has led
to the emergence of large software package ecosystems with a maze of
inter-dependencies. Since the reliance on these ecosystems enables developers
to reduce development effort and increase productivity, it has attracted the
interest of researchers: understanding the infrastructure and dynamics of
package ecosystems has given rise to approaches for better code reuse,
automated updates, and the avoidance of vulnerabilities, to name a few
examples. But the reality of these ecosystems also poses challenges to software
engineering researchers, such as: How do we obtain the complete network of
dependencies along with the corresponding versioning information? What are the
boundaries of these package ecosystems? How do we consistently detect
dependencies that are declared but not used? How do we consistently identify
developers within a package ecosystem? How much of the ecosystem do we need to
understand to analyse a single component? How well do our approaches generalise
across different programming languages and package ecosystems? In this chapter,
we review promises and perils of mining the rich data related to software
package ecosystems available to software engineering researchers.
- Abstract(参考訳): サードパーティパッケージの使用はますます人気を集めており、依存関係間の迷路を伴う大規模なソフトウェアパッケージエコシステムの出現につながっている。
パッケージエコシステムのインフラストラクチャとダイナミクスを理解することで、コードの再利用性の向上、自動更新、脆弱性回避のためのアプローチが生まれ、いくつかの例を挙げることができます。
しかし、これらのエコシステムの現実は、ソフトウエアエンジニアリング研究者にも、次のような課題をもたらしている。
これらのパッケージエコシステムの境界は何でしょう?
宣言されているが使われていない依存関係をどうやって一貫して検出するのか?
パッケージエコシステム内の開発者をどうやって一貫して識別するのか?
ひとつのコンポーネントを分析する上で,どの程度のエコシステムを理解する必要があるのでしょう?
私たちのアプローチは、さまざまなプログラミング言語やパッケージエコシステムにまたがって、どの程度うまく行きますか?
本章では,ソフトウェア工学研究者が利用可能なソフトウェアパッケージエコシステムに関連する豊富なデータマイニングの約束と周辺を概説する。
関連論文リスト
- Biomedical Open Source Software: Crucial Packages and Hidden Heroes [2.3960586265742574]
バイオメディカルペーパーで使用されるソフトウェアの依存関係をマップし、ソフトウェアエコシステムに不可欠なパッケージを見つけます。
ソフトウェア依存ネットワークの集中度指標を提案し,3つのエコシステム(PyPi,CRAN,Bioconductor)を分析し,最も集中度の高いパッケージを決定する。
論文 参考訳(メタデータ) (2024-04-10T01:22:02Z) - Lessons from the Long Tail: Analysing Unsafe Dependency Updates across
Software Ecosystems [11.461455369774765]
人口88,416人のプルリクエスト(PR)から得られた3つの代表サンプルに基づく予備データを示す。
安全でない依存関係の更新(すなわち、実行時に安全でないリスクのあるプルリクエスト)を特定します。
これには、トップクラスのライブラリだけでなく、エコシステム全体において、安全でない依存関係更新に対処するためのベストプラクティスの開発が含まれる。
論文 参考訳(メタデータ) (2023-09-08T08:17:09Z) - An Introduction to Software Ecosystems [7.574742446357262]
この章では、さまざまな種類のソフトウェアエコシステムを定義し、提示する。
ソフトウェアエコシステムの開発、ツーリング、分析に重点を置いている。
この章では、これらのエコシステムを理解し、分析するのに必要な関連用語も紹介し、明らかにしている。
論文 参考訳(メタデータ) (2023-07-28T17:58:59Z) - Integration of Domain Expert-Centric Ontology Design into the CRISP-DM
for Cyber-Physical Production Systems [63.62764375279861]
機械学習(ML)とデータマイニング(DM)の手法は、収集されたデータから複雑で隠れたパターンを抽出する上で有望であることが証明されている。
しかし、このようなデータ駆動プロジェクトは、通常、CRISPDM(Cross-Industry Standard Process for Data Mining)で実行され、データの理解と準備に要する時間の不均等さのために失敗することが多い。
このコントリビューションは、データサイエンティストがCPPSの課題に対してより迅速かつ確実に洞察を得ることができるように、統合されたアプローチを提供することを目的としている。
論文 参考訳(メタデータ) (2023-07-21T15:04:00Z) - Analyzing the Evolution of Inter-package Dependencies in Operating
Systems: A Case Study of Ubuntu [7.76541950830141]
オペレーティングシステム(OS)は複数の相互依存ソフトウェアパッケージを結合し、通常は独自に開発されたアーキテクチャを持つ。
進化的な努力のために、OSのデザイナや開発者たちは、個々のファイルにフォーカスするシステム全体の依存性を完全に理解することで、大きな恩恵を受けることができます。
本稿では,個々のバイナリファイルのレベルでの詳細なパッケージ関係の発見を目的としたフレームワークであるDepExを提案する。
論文 参考訳(メタデータ) (2023-07-10T10:12:21Z) - The Life and Death of Software Ecosystems [5.043784941542819]
我々は、アトラクション(と減退)と生態系の死に関連する、健全な生態系に寄与する2つの側面を探求する。
機能し、生き残るためには、生態系は人々を惹きつけ、それらを船に乗せて維持する必要がある。
論文 参考訳(メタデータ) (2023-05-28T23:43:19Z) - The GitHub Development Workflow Automation Ecosystems [47.818229204130596]
大規模なソフトウェア開発は、非常に協力的な取り組みになっています。
この章では、開発ボットとGitHub Actionsのエコシステムについて解説する。
この領域における最先端技術に関する広範な調査を提供する。
論文 参考訳(メタデータ) (2023-05-08T15:24:23Z) - Ecosystem Graphs: The Social Footprint of Foundation Models [64.02855828418608]
このエコシステムの知識を透過的に集中化するためのドキュメンテーションフレームワークとして,Ecosystem Graphsを提案する。
Ecosystem Graphs は、技術的(例えば Bing は GPT-4 に依存している)と社会的(例えば Microsoft は OpenAI に依存している)の関係を示す依存関係によってリンクされた資産(データセット、モデル、アプリケーション)で構成されている。
論文 参考訳(メタデータ) (2023-03-28T07:18:29Z) - Data Science for Engineers: A Teaching Ecosystem [59.00739310930656]
チリ大学物理学・数学学部の技術者にデータサイエンスを教えるエコシステムについて述べる。
このイニシアチブは、学術的・専門的な環境からDS資格の需要が高まっていることに動機づけられている。
DS教育の原則と我々のアプローチの革新的な構成要素を共有することで、自分たちのDSプログラムやエコシステムを開発する人たちにとって、私たちの経験が役に立つことを願っています。
論文 参考訳(メタデータ) (2021-01-14T14:17:57Z) - A game-theoretic analysis of networked system control for common-pool
resource management using multi-agent reinforcement learning [54.55119659523629]
マルチエージェント強化学習は近年,ネットワーク型システム制御へのアプローチとして大きな可能性を秘めている。
共通プールの資源は耕作可能な土地、淡水、湿地、野生生物、魚類資源、森林、大気である。
論文 参考訳(メタデータ) (2020-10-15T14:12:26Z) - DIETERpy: a Python framework for The Dispatch and Investment Evaluation
Tool with Endogenous Renewables [62.997667081978825]
DIETERはオープンソースの電力セクターモデルであり、可変再生可能エネルギー源の非常に高いシェアで将来の設定を分析するように設計されている。
システム全体のコストを最小化し、様々な世代の固定および可変コスト、柔軟性、セクター結合オプションを含む。
我々は、GAMS(General Algebraic Modeling System)で記述された既存のモデルバージョンの上に構築されたDIETERpyを紹介し、それをPythonフレームワークで強化する。
論文 参考訳(メタデータ) (2020-10-02T09:27:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。