論文の概要: Structural and Connectivity Patterns in the Maven Central Software Dependency Network
- arxiv url: http://arxiv.org/abs/2508.13819v1
- Date: Tue, 19 Aug 2025 13:24:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.936124
- Title: Structural and Connectivity Patterns in the Maven Central Software Dependency Network
- Title(参考訳): Maven Central Software Dependency Networkの構造と接続パターン
- Authors: Daniel Ogenrwot, John Businge, Shaikh Arifuzzaman,
- Abstract要約: Javaライブラリの最大のリポジトリの1つであるMaven Centralエコシステムを調査します。
我々は,その濃度集中度に基づいて,最高5000個の高連結人工物からなる試料を抽出した。
我々は,このグラフの包括的解析,計算次数分布,間性中心性,PageRank中心性,連結成分グラフ理論メトリクスについて検討した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding the structural characteristics and connectivity patterns of large-scale software ecosystems is critical for enhancing software reuse, improving ecosystem resilience, and mitigating security risks. In this paper, we investigate the Maven Central ecosystem, one of the largest repositories of Java libraries, by applying network science techniques to its dependency graph. Leveraging the Goblin framework, we extracted a sample consisting of the top 5,000 highly connected artifacts based on their degree centrality and then performed breadth-first search (BFS) expansion from each selected artifact as a seed node, traversing the graph outward to capture all libraries and releases reachable those seed nodes. This sampling strategy captured the immediate structural context surrounding these libraries resulted in a curated graph comprising of 1.3 million nodes and 20.9 million edges. We conducted a comprehensive analysis of this graph, computing degree distributions, betweenness centrality, PageRank centrality, and connected components graph-theoretic metrics. Our results reveal that Maven Central exhibits a highly interconnected, scale-free, and small-world topology, characterized by a small number of infrastructural hubs that support the majority of projects. Further analysis using PageRank and betweenness centrality shows that these hubs predominantly consist of core ecosystem infrastructure, including testing frameworks and general-purpose utility libraries. While these hubs facilitate efficient software reuse and integration, they also pose systemic risks; failures or vulnerabilities affecting these critical nodes can have widespread and cascading impacts throughout the ecosystem.
- Abstract(参考訳): 大規模ソフトウェアエコシステムの構造的特性と接続パターンを理解することは、ソフトウェアの再利用の向上、エコシステムのレジリエンスの向上、セキュリティリスクの軽減に不可欠である。
本稿では,Javaライブラリの最大のリポジトリであるMaven Centralエコシステムについて,その依存性グラフにネットワークサイエンス技術を適用して検討する。
Goblinフレームワークを応用して、各選択したアーティファクトからBFS(panth-first search)拡張をシードノードとして実行し、グラフを外側に移動してすべてのライブラリを捕捉し、到達可能なシードノードをリリースした。
このサンプリング戦略は、これらのライブラリを取り巻く直接的な構造的コンテキストを捉え、13万のノードと20.9万のエッジからなるキュレートされたグラフを生み出した。
我々は,このグラフの包括的解析,計算次数分布,間性中心性,PageRank中心性,連結成分グラフ理論メトリクスについて検討した。
以上の結果から,Maven Centralは相互接続性が高く,スケールフリーで,小さな世界のトポロジを呈しており,プロジェクトの大部分をサポートする少数のインフラハブが特徴であることが明らかとなった。
PageRankと相互中心性を用いたさらなる分析は、これらのハブが主にテストフレームワークや汎用ユーティリティライブラリを含む、コアエコシステムインフラストラクチャで構成されていることを示している。
これらのハブはソフトウェアの効率的な再利用と統合を促進する一方で、システム的リスクも生じます。
関連論文リスト
- DISTA-Net: Dynamic Closely-Spaced Infrared Small Target Unmixing [55.366556355538954]
本稿では,動的フレームワーク内で従来のスパース再構築を再現する動的反復収縮閾値ネットワーク(DISTA-Net)を提案する。
DISTA-Netは、密接な空間を持つ赤外線小ターゲットのアンミックスのために特別に設計された最初のディープラーニングモデルである。
私たちはこの分野におけるさらなる研究を促進するために、最初のオープンソースエコシステムを確立しました。
論文 参考訳(メタデータ) (2025-05-25T13:52:00Z) - Understanding Large Language Model Supply Chain: Structure, Domain, and Vulnerabilities [4.835306415626808]
大規模言語モデル(LLM)は人工知能(AI)に革命をもたらし、自然言語理解、テキスト生成、自律システムにおけるブレークスルーを導いている。
重要な重要性にもかかわらず、LLMSC (Large Language Model supply Chain) はいまだに未調査である。
PyPIとNPMのオープンソースパッケージのキュレートされたデータセットを14の機能ドメインで分析する。
論文 参考訳(メタデータ) (2025-04-29T13:44:01Z) - A multi-core periphery perspective: Ranking via relative centrality [4.33459568143131]
コミュニティとコア周辺は、広く研究されている2つのグラフ構造である。
グラフのコア周辺構造がコミュニティ構造を理解することに与える影響は、十分に利用されていない。
我々は,各コミュニティが密接な連結部分(中核)を持ち,残りの部分(周辺部)が疎い,基底真理コミュニティを持つグラフのための小説を紹介する。
論文 参考訳(メタデータ) (2024-06-06T20:21:27Z) - Sifting out communities in large sparse networks [2.666294200266662]
大規模ネットワークにおけるクラスタリングの結果の質を定量化するための直感的な客観的関数を導入する。
この領域に特に適したコミュニティを特定するために,2段階の手法を用いる。
数万のノードからなる大規模ネットワークにおける複雑な遺伝的相互作用を同定する。
論文 参考訳(メタデータ) (2024-05-01T18:57:41Z) - Unsupervised Graph Attention Autoencoder for Attributed Networks using
K-means Loss [0.0]
我々は、属性付きネットワークにおけるコミュニティ検出のための、教師なしのtextbfGraph Attention textbfAutotextbfEncoder に基づく、シンプルで効率的なクラスタリング指向モデルを提案する。
提案モデルは,ネットワークのトポロジと属性情報の両方から表現を十分に学習し,同時に2つの目的,すなわち再構築とコミュニティ発見に対処する。
論文 参考訳(メタデータ) (2023-11-21T20:45:55Z) - EGRC-Net: Embedding-induced Graph Refinement Clustering Network [66.44293190793294]
埋め込みによるグラフリファインメントクラスタリングネットワーク (EGRC-Net) という新しいグラフクラスタリングネットワークを提案する。
EGRC-Netは学習した埋め込みを利用して初期グラフを適応的に洗練し、クラスタリング性能を向上させる。
提案手法はいくつかの最先端手法より一貫して優れている。
論文 参考訳(メタデータ) (2022-11-19T09:08:43Z) - DeHIN: A Decentralized Framework for Embedding Large-scale Heterogeneous
Information Networks [64.62314068155997]
本稿では,異種情報ネットワーク(DeHIN)のための分散埋め込みフレームワークについて述べる。
DeHINは、大きなHINをハイパーグラフとして革新的に定式化するコンテキスト保存分割機構を提供する。
当社のフレームワークでは,木のようなパイプラインを採用することで,効率よくHINを分割する分散戦略を採用しています。
論文 参考訳(メタデータ) (2022-01-08T04:08:36Z) - A Modular Framework for Centrality and Clustering in Complex Networks [0.6423239719448168]
本稿では,集中度とクラスタリングという2つの重要なネットワーク解析手法について検討する。
クラスタリングには情報フローベースのモデルが採用されている。
我々のクラスタリングは、エッジウェイトとノードの度合いの異なる解釈と相互作用と同様に、エッジ指向性に対応する柔軟性を自然に継承する。
論文 参考訳(メタデータ) (2021-11-23T03:01:29Z) - Amortized Probabilistic Detection of Communities in Graphs [39.56798207634738]
そこで我々は,アモータイズされたコミュニティ検出のためのシンプルなフレームワークを提案する。
我々はGNNの表現力と最近のアモータイズクラスタリングの手法を組み合わせる。
我々は、合成および実データセットに関するフレームワークから、いくつかのモデルを評価する。
論文 参考訳(メタデータ) (2020-10-29T16:18:48Z) - On the use of local structural properties for improving the efficiency
of hierarchical community detection methods [77.34726150561087]
本研究では,階層型コミュニティ検出の効率向上のために,局所構造ネットワーク特性をプロキシとして利用する方法について検討する。
また,ネットワークプルーニングの性能への影響を,階層的コミュニティ検出をより効率的にするための補助的手法として検証する。
論文 参考訳(メタデータ) (2020-09-15T00:16:12Z) - Benchmarking Graph Neural Networks [75.42159546060509]
グラフニューラルネットワーク(GNN)は、グラフ上のデータから分析および学習するための標準ツールキットとなっている。
成功している分野が主流で信頼性を持つようになるためには、進捗を定量化するためにベンチマークを開発する必要がある。
GitHubリポジトリは1,800のスターと339のフォークに到達し、提案されているオープンソースフレームワークの有用性を実証している。
論文 参考訳(メタデータ) (2020-03-02T15:58:46Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。