論文の概要: Why Authors and Maintainers Link (or Don't Link) Their PyPI Libraries to Code Repositories and Donation Platforms
- arxiv url: http://arxiv.org/abs/2601.15139v1
- Date: Wed, 21 Jan 2026 16:13:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-22 21:27:50.451815
- Title: Why Authors and Maintainers Link (or Don't Link) Their PyPI Libraries to Code Repositories and Donation Platforms
- Title(参考訳): 著者と管理者がPyPIライブラリをコードリポジトリと寄付プラットフォームにリンクする(リンクしない)理由
- Authors: Alexandros Tsakpinis, Nicolas Raube, Alexander Pretschner,
- Abstract要約: Python Package Index(PyPI)上のライブラリのメタデータは、オープンソースライブラリの透明性、信頼性、持続性をサポートする上で重要な役割を果たす。
本稿は,5万PyPIの著者とメンテナに送付された2つの対象調査を組み合わせた大規模実証研究である。
我々は,大規模言語モデル(LLM)に基づくトピックモデリングを用いて1,400以上の応答を分析し,リポジトリと寄付プラットフォームのリンクに関連する重要なモチベーションと障壁を明らかにする。
- 参考スコア(独自算出の注目度): 83.16077040470975
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Metadata of libraries on the Python Package Index (PyPI)-including links to source code repositories and donation platforms-plays a critical role in supporting the transparency, trust, and sustainability of open-source libraries. Yet, many packages lack such metadata, and little is known about the underlying reasons. This paper presents a large-scale empirical study combining two targeted surveys sent to 50,000 PyPI authors and maintainers. We analyze more than 1,400 responses using large language model (LLM)-based topic modeling to uncover key motivations and barriers related to linking repositories and donation platforms. While repository URLs are often linked to foster collaboration, increase transparency, and enable issue tracking, some maintainers omit them due to oversight, laziness, or the perceived irrelevance to their project. Donation platform links are reported to support open source work or receive financial contributions, but are hindered by skepticism, technical friction, and organizational constraints. Cross-cutting challenges-such as outdated links, lack of awareness, and unclear guidance-affect both types of metadata. We further assess the robustness of our topic modeling pipeline across 30 runs (84% lexical and 89% semantic similarity) and validate topic quality with 23 expert raters (Randolph's kappa = 0.55). The study contributes empirical insights into PyPI's metadata practices and provides recommendations for improving them, while also demonstrating the effectiveness of our topic modeling approach for analyzing short-text survey responses.
- Abstract(参考訳): Python Package Index(PyPI)上のライブラリのメタデータ - ソースコードリポジトリや寄付プラットフォームへのリンクを含む - は、オープンソースライブラリの透明性、信頼性、持続性をサポートする上で重要な役割を果たす。
しかし、多くのパッケージにはそのようなメタデータが欠けており、その根底にある理由についてはほとんど分かっていない。
本稿は,5万 PyPI の著者とメンテナに送付された2つの対象調査を組み合わせた大規模実証研究である。
我々は,大規模言語モデル(LLM)に基づくトピックモデリングを用いて1,400以上の応答を分析し,リポジトリと寄付プラットフォームのリンクに関連する重要なモチベーションと障壁を明らかにする。
リポジトリURLは、しばしばコラボレーションの促進、透明性の向上、イシュートラッキングの有効化にリンクされているが、一部のメンテナは、監視、怠慢、プロジェクトに対する認識できないため、それらを省略している。
寄付プラットフォームリンクは、オープンソースの作業を支援したり、金銭的な貢献を受けるように報告されているが、懐疑主義、技術的な摩擦、組織的な制約によって妨げられている。
横断的課題 - 古いリンク、認識の欠如、ガイダンスの欠如など は、両方のメタデータに影響を与えます。
さらに、30ランにわたるトピックモデリングパイプラインの堅牢性(84%の語彙と89%のセマンティックな類似性)を評価し、23のエキスパートトレーナー(Randolph's kappa = 0.55)でトピック品質を検証する。
本研究は,PyPIのメタデータの実践に関する実証的な知見を提供し,その改善を推奨するとともに,短文アンケート応答の分析におけるトピックモデリング手法の有効性を実証する。
関連論文リスト
- AgentCPM-Report: Interleaving Drafting and Deepening for Open-Ended Deep Research [85.51475655916026]
AgentCPM-Reportは軽量だが高性能なローカルソリューションで、人間の記述プロセスを反映したフレームワークで構成されている。
我々のフレームワークは、モデルがアウトラインを動的に修正できるWARP(Writeing As Reasoning Policy)を使用している。
DeepResearch Bench、DeepConsult、DeepResearch Gymの実験は、AgentCPM-Reportが主要なクローズドソースシステムより優れていることを示した。
論文 参考訳(メタデータ) (2026-02-06T09:45:04Z) - Analyzing the Availability of E-Mail Addresses for PyPI Libraries [89.21869606965578]
81.6%のライブラリには、少なくとも1つの有効な電子メールアドレスが含まれており、PyPIが主要なソースとなっている。
698,000以上の無効なエントリを識別します。
論文 参考訳(メタデータ) (2026-01-20T14:54:58Z) - What About Our Bug? A Study on the Responsiveness of NPM Package Maintainers [2.131643283600185]
もっとも依存度の高いnpmパッケージ500件のバグレポート30,340件の応答性について検討した。
調査の結果,メンテナの反応は概ね70%であり,プロジェクトレベルの応答性は70%であった。
論文 参考訳(メタデータ) (2025-11-07T05:11:47Z) - Empirical Evaluation of AI-Assisted Software Package Selection: A Knowledge Graph Approach [4.100870096741918]
本研究は,ソフトウェアパッケージ選択をMCDM問題として定式化する。
データパイプラインは、ソフトウェアメタデータ、利用トレンド、脆弱性情報、開発者の感情を継続的に収集し、統合する。
システムは、大きな言語モデルを使用して、ユーザの意図を解釈し、モデルをクエリして、コンテキスト的に適切なパッケージを識別する。
論文 参考訳(メタデータ) (2025-08-06T13:55:43Z) - Analyzing the Usage of Donation Platforms for PyPI Libraries [91.97201077607862]
本研究では,PyPIエコシステムにおける寄付プラットフォームの導入状況について分析した。
GitHub Sponsorsが支配的なプラットフォームであるが、多くのPyPIリストのリンクは時代遅れである。
論文 参考訳(メタデータ) (2025-03-11T10:27:31Z) - See to Believe: Using Visualization To Motivate Updating Third-party Dependencies [1.7914660044009358]
サードパーティの依存関係を使用したアプリケーションによって導入されたセキュリティ脆弱性が増加している。
開発者はライブラリのアップデートに注意を払っており、脆弱性の修正にも注意している。
本稿では、依存性グラフ可視化(DGV)アプローチが、開発者が更新を動機付けると仮定する。
論文 参考訳(メタデータ) (2024-05-15T03:57:27Z) - pyvene: A Library for Understanding and Improving PyTorch Models via
Interventions [79.72930339711478]
$textbfpyvene$は、さまざまなPyTorchモジュールに対するカスタマイズ可能な介入をサポートするオープンソースライブラリである。
私たちは、$textbfpyvene$が、ニューラルモデルへの介入を実行し、他のモデルとインターバルされたモデルを共有するための統一されたフレームワークを提供する方法を示します。
論文 参考訳(メタデータ) (2024-03-12T16:46:54Z) - NLPeer: A Unified Resource for the Computational Study of Peer Review [58.71736531356398]
NLPeer - 5万以上の論文と5つの異なる会場からの1万1千件のレビューレポートからなる、初めて倫理的にソースされたマルチドメインコーパス。
従来のピアレビューデータセットを拡張し、解析および構造化された論文表現、豊富なメタデータ、バージョニング情報を含む。
我々の研究は、NLPなどにおけるピアレビューの体系的、多面的、エビデンスに基づく研究への道のりをたどっている。
論文 参考訳(メタデータ) (2022-11-12T12:29:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。