論文の概要: Programming Language Co-Usage Patterns on Stack Overflow: Analysis of the Developer Ecosystem
- arxiv url: http://arxiv.org/abs/2604.12123v2
- Date: Wed, 15 Apr 2026 03:17:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-16 13:09:57.458897
- Title: Programming Language Co-Usage Patterns on Stack Overflow: Analysis of the Developer Ecosystem
- Title(参考訳): スタックオーバーフローにおける言語共用パターン:開発者エコシステムの分析
- Authors: Bachan Ghimire, Nitin Gupta,
- Abstract要約: Stack Overflowのポストは、186のプログラミング言語で何十万もの開発者が投稿しています。
FP-Growthは、シェル/バッシュ、Swift/Objective-Cのような密結合クラスタと、個々の言語の人気が予測するよりもはるかに高いリフト値を持つCファミリーを識別する。
LDAは、Appleプラットフォーム開発者、科学およびハードウェアプログラマ、関数型/アカデミックプログラマ、および2つのUnixスクリプティングサブファウンデーションを含む25の開発者プロファイルを生成する。
Louvain氏は言語グラフを,Web/エンタープライズ,Appleエコシステム,システム/科学の3つのマクロコミュニティに分割する。
- 参考スコア(独自算出の注目度): 1.188139878127856
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Understanding how developers combine programming languages in practice reveals the hidden structure of the software ecosystem: which languages are used as complements, which define coherent technology stacks, and which bridge disparate communities. We present a three-phase empirical pipeline that mines Stack Overflow posts by hundreds of thousands of developers across 186 programming languages, applying FP-Growth frequent itemset mining, Latent Dirichlet Allocation topic modeling, and Louvain community detection on a weighted co-usage graph, with the goal of characterizing co-usage coupling, latent developer specializations, and macro-level ecosystem structure simultaneously from behavioral data. FP-Growth identifies tight coupling clusters such as shell/bash, Swift/Objective-C, and the C-family with lift values far exceeding what individual language popularity predicts. LDA produces 25 developer profiles including Apple-platform developers, scientific and hardware programmers, functional/academic programmers, and two distinct Unix scripting sub-profiles. Louvain partitions the language graph into three macro-communities: web/enterprise, Apple ecosystem, and systems/scientific, and identifies Java as the highest-degree hub connecting all three. All three methods independently converge on the same ecosystem structure, providing strong cross-method validation of the findings.
- Abstract(参考訳): 開発者が実際にプログラミング言語を組み合わせる方法を理解することで、ソフトウェアエコシステムの隠れた構造が明らかになる。
本稿では,FP-Growthの頻繁なアイテムセットマイニング,遅延ディリクレ割当トピックモデリング,およびLouvainコミュニティ検出を重み付きコユーザジグラフ上で適用し,コユーザジ結合,潜時開発者の特殊化,マクロレベルのエコシステム構造を行動データから同時に特徴付けることを目的として,Stack Overflowの投稿を186言語で数十万件マイニングする3段階の実証パイプラインを提案する。
FP-Growthは、シェル/バッシュ、Swift/Objective-Cのような密結合クラスタと、個々の言語の人気が予測するよりもはるかに高いリフト値を持つCファミリーを識別する。
LDAは、Appleプラットフォーム開発者、科学およびハードウェアプログラマ、関数型/アカデミックプログラマ、および2つのUnixスクリプティングサブファウンデーションを含む25の開発者プロファイルを生成する。
Louvain氏は言語グラフを,Web/エンタープライズ,Appleエコシステム,システム/科学の3つのマクロコミュニティに分割する。
これら3つの手法は独立して同じ生態系構造に収束し、研究結果の強いクロスメタルな検証を提供する。
関連論文リスト
- Towards Analyzing N-language Polyglot Programs [0.7691016342079237]
開発者が複数のプログラミング言語を統合することで、多言語プログラミングが人気を集めている。
現代的なWebシステムは、同じ実行チェーン内でJavaScript、WebAssembly、Rustをリンクすることが多い。
本稿では,3言語多言語通信によるソフトウェアシステムの展望について述べる。
論文 参考訳(メタデータ) (2026-01-30T20:52:26Z) - ATLAS: Automated Tree-based Language Analysis System for C and C++ source programs [1.0499611180329804]
本稿では,文レベル制御フローグラフ(CFG)と型認識データフローグラフ(DFG)を生成するPythonベースのコマンドラインインタフェース(CLI)であるATLASを紹介する。
ATLASは、下流のソフトウェアエンジニアリング(SE)と機械学習ベースのプログラム理解を改善するための実践的な基盤を提供する。
論文 参考訳(メタデータ) (2025-12-14T01:11:11Z) - SWE-Compass: Towards Unified Evaluation of Agentic Coding Abilities for Large Language Models [59.90381306452982]
ソフトウェアエンジニアリングのための大規模言語モデル(LLM)の評価は、タスクカバレッジの狭さ、言語バイアス、現実世界の開発者との整合性の不足によって制限されている。
SWE-1は、不均一なコード関連評価を構造化および生産整合性のあるフレームワークに統合する包括的なベンチマークである。
SWE-は8つのタスクタイプ、8つのプログラミングシナリオ、10のプログラミング言語にまたがる。
論文 参考訳(メタデータ) (2025-11-07T18:01:32Z) - Beyond Language Barriers: Multi-Agent Coordination for Multi-Language Code Generation [8.896718697354187]
XL-CoGenは、複数のプログラミング言語で高品質なコードを生成する。
中間表現、コード生成、翻訳、自動修復を統合する。
論文 参考訳(メタデータ) (2025-09-24T09:18:08Z) - Evaluating Programming Language Confusion [6.462594894731934]
コードのための大規模言語モデル(Code LLM)は、ソフトウェア工学において大きな注目を集めている。
これらのモデルは、プログラミング概念の理解、アルゴリズムの実装、さらには異なるプログラミング言語のブリッジ化において、顕著な能力を示してきた。
これらの進歩にもかかわらず、コードLLMは、意図しない言語でコードを生成するために、しばしばプログラミング言語の混乱に苦しむ。
論文 参考訳(メタデータ) (2025-03-17T18:14:15Z) - Multi-Programming Language Ensemble for Code Generation in Large Language Model [5.882816711878273]
大規模言語モデル(LLM)は、特にワンパスコード生成において、コード生成を大幅に改善した。
既存のアプローチのほとんどは、単一のプログラミング言語でコードを生成することだけに重点を置いており、LLMの多言語機能を活用する可能性を見越している。
本稿では,複数の言語にまたがるコード生成を利用して全体的な性能を向上させる,新しいアンサンブルに基づくMulti-Programming Language Ensemble (MPLE)を提案する。
論文 参考訳(メタデータ) (2024-09-06T08:31:18Z) - CRUXEval-X: A Benchmark for Multilingual Code Reasoning, Understanding and Execution [50.1875460416205]
CRUXEVAL-Xコード推論ベンチマークには19のプログラミング言語が含まれている。
各言語に対して少なくとも600人の被験者で構成され、合計19Kのコンテンツ一貫性テストがある。
Pythonでのみトレーニングされたモデルでさえ、他の言語で34.4%のPass@1を達成することができる。
論文 参考訳(メタデータ) (2024-08-23T11:43:00Z) - ZC3: Zero-Shot Cross-Language Code Clone Detection [79.53514630357876]
ゼロショットクロスランゲージコードクローン検出のためのZC3という新しい手法を提案する。
ZC3は、異なるプログラミング言語間で同型表現空間を形成するために、対照的なスニペット予測を設計する。
これに基づいて、ZC3はドメイン認識学習とサイクル一貫性学習を利用して、異なる言語間で整合した表現を生成する。
論文 参考訳(メタデータ) (2023-08-26T03:48:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。