論文の概要: Weaponizing the Commons: A Taxonomy and Detection Framework of Abuse on GitHub
- arxiv url: http://arxiv.org/abs/2604.17909v1
- Date: Mon, 20 Apr 2026 07:37:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-21 21:52:52.749877
- Title: Weaponizing the Commons: A Taxonomy and Detection Framework of Abuse on GitHub
- Title(参考訳): CommonsのWeaponizing: GitHubにおけるAbuseの分類と検出フレームワーク
- Authors: Yuli Cheng, Xiaoyu Zhang, Jiongchi Yu, Shiqing Ma, Chao Shen, Yang Liu,
- Abstract要約: GitHubは現代のソフトウェアサプライチェーンにおいて重要な役割を担っており、セキュリティが重要な研究課題となっている。
既存の研究は主にCI/CD自動化、コラボレーションパターン、コミュニティ管理に重点を置いている。
本稿では,GitHubの悪用行為の報告を体系的にレビューし,要約し,公的な乱用事例の実証分析を行う。
本研究は,ソフトウェアセキュリティの観点から,その多様な症状と根本原因を特徴付ける包括的分類法を提案する。
- 参考スコア(独自算出の注目度): 31.618034402766018
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: GitHub plays a critical role in modern software supply chains, making its security an important research concern. Existing studies have primarily focused on CI/CD automation, collaboration patterns, and community management, while abuse behaviors on GitHub have received little systematic investigation. In this paper, we systematically review and summarize reported GitHub abuse behaviors and conduct an empirical analysis of publicly available abuse cases, curating a manually labeled dataset of 392 GitHub instances. Based on this investigation, we propose a comprehensive taxonomy that characterizes their diverse symptoms and root causes from a software security perspective. Building on this taxonomy, we develop a unified detection framework capable of identifying all abuse categories across repositories and user accounts. Evaluated on the constructed dataset, the proposed framework achieves high performance across all categories (e.g., F1-score exceeding 89%). Collectively, this work advances the understanding of GitHub abuse behaviors and lays the groundwork for large-scale, systematic analysis of the GitHub platform to strengthen software supply chain security.
- Abstract(参考訳): GitHubは現代のソフトウェアサプライチェーンにおいて重要な役割を担っており、セキュリティが重要な研究課題となっている。
既存の研究は主にCI/CD自動化、コラボレーションパターン、コミュニティ管理に重点を置いている。
本稿では、GitHubの悪用行動の報告を体系的にレビューし要約し、公開されている悪用事例の実証分析を行い、392のGitHubインスタンスを手動でラベル付けしたデータセットをキュレートする。
本研究は,ソフトウェアセキュリティの観点から,その多様な症状と根本原因を特徴付ける包括的分類法を提案する。
この分類に基づいて,レポジトリとユーザアカウントをまたがるすべての乱用カテゴリを識別可能な統合検出フレームワークを開発した。
構築されたデータセットに基づいて評価し、提案するフレームワークは、すべてのカテゴリ(例えば、F1スコアが89%を超える)で高いパフォーマンスを達成する。
全体として、この研究はGitHubの悪用行動の理解を促進し、ソフトウェアサプライチェーンのセキュリティを強化するために、GitHubプラットフォームを大規模かつ体系的に分析する基盤となる。
関連論文リスト
- Deciphering WONTFIX: A Mixed-Method Study on Why GitHub Issues Get Rejected [0.0]
調査では、GitHub上のさまざまなオープンソースリポジトリで willtfix とラベル付けされている問題の存在状況と理由について調査している。
調査の結果、GitHub上のプロジェクトの約30%が、いくつかの問題に対して wontfixラベルを適用していることがわかった。
この研究は、ユーザ固有のコントロールファクタからメンテナ固有の決定まで、ラベル付け問題の背後にある8つの一般的なテーマを、Ventfixとして特定した。
論文 参考訳(メタデータ) (2025-10-01T23:22:18Z) - SwingArena: Competitive Programming Arena for Long-context GitHub Issue Solving [90.32201622392137]
We present SwingArena, a competitive evaluation framework for Large Language Models (LLMs)。
従来の静的ベンチマークとは異なり、SwingArenaはLLMをイテレーションとして組み合わせて、テストケースを作成し、継続的インテグレーション(CI)パイプラインを通じてパッチを検証するパッチとレビュアーを生成することで、ソフトウェアのコラボレーションプロセスをモデル化する。
論文 参考訳(メタデータ) (2025-05-29T18:28:02Z) - Automating the Detection of Code Vulnerabilities by Analyzing GitHub Issues [6.6681265451722895]
我々は、脆弱性検出に関連するGitHubの問題を分類するために特別に設計された新しいデータセットを紹介します。
結果は、早期脆弱性検出における現実世界のアプリケーションに対するこのアプローチの可能性を示している。
この作業は、オープンソースのソフトウェアエコシステムのセキュリティを強化する可能性がある。
論文 参考訳(メタデータ) (2025-01-09T14:13:39Z) - Visual Analysis of GitHub Issues to Gain Insights [2.9051263101214566]
本稿では,課題タイムラインに関する洞察を提供するために,可視化を生成するプロトタイプWebアプリケーションを提案する。
問題のライフサイクルに焦点をあて、ユーザによる開発パターンの理解を高めるために重要な情報を記述する。
論文 参考訳(メタデータ) (2024-07-30T15:17:57Z) - Alibaba LingmaAgent: Improving Automated Issue Resolution via Comprehensive Repository Exploration [64.19431011897515]
本稿では,問題解決のためにソフトウェアリポジトリ全体を包括的に理解し,活用するために設計された,新しいソフトウェアエンジニアリング手法であるAlibaba LingmaAgentを提案する。
提案手法では,重要なリポジトリ情報を知識グラフに凝縮し,複雑さを低減し,モンテカルロ木探索に基づく戦略を採用する。
Alibaba Cloudの製品展開と評価において、LingmaAgentは、開発エンジニアが直面した社内問題の16.9%を自動で解決し、手作業による介入で43.3%の問題を解決した。
論文 参考訳(メタデータ) (2024-06-03T15:20:06Z) - Unveiling A Hidden Risk: Exposing Educational but Malicious Repositories
in GitHub [0.0]
私たちはChatGPTを使って、ソフトウェアリポジトリに公開されたコンテンツを理解し、注釈付けします。
教育目的のみのために作成されたとされる35.2KのGitHubリポジトリのコレクションについて、体系的な調査を行っている。
論文 参考訳(メタデータ) (2024-03-07T11:36:09Z) - Exploring Security Practices in Infrastructure as Code: An Empirical
Study [54.669404064111795]
クラウドコンピューティングは、Infrastructure as Code (IaC)ツールが広く使われていることで人気を博している。
スクリプティングプロセスは、実践者が自動的に設定ミスや脆弱性、プライバシリスクを導入するのを防ぐものではない。
セキュリティの確保は、実践者が明確な方針、ガイドライン、ベストプラクティスを理解し、採用することに依存する。
論文 参考訳(メタデータ) (2023-08-07T23:43:32Z) - Predicting Issue Types on GitHub [8.791809365994682]
Ticket Taggerは、機械学習技術による課題のタイトルと説明を分析するGitHubアプリである。
私たちは、約30,000のGitHubイシューに対して、ツールの予測パフォーマンスを実証的に評価しました。
論文 参考訳(メタデータ) (2021-07-21T08:14:48Z) - S3M: Siamese Stack (Trace) Similarity Measure [55.58269472099399]
本稿では、深層学習に基づくスタックトレースの類似性を計算する最初のアプローチであるS3Mを紹介します。
BiLSTMエンコーダと、類似性を計算するための完全接続型分類器をベースとしている。
私たちの実験は、オープンソースデータとプライベートなJetBrainsデータセットの両方において、最先端のアプローチの優位性を示しています。
論文 参考訳(メタデータ) (2021-03-18T21:10:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。