論文の概要: 4.5 Million (Suspected) Fake Stars in GitHub: A Growing Spiral of Popularity Contests, Scams, and Malware
- arxiv url: http://arxiv.org/abs/2412.13459v1
- Date: Wed, 18 Dec 2024 03:03:58 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-19 16:49:32.614269
- Title: 4.5 Million (Suspected) Fake Stars in GitHub: A Growing Spiral of Popularity Contests, Scams, and Malware
- Title(参考訳): GitHubのFake Stars: 人気のコンテスト、詐欺、マルウェアの急増
- Authors: Hao He, Haoqin Yang, Philipp Burckhardt, Alexandros Kapravelos, Bogdan Vasilescu, Christian Kästner,
- Abstract要約: われわれはGitHubでニセの星の国際的、縦断的な測定を行った。
StarScoutは、異常な出演行動を検出するスケーラブルなツールです。
本研究は,プラットフォームモデレーター,オープンソース実践者,サプライチェーンセキュリティ研究者に影響を及ぼす。
- 参考スコア(独自算出の注目度): 58.60545935390151
- License:
- Abstract: GitHub, the de-facto platform for open-source software development, provides a set of social-media-like features to signal high-quality repositories. Among them, the star count is the most widely used popularity signal, but it is also at risk of being artificially inflated (i.e., faked), decreasing its value as a decision-making signal and posing a security risk to all GitHub users. In this paper, we present a systematic, global, and longitudinal measurement study of fake stars in GitHub. To this end, we build StarScout, a scalable tool able to detect anomalous starring behaviors (i.e., low activity and lockstep) across the entire GitHub metadata. Analyzing the data collected using StarScout, we find that: (1) fake-star-related activities have rapidly surged since 2024; (2) the user profile characteristics of fake stargazers are not distinct from average GitHub users, but many of them have highly abnormal activity patterns; (3) the majority of fake stars are used to promote short-lived malware repositories masquerading as pirating software, game cheats, or cryptocurrency bots; (4) some repositories may have acquired fake stars for growth hacking, but fake stars only have a promotion effect in the short term (i.e., less than two months) and become a burden in the long term. Our study has implications for platform moderators, open-source practitioners, and supply chain security researchers.
- Abstract(参考訳): オープンソースソフトウェア開発のためのデファクトプラットフォームであるGitHubは、高品質なリポジトリを表示するために、ソーシャルメディアのような一連の機能を提供する。
中でも最も広く使われている人気信号だが、人工的に膨らませる(偽装)リスクがあり、意思決定のシグナルとしての価値を減らし、すべてのGitHubユーザーにセキュリティリスクを及ぼす。
本稿では,GitHubにおける偽星の組織的・グローバル的・縦断的測定について述べる。
この目的のためにStarScoutを構築した。これはスケーラブルなツールで、GitHubメタデータ全体にわたって異常な動作(低アクティビティとロックステップ)を検出することができる。
StarScoutを用いて収集したデータを分析したところ,(1)偽星関連活動は2024年以降急速に増加しており,(2)偽星のユーザプロファイル特性はGitHubの一般ユーザと異なるものではないが,非常に異常な活動パターンを持つものが多い,(3)偽星の大多数が海賊ソフトウェアやゲーム不正行為,あるいは暗号通貨ボットなどの短命なマルウェアリポジトリの促進に利用されている,(4)一部のリポジトリはグロースハックのために偽星を獲得したかもしれないが,偽星は短期(すなわち2ヶ月未満)にのみ宣伝効果を持ち,長期的には負担になる,という結果が得られた。
本研究は,プラットフォームモデレーター,オープンソース実践者,サプライチェーンセキュリティ研究者に影響を及ぼす。
関連論文リスト
- The Impact of Sanctions on GitHub Developers and Activities [10.456917780704911]
GitHubは真にグローバルなソフトウェアの開発を加速させた。
ソフトウェアがグローバルな政治や社会規制に結びつくにつれ、同様に政府の制裁の対象にもなっていく。
2019年、GitHubは特定の場所にいるユーザの特定のサービスへのアクセスを制限したが、一部のコミュニティでこれらの制限をロールバックした。
論文 参考訳(メタデータ) (2024-04-08T13:11:11Z) - Rewrite the Stars [70.48224347277014]
近年の研究では、ネットワーク設計における「スター操作」の未解決の可能性に注意が向けられている。
本研究は、高次元の非線形特徴空間に入力をマッピングする恒星操作の能力を明らかにすることを試みる。
StarNetはシンプルだがパワフルなプロトタイプで、素晴らしいパフォーマンスと低レイテンシを誇示しています。
論文 参考訳(メタデータ) (2024-03-29T04:10:07Z) - Unveiling A Hidden Risk: Exposing Educational but Malicious Repositories
in GitHub [0.0]
私たちはChatGPTを使って、ソフトウェアリポジトリに公開されたコンテンツを理解し、注釈付けします。
教育目的のみのために作成されたとされる35.2KのGitHubリポジトリのコレクションについて、体系的な調査を行っている。
論文 参考訳(メタデータ) (2024-03-07T11:36:09Z) - My Brother Helps Me: Node Injection Based Adversarial Attack on Social Bot Detection [69.99192868521564]
Twitterのようなソーシャルプラットフォームは、数多くの不正なユーザーから包囲されている。
ソーシャルネットワークの構造のため、ほとんどの手法は攻撃を受けやすいグラフニューラルネットワーク(GNN)に基づいている。
本稿では,ボット検出モデルを欺いたノードインジェクションに基づく逆攻撃手法を提案する。
論文 参考訳(メタデータ) (2023-10-11T03:09:48Z) - How do Software Engineering Researchers Use GitHub? An Empirical Study of Artifacts & Impact [0.2209921757303168]
我々は、著者が研究にかかわるソーシャルコーディングにどのように関与しているかを尋ねる。
トップSE研究会場で1万件の論文が公開され、GitHubリンクに手書き注釈が付けられ、309の論文関連リポジトリが研究されている。
人気と影響力は広く分布しており、一部は出版会場と強く相関している。
論文 参考訳(メタデータ) (2023-10-02T18:56:33Z) - A Lot of Talk and a Badge: An Exploratory Analysis of Personal Achievements in GitHub [13.556531448699284]
GitHubは、個人的成果を通じて新しい要素を導入し、バッジをアンロックし、開発者自身のプロフィールページに表示し、開発活動を認識した。
GitHubにおける個人バッジの拡散を研究するために,混合手法を用いた探索分析を行った。
ほとんどの開発者は少なくともバッジをサンプルにしているが、プロフィールを非公開にし、バッジを表示することをオプトアウトするユーザーの増加も観察している。
論文 参考訳(メタデータ) (2023-03-26T12:08:50Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z) - Uncovering the Dark Side of Telegram: Fakes, Clones, Scams, and
Conspiracy Movements [67.39353554498636]
我々は35,382の異なるチャンネルと130,000,000以上のメッセージを収集して,Telegramの大規模解析を行う。
カードなどのダークウェブのプライバシー保護サービスにも、悪名高い活動がいくつかある。
疑似チャネルを86%の精度で識別できる機械学習モデルを提案する。
論文 参考訳(メタデータ) (2021-11-26T14:53:31Z) - Multi-attentional Deepfake Detection [79.80308897734491]
ディープフェイクによる顔の偽造はインターネットに広まり、深刻な社会的懸念を引き起こしている。
新たなマルチアテンテーショナルディープフェイク検出ネットワークを提案する。
具体的には,1)ネットワークを異なる局所的部分へ配置するための複数の空間的注意ヘッド,2)浅い特徴の微妙なアーティファクトをズームするテクスチャ的特徴拡張ブロック,3)低レベルなテクスチャ特徴と高レベルなセマンティクス特徴をアグリゲートする,の3つの構成要素からなる。
論文 参考訳(メタデータ) (2021-03-03T13:56:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。