論文の概要: BotHawk: An Approach for Bots Detection in Open Source Software Projects
- arxiv url: http://arxiv.org/abs/2307.13386v1
- Date: Tue, 25 Jul 2023 10:15:38 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 17:37:15.720480
- Title: BotHawk: An Approach for Bots Detection in Open Source Software Projects
- Title(参考訳): BotHawk: オープンソースのソフトウェアプロジェクトにおけるボット検出のアプローチ
- Authors: Fenglin Bi, Zhiwei Zhu, Wei Wang, Xiaoya Xia, Hassan Ali Khan, Peng Pu
- Abstract要約: 本研究の目的は,オープンソースのソフトウェアプロジェクトにおけるボットの振る舞いを調査し,最大限の精度でボットアカウントを特定することである。
オープンソースのソフトウェアプロジェクトでは、17の機能を5次元で分析することで、4種類のボットアカウントを特定しました。
私たちのチームはBotHawkという,オープンソースのソフトウェアプロジェクトのボットを検出するための,極めて効果的なモデルを開発しました。
- 参考スコア(独自算出の注目度): 4.59229477803039
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Social coding platforms have revolutionized collaboration in software
development, leading to using software bots for streamlining operations.
However, The presence of open-source software (OSS) bots gives rise to problems
including impersonation, spamming, bias, and security risks. Identifying bot
accounts and behavior is a challenging task in the OSS project. This research
aims to investigate bots' behavior in open-source software projects and
identify bot accounts with maximum possible accuracy. Our team gathered a
dataset of 19,779 accounts that meet standardized criteria to enable future
research on bots in open-source projects. We follow a rigorous workflow to
ensure that the data we collect is accurate, generalizable, scalable, and
up-to-date. We've identified four types of bot accounts in open-source software
projects by analyzing their behavior across 17 features in 5 dimensions. Our
team created BotHawk, a highly effective model for detecting bots in
open-source software projects. It outperforms other models, achieving an AUC of
0.947 and an F1-score of 0.89. BotHawk can detect a wider variety of bots,
including CI/CD and scanning bots. Furthermore, we find that the number of
followers, number of repositories, and tags contain the most relevant features
to identify the account type.
- Abstract(参考訳): ソーシャルコーディングプラットフォームは、ソフトウェア開発におけるコラボレーションに革命をもたらし、作業の合理化にソフトウェアボットを使用している。
しかし、オープンソースのソフトウェア(OSS)ボットの存在は、偽造、スパム、偏見、セキュリティリスクなどの問題を引き起こす。
ボットアカウントと振る舞いの特定はOSSプロジェクトでは難しい作業です。
本研究は,オープンソースソフトウェアにおけるボットの挙動を調査し,ボットアカウントを最大精度で識別することを目的とする。
当社のチームは19,779のアカウントのデータセットを収集し、標準化基準を満たして、オープンソースプロジェクトにおけるボットの将来的な研究を可能にしました。
収集したデータが正確で、一般化可能で、スケーラブルで、最新であることを保証するための厳格なワークフローに従います。
オープンソースソフトウェアプロジェクトでは、17の機能を5次元で分析することで4種類のボットアカウントを特定しました。
私たちのチームはBotHawkという,オープンソースのソフトウェアプロジェクトのボットを検出するための,極めて効果的なモデルを開発しました。
他のモデルより優れており、AUCは0.947、F1スコアは0.89である。
BotHawkは、CI/CDやスキャンボットなど、幅広い種類のボットを検出できる。
さらに、フォロワー数、リポジトリ数、タグがアカウントタイプを識別するための最も関連する機能を含んでいることも分かりました。
関連論文リスト
- The Perceptions of Software Engineers Concerning the Utilization of Bots in the OSS Development Process: An Exploratory Survey [1.663160284499972]
ボットは生産性を高め、タスクの自動化を促進することによって、プロフェッショナルに日々のサポートを提供する。
現在のボットは十分な知性を持っておらず、ボットデザイナーがさらなる機能や統合を開発するのを助けるために、新たな課題と強化を提起している。
論文 参考訳(メタデータ) (2024-11-14T14:16:03Z) - Unmasking Social Bots: How Confident Are We? [41.94295877935867]
本稿では,ボット検出と不確実性の定量化の両方に対処することを提案する。
この二重焦点は、各予測の定量化の不確実性に関連する追加情報を活用することができるため、非常に重要である。
具体的には,予測を高い信頼性で行う場合のボットに対する標的的介入を促進するとともに,予測が不確実な場合の警告(例えば,より多くのデータ収集)を提案する。
論文 参考訳(メタデータ) (2024-07-18T22:33:52Z) - What Does the Bot Say? Opportunities and Risks of Large Language Models in Social Media Bot Detection [48.572932773403274]
ソーシャルボット検出における大規模言語モデルの可能性とリスクについて検討する。
本稿では,多様なユーザ情報モダリティを分割し,克服するための混合異種エキスパートフレームワークを提案する。
実験により、1000の注釈付き例に対する命令チューニングは、最先端のベースラインよりも優れた特殊なLLMを生成することが示された。
論文 参考訳(メタデータ) (2024-02-01T06:21:19Z) - BotArtist: Generic approach for bot detection in Twitter via semi-automatic machine learning pipeline [47.61306219245444]
Twitterは、ボットや偽アカウントのターゲットとなり、偽情報や操作の拡散につながった。
本稿では,機械学習モデル開発に関連する課題に対処するために,セミオートマチック機械学習パイプライン(SAMLP)を提案する。
ユーザプロファイル機能に基づいたボット検出モデルBotArtistを開発した。
論文 参考訳(メタデータ) (2023-05-31T09:12:35Z) - MulBot: Unsupervised Bot Detection Based on Multivariate Time Series [2.525739800601558]
MulBotは、ユーザタイムラインから抽出された多次元の時間的特徴に基づく教師なしボット検出器である。
我々はf1-score $= 0.99$を達成するバイナリ分類タスクを実行し、最先端の手法より優れています。
また、MulBotの強みを、異なるボットネットの検出と分離という、新しく実用的なタスクで実証する。
論文 参考訳(メタデータ) (2022-09-21T13:56:12Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - A ground-truth dataset and classification model for detecting bots in
GitHub issue and PR comments [70.1864008701113]
ボットはGithubリポジトリで、分散ソフトウェア開発プロセスの一部である反復的なアクティビティを自動化するために使用されている。
本稿では,5000のGithubアカウントのプルリクエストとコメント発行に関する,高い相互契約を伴う手動分析に基づいて,基幹トラスデータセットを提案する。
ボットを検出する自動分類モデルを提案し,各アカウントの空のコメント数と空でないコメント数,コメントパターンの数,コメントパターン内のコメント間の不平等を主特徴とする。
論文 参考訳(メタデータ) (2020-10-07T09:30:52Z) - Detection of Novel Social Bots by Ensembles of Specialized Classifiers [60.63582690037839]
悪意ある俳優は、社会ボットとして知られるアルゴリズムによって部分的に制御される不正なソーシャルメディアアカウントを作成し、誤情報を広め、オンラインでの議論を扇動する。
異なるタイプのボットが、異なる行動特徴によって特徴づけられることを示す。
本稿では,ボットのクラスごとに専門的な分類器を訓練し,それらの決定を最大ルールで組み合わせる,教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-11T22:59:59Z) - BeCAPTCHA-Mouse: Synthetic Mouse Trajectories and Improved Bot Detection [78.11535724645702]
本稿では,マウスの神経運動モデルに基づくボット検出器BeCAPTCHA-Mouseを提案する。
BeCAPTCHA-Mouseは、1つのマウス軌道だけで、平均93%の精度で高実在性のボット軌道を検出することができる。
論文 参考訳(メタデータ) (2020-05-02T17:40:49Z) - Detecting and Characterizing Bots that Commit Code [16.10540443996897]
著者名,コミットメッセージ,コミットによって修正されたファイル,オムミットに関連するプロジェクトを用いて,ボットを検出するための体系的なアプローチを提案する。
私たちは、発見した461のボット(全員が1000以上のコミットを持っている)と13,762,430のコミットに関する詳細な情報を含む、共有可能なデータセットをコンパイルしました。
論文 参考訳(メタデータ) (2020-03-02T21:54:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。