論文の概要: Detecting and Characterizing Bots that Commit Code
- arxiv url: http://arxiv.org/abs/2003.03172v3
- Date: Fri, 27 Mar 2020 20:47:56 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-27 05:07:03.781572
- Title: Detecting and Characterizing Bots that Commit Code
- Title(参考訳): コミットするボットの検出と特徴付け
- Authors: Tapajit Dey, Sara Mousavi, Eduardo Ponce, Tanner Fry, Bogdan
Vasilescu, Anna Filippova, Audris Mockus
- Abstract要約: 著者名,コミットメッセージ,コミットによって修正されたファイル,オムミットに関連するプロジェクトを用いて,ボットを検出するための体系的なアプローチを提案する。
私たちは、発見した461のボット(全員が1000以上のコミットを持っている)と13,762,430のコミットに関する詳細な情報を含む、共有可能なデータセットをコンパイルしました。
- 参考スコア(独自算出の注目度): 16.10540443996897
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Background: Some developer activity traditionally performed manually, such as
making code commits, opening, managing, or closing issues is increasingly
subject to automation in many OSS projects. Specifically, such activity is
often performed by tools that react to events or run at specific times. We
refer to such automation tools as bots and, in many software mining scenarios
related to developer productivity or code quality it is desirable to identify
bots in order to separate their actions from actions of individuals. Aim: Find
an automated way of identifying bots and code committed by these bots, and to
characterize the types of bots based on their activity patterns. Method and
Result: We propose BIMAN, a systematic approach to detect bots using author
names, commit messages, files modified by the commit, and projects associated
with the ommits. For our test data, the value for AUC-ROC was 0.9. We also
characterized these bots based on the time patterns of their code commits and
the types of files modified, and found that they primarily work with
documentation files and web pages, and these files are most prevalent in HTML
and JavaScript ecosystems. We have compiled a shareable dataset containing
detailed information about 461 bots we found (all of whom have more than 1000
commits) and 13,762,430 commits they created.
- Abstract(参考訳): 背景: コードコミット、オープニング、管理、クローズといった、従来から手動で実施されていた開発者のアクティビティの多くは、OSSプロジェクトの自動化の対象となっている。
特に、このようなアクティビティは、イベントに反応したり、特定の時間に実行されるツールによって実行されることが多い。
このような自動化ツールをボットと呼び、開発者の生産性やコード品質に関連する多くのソフトウェアマイニングシナリオでは、個々のアクションとアクションを分離するためにボットを特定することが望ましい。
Aim: これらのボットがコミットしたボットとコードを自動で識別し、アクティビティパターンに基づいてボットのタイプを特徴付ける方法を見つけます。
方法と結果: BIMANは、著者名、コミットメッセージ、コミットによって修正されたファイル、およびコミットに関連するプロジェクトを用いてボットを検出する体系的なアプローチである。
実験データでは,auc-rocの値は0.9。
また、これらのボットはコードコミットの時間パターンと修正されたファイルの種類に基づいて特徴付けし、それらは主にドキュメントファイルとwebページで動作し、これらのファイルはhtmlとjavascriptのエコシステムでもっとも広く使われていることを突き止めました。
私たちは、見つけた461のボット(すべて1000以上のコミットがある)と13,762,430のコミットに関する詳細な情報を含む共有可能なデータセットをコンパイルしました。
関連論文リスト
- Spider2-V: How Far Are Multimodal Agents From Automating Data Science and Engineering Workflows? [73.81908518992161]
我々は、プロのデータサイエンスとエンジニアリングに焦点を当てた最初のマルチモーダルエージェントベンチマークであるSpider2-Vを紹介する。
Spider2-Vは、本物のコンピュータ環境における現実世界のタスクを特徴とし、20のエンタープライズレベルのプロフェッショナルアプリケーションを組み込んでいる。
これらのタスクは、エンタープライズデータソフトウェアシステムにおいて、コードを書き、GUIを管理することで、マルチモーダルエージェントがデータ関連のタスクを実行する能力を評価する。
論文 参考訳(メタデータ) (2024-07-15T17:54:37Z) - BotHawk: An Approach for Bots Detection in Open Source Software Projects [4.59229477803039]
本研究の目的は,オープンソースのソフトウェアプロジェクトにおけるボットの振る舞いを調査し,最大限の精度でボットアカウントを特定することである。
オープンソースのソフトウェアプロジェクトでは、17の機能を5次元で分析することで、4種類のボットアカウントを特定しました。
私たちのチームはBotHawkという,オープンソースのソフトウェアプロジェクトのボットを検出するための,極めて効果的なモデルを開発しました。
論文 参考訳(メタデータ) (2023-07-25T10:15:38Z) - BotArtist: Generic approach for bot detection in Twitter via semi-automatic machine learning pipeline [47.61306219245444]
Twitterは、ボットや偽アカウントのターゲットとなり、偽情報や操作の拡散につながった。
本稿では,機械学習モデル開発に関連する課題に対処するために,セミオートマチック機械学習パイプライン(SAMLP)を提案する。
ユーザプロファイル機能に基づいたボット検出モデルBotArtistを開発した。
論文 参考訳(メタデータ) (2023-05-31T09:12:35Z) - BotShape: A Novel Social Bots Detection Approach via Behavioral Patterns [4.386183132284449]
実世界のデータセットに基づいて、生のイベントログから行動シーケンスを構築する。
ボットと真のユーザの違いと、ボットアカウント間の類似パターンを観察する。
本稿では,行動の順序や特徴を自動的に把握するソーシャルボット検出システムBotShapeを提案する。
論文 参考訳(メタデータ) (2023-03-17T19:03:06Z) - MulBot: Unsupervised Bot Detection Based on Multivariate Time Series [2.525739800601558]
MulBotは、ユーザタイムラインから抽出された多次元の時間的特徴に基づく教師なしボット検出器である。
我々はf1-score $= 0.99$を達成するバイナリ分類タスクを実行し、最先端の手法より優れています。
また、MulBotの強みを、異なるボットネットの検出と分離という、新しく実用的なタスクで実証する。
論文 参考訳(メタデータ) (2022-09-21T13:56:12Z) - BeCAPTCHA-Type: Biometric Keystroke Data Generation for Improved Bot
Detection [63.447493500066045]
本研究では,キーストローク生体データ合成のためのデータ駆動学習モデルを提案する。
提案手法は,ユニバーサルモデルとユーザ依存モデルに基づく2つの統計的手法と比較する。
実験フレームワークでは16万件の被験者から1億3600万件のキーストロークイベントのデータセットについて検討している。
論文 参考訳(メタデータ) (2022-07-27T09:26:15Z) - A ground-truth dataset and classification model for detecting bots in
GitHub issue and PR comments [70.1864008701113]
ボットはGithubリポジトリで、分散ソフトウェア開発プロセスの一部である反復的なアクティビティを自動化するために使用されている。
本稿では,5000のGithubアカウントのプルリクエストとコメント発行に関する,高い相互契約を伴う手動分析に基づいて,基幹トラスデータセットを提案する。
ボットを検出する自動分類モデルを提案し,各アカウントの空のコメント数と空でないコメント数,コメントパターンの数,コメントパターン内のコメント間の不平等を主特徴とする。
論文 参考訳(メタデータ) (2020-10-07T09:30:52Z) - Detection of Novel Social Bots by Ensembles of Specialized Classifiers [60.63582690037839]
悪意ある俳優は、社会ボットとして知られるアルゴリズムによって部分的に制御される不正なソーシャルメディアアカウントを作成し、誤情報を広め、オンラインでの議論を扇動する。
異なるタイプのボットが、異なる行動特徴によって特徴づけられることを示す。
本稿では,ボットのクラスごとに専門的な分類器を訓練し,それらの決定を最大ルールで組み合わせる,教師付き学習手法を提案する。
論文 参考訳(メタデータ) (2020-06-11T22:59:59Z) - BeCAPTCHA-Mouse: Synthetic Mouse Trajectories and Improved Bot Detection [78.11535724645702]
本稿では,マウスの神経運動モデルに基づくボット検出器BeCAPTCHA-Mouseを提案する。
BeCAPTCHA-Mouseは、1つのマウス軌道だけで、平均93%の精度で高実在性のボット軌道を検出することができる。
論文 参考訳(メタデータ) (2020-05-02T17:40:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。