論文の概要: A Large-Scale Study of Telegram Bots
- arxiv url: http://arxiv.org/abs/2603.24302v1
- Date: Wed, 25 Mar 2026 13:41:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-26 21:06:11.31233
- Title: A Large-Scale Study of Telegram Bots
- Title(参考訳): テレグラムボットの大規模研究
- Authors: Taro Tsuchiya, Haoxiang Yu, Tina Marjanov, Alice Hutchings, Nicolas Christin, Alejandro Cuevas,
- Abstract要約: 本論文は,Telegramボットを大規模に特徴づけた最初の論文である。
私たちは、最大の汎用メッセージデータセットと、最初のボットデータセットを提供します。
2つのデータセットから雪玉をサンプリングした結果、67,000以上のチャネル、492万のメッセージ、32,000のボットが見つかった。
- 参考スコア(独自算出の注目度): 45.23191648999898
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Telegram, initially a messaging app, has evolved into a platform where users can interact with various services through programmable applications, bots. Bots provide a wide range of uses, from moderating groups, helping with online shopping, to even executing trades in financial markets. However, Telegram has been increasingly associated with various illicit activities -- financial scams, stolen data, non-consensual image sharing, among others, raising concerns bots may be facilitating these operations. This paper is the first to characterize Telegram bots at scale, through the following contributions. First, we offer the largest general-purpose message dataset and the first bot dataset. Through snowball sampling from two published datasets, we uncover over 67,000 additional channels, 492 million messages, and 32,000 bots. Second, we develop a system to automatically interact with bots in order to extract their functionality. Third, based on their description, chat responses, and the associated channels, we classify bots into several domains. Fourth, we investigate the communities each bot serves, by analyzing supported languages, usage patterns (e.g., duration, reuse), and network topology. While our analysis discovers useful applications such as crowdsourcing, we also identify malicious bots (e.g., used for financial scams, illicit underground services) serving as payment gateways, referral systems, and malicious AI endpoints. By exhorting the research community to look at bots as software infrastructure, this work hopes to foster further research useful to content moderators, and to help interventions against illicit activities.
- Abstract(参考訳): 当初メッセージングアプリだったTelegramは,プログラム可能なアプリケーションやボットを通じて,さまざまなサービスと対話可能なプラットフォームへと進化した。
ボットは、グループの調整、オンラインショッピングの支援、金融市場での取引の実行まで、幅広い用途を提供している。
しかし、Telegramは、金融詐欺、盗難データ、合意外の画像共有など、さまざまな不正行為と結びついており、ボットがこれらの操作を円滑にしているのではないかと懸念している。
本論文は,Telegramボットを大規模に特徴づけた最初の論文である。
まず、最大の汎用メッセージデータセットと、最初のボットデータセットを提供します。
2つのデータセットから雪玉をサンプリングした結果、67,000以上のチャネル、492万のメッセージ、32,000のボットが見つかった。
第2に,ボットの機能を抽出するために,ボットと自動的に対話するシステムを開発する。
第3に、ボットの説明、チャット応答、および関連するチャネルに基づいて、ボットを複数のドメインに分類する。
第4に、サポート言語、使用パターン(例えば、期間、再利用)、ネットワークトポロジを解析し、各ボットが提供するコミュニティについて検討する。
クラウドソーシングなどの有用な応用を見出す一方で、支払いゲートウェイやレファレンスシステム、悪意のあるAIエンドポイントとして機能する悪意のあるボット(例えば、金融詐欺や不正な地下サービス)を識別する。
この研究は、研究コミュニティにボットをソフトウェア基盤と見なすことを奨励することで、コンテンツモデレーターにとって有用なさらなる研究を促進し、不正な活動に対する介入を支援することを目指している。
関連論文リスト
- RoBCtrl: Attacking GNN-Based Social Bot Detectors via Reinforced Manipulation of Bots Control Interaction [51.46634975923564]
本稿では,ソーシャルボット制御攻撃(RoBCtrl)のための対向型マルチエージェント強化学習フレームワークを提案する。
具体的には、拡散モデルを用いて、既存のアカウントデータを小さな修正で再構築することで、高忠実度ボットアカウントを生成する。
次に,MARL(Multi-Agent Reinforcement Learning)法を用いて,ボットの逆動作をシミュレートする。
論文 参考訳(メタデータ) (2025-10-16T02:41:49Z) - On the efficacy of old features for the detection of new bots [0.4506099292980221]
我々は、Twitterをベンチマークとして、新しいボットを検出する4つの最先端機能セットのパフォーマンスを比較した。
この結果は、進化したボットを検知するために汎用分類器と低コストで計算可能な会計機能を使用できることを示唆している。
論文 参考訳(メタデータ) (2025-06-24T13:56:09Z) - Entendre, a Social Bot Detection Tool for Niche, Fringe, and Extreme Social Media [1.4913052010438639]
オープンアクセス、スケーラブル、プラットフォームに依存しないボット検出フレームワークであるEntendreを紹介した。
われわれは、ほとんどのソーシャルプラットフォームが一般的なテンプレートを共有しており、ユーザーはコンテンツを投稿し、コンテンツを承認し、バイオを提供することができるという考えを生かしている。
Entendreの有効性を示すために、私たちは、現在定義されている右翼プラットフォームであるParlerに人種差別的コンテンツを投稿するアカウントの中で、ボットの存在を調査するために使用しました。
論文 参考訳(メタデータ) (2024-08-13T13:50:49Z) - BotArtist: Generic approach for bot detection in Twitter via semi-automatic machine learning pipeline [47.61306219245444]
Twitterは、ボットや偽アカウントのターゲットとなり、偽情報や操作の拡散につながった。
本稿では,機械学習モデル開発に関わる課題に対処するために,セミオートマチック機械学習パイプライン(SAMLP)を提案する。
ユーザプロファイル機能に基づいたボット検出モデルBotArtistを開発した。
論文 参考訳(メタデータ) (2023-05-31T09:12:35Z) - Bot or Human? Detecting ChatGPT Imposters with A Single Question [29.231261118782925]
大規模言語モデル(LLM)は、最近、自然言語の理解と生成において印象的な能力を示した。
不正行為やサービス拒否攻撃など、悪意のある目的のために悪用される可能性があるという懸念がある。
単一問合せと応答による大規模言語モデル認証をオンラインで検出するFLAIRというフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-10T19:09:24Z) - Neural Generation Meets Real People: Building a Social, Informative
Open-Domain Dialogue Agent [65.68144111226626]
Chirpy Cardinalは、情報と会話の両方をねらっている。
ユーザーとボットの両方を交互に会話に駆り立てる。
Chirpy Cardinalは、Alexa Prize Socialbot Grand Challengeで9つのボットのうち2位にランクインした。
論文 参考訳(メタデータ) (2022-07-25T09:57:23Z) - Identification of Twitter Bots based on an Explainable ML Framework: the
US 2020 Elections Case Study [72.61531092316092]
本稿では,ラベル付きTwitterデータに基づくTwitterボット識別システムの設計に焦点をあてる。
Supervised Machine Learning (ML)フレームワークは、Extreme Gradient Boosting (XGBoost)アルゴリズムを用いて採用されている。
また、MLモデルの予測を説明するためにShapley Additive Explanations (SHAP)をデプロイした。
論文 参考訳(メタデータ) (2021-12-08T14:12:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。