論文の概要: Adversarial Creation and Detection of AI-Generated Social Bot Content
- arxiv url: http://arxiv.org/abs/2606.07219v1
- Date: Fri, 05 Jun 2026 12:32:47 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.736997
- Title: Adversarial Creation and Detection of AI-Generated Social Bot Content
- Title(参考訳): AI生成型ソーシャルボットコンテンツの作成と検出
- Authors: Mykola Trokhymovych, Ricardo Baeza-Yates, Alessandro Flammini, Diego Saez-Trumper, Filippo Menczer,
- Abstract要約: 既存のAI生成コンテンツ検出モデルは、主に地上データがないために、荒野で失敗することが多い。
我々は、悪質なアクターによる実際のソーシャルメディアユーザーの偽装をモデル化する敵対的手法を通じて、このギャップに対処する。
提案手法は,実世界のアウト・オブ・ディストリビューションデータにおいて,コンテンツに基づくボット検出のための既存のモデルよりも大幅に優れている。
- 参考スコア(独自算出の注目度): 48.21614389337061
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: The convergence of large language models and social bots allows malicious actors to manipulate the information ecosystem by generating human-like content at scale. Existing models for detecting AI-generated content often fail in the wild, primarily due to the lack of ground-truth data. We address this gap through an adversarial methodology that models the impersonation of real social media users by malicious actors. Using this methodology, we curate a multilingual, cross-platform dataset of paired human and AI-generated messages. Training on such adversarial data yields accurate detection of AI-generated text. Our approach significantly outperforms existing models for content-based bot detection in real-world, out-of-distribution data.
- Abstract(参考訳): 大規模言語モデルとソーシャルボットの収束により、悪意あるアクターは、大規模に人間のようなコンテンツを生成することによって、情報エコシステムを操作できる。
既存のAI生成コンテンツ検出モデルは、主に地上データがないために、荒野で失敗することが多い。
我々は、悪質なアクターによる実際のソーシャルメディアユーザーの偽装をモデル化する敵対的手法を通じて、このギャップに対処する。
この手法を用いて、人間とAIが生成したメッセージの多言語でクロスプラットフォームなデータセットをキュレートする。
このような敵対的データのトレーニングは、AI生成したテキストを正確に検出する。
提案手法は,実世界のアウト・オブ・ディストリビューションデータにおいて,コンテンツに基づくボット検出のための既存のモデルよりも大幅に優れている。
関連論文リスト
- FedRio: Personalized Federated Social Bot Detection via Cooperative Reinforced Contrastive Adversarial Distillation [52.56850762009136]
ソーシャルボットの検出は、オンラインソーシャルプラットフォームの安定性とセキュリティに不可欠である。
現在の最先端のボット検出モデルは、主に独立して開発されている。
クロスプラットフォームおよびクロスモデル検出フレームワークとしてFedRioを提案する。
論文 参考訳(メタデータ) (2026-04-12T15:13:41Z) - TRACE-Bot: Detecting Emerging LLM-Driven Social Bots via Implicit Semantic Representations and AIGC-Enhanced Behavioral Patterns [7.648264389927362]
大規模言語モデル駆動型(LLM駆動)ソーシャルボットは、オンライン談話にますます脅威をもたらす。
既存の手法では、単一モード信号の過度な信頼性によって検出精度が制限されている。
暗黙的な意味表現とAIGC強化された行動パターンを共同でモデル化する統合されたデュアルチャネルフレームワークであるTRACE-Botを提案する。
論文 参考訳(メタデータ) (2026-04-02T15:16:14Z) - ChatGpt Content detection: A new approach using xlm-roberta alignment [0.0]
本稿では,最先端多言語変換モデルであるXLM-RoBERTaを用いて,AI生成テキストを検出するための包括的手法を提案する。
我々は、人間とAIが生成したテキストのバランスのとれたデータセット上でモデルを微調整し、その性能を評価した。
我々の発見は、学術的完全性を維持するための貴重なツールを提供し、AI倫理の幅広い分野に貢献する。
論文 参考訳(メタデータ) (2025-11-26T03:16:57Z) - RoBCtrl: Attacking GNN-Based Social Bot Detectors via Reinforced Manipulation of Bots Control Interaction [51.46634975923564]
本稿では,ソーシャルボット制御攻撃(RoBCtrl)のための対向型マルチエージェント強化学習フレームワークを提案する。
具体的には、拡散モデルを用いて、既存のアカウントデータを小さな修正で再構築することで、高忠実度ボットアカウントを生成する。
次に,MARL(Multi-Agent Reinforcement Learning)法を用いて,ボットの逆動作をシミュレートする。
論文 参考訳(メタデータ) (2025-10-16T02:41:49Z) - Human Texts Are Outliers: Detecting LLM-generated Texts via Out-of-distribution Detection [71.59834293521074]
我々は,人間によるテキストと機械によるテキストを区別する枠組みを開発した。
提案手法は,DeepFakeデータセット上で98.3%のAUROCとAUPRを8.9%のFPR95で達成する。
コード、事前トレーニングされたウェイト、デモがリリースされる。
論文 参考訳(メタデータ) (2025-10-07T08:14:45Z) - BotTrans: A Multi-Source Graph Domain Adaptation Approach for Social Bot Detection [55.31623652907614]
ソーシャルボットを検出するために,textitBotTrans というマルチソースグラフドメイン適応モデルを提案する。
まず、複数のソースネットワーク間で共有されるラベル付けの知識を活用して、クロスソースドメイントポロジを確立します。
次に、ソースノード埋め込みの識別性を高めるために、クロスドメイン隣の情報を集約する。
論文 参考訳(メタデータ) (2025-06-12T02:10:36Z) - When Detection Fails: The Power of Fine-Tuned Models to Generate Human-Like Social Media Text [13.14749943120523]
ソーシャルメディアは、オンライン・インフルエンス・キャンペーンにおいて重要な攻撃源となっている。
我々は、オープンソース、クローズドソース、微調整されたLLMの組み合わせから、505,159のAI生成ソーシャルメディアポストのデータセットを作成します。
典型的な研究仮定の下ではポストを検出できるが、攻撃者が細調整されたモデルを公開しないというより現実的な仮定の下では、検出可能性は劇的に低下する。
論文 参考訳(メタデータ) (2025-06-11T17:51:28Z) - Almost AI, Almost Human: The Challenge of Detecting AI-Polished Writing [55.2480439325792]
本研究では、AI-Polished-Text Evaluationデータセットを用いて、12の最先端AIテキスト検出器を体系的に評価する。
我々の発見によると、検出器は、最小限に洗練されたテキストをAI生成としてフラグ付けし、AIの関与度を区別し、古いモデルや小さなモデルに対するバイアスを示す。
論文 参考訳(メタデータ) (2025-02-21T18:45:37Z) - Who Said That? Benchmarking Social Media AI Detection [12.862865254507177]
本稿では、実ソーシャルメディアプラットフォームにおけるAIテキスト検出モデルの能力を評価するために開発された新しいベンチマークであるSAID(Social media AI Detection)を紹介する。
ZhihuやQuoraといった人気のソーシャルメディアプラットフォームから、AI生成テキストが組み込まれている。
Zhihuデータセットに基づく我々の研究の注目すべき発見は、アノテータがAI生成テキストと人間生成テキストを96.5%の平均精度で区別できることを示している。
論文 参考訳(メタデータ) (2023-10-12T11:35:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。