論文の概要: Beyond Content: Behavioral Policies Reveal Actors in Information Operations
- arxiv url: http://arxiv.org/abs/2602.02838v1
- Date: Mon, 02 Feb 2026 21:39:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 18:37:15.100526
- Title: Beyond Content: Behavioral Policies Reveal Actors in Information Operations
- Title(参考訳): コンテンツを超えて - 行動政策が情報操作に影響を及ぼす
- Authors: Philipp J. Schneider, Lanqin Yuan, Marian-Andrei Rizoiu,
- Abstract要約: 本稿では、ユーザアクティビティをシーケンシャルな意思決定プロセスとしてモデル化することで、悪意あるアクターを行動ポリシーから識別するプラットフォームに依存しないフレームワークを提案する。
Redditの2017年の透明性レポートでは、ロシアインターネットリサーチエージェンシーにリンクされた99アカウントを含む12,064のRedditユーザに対してこのアプローチを適用しています。
アクティビティベースの表現は、投稿するよりもユーザーの行動をモデル化し、悪意のあるアカウントを検知するコンテンツモデルよりも一貫して優れています。
- 参考スコア(独自算出の注目度): 1.1693100084511296
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The detection of online influence operations -- coordinated campaigns by malicious actors to spread narratives -- has traditionally depended on content analysis or network features. These approaches are increasingly brittle as generative models produce convincing text, platforms restrict access to behavioral data, and actors migrate to less-regulated spaces. We introduce a platform-agnostic framework that identifies malicious actors from their behavioral policies by modeling user activity as sequential decision processes. We apply this approach to 12,064 Reddit users, including 99 accounts linked to the Russian Internet Research Agency in Reddit's 2017 transparency report, analyzing over 38 million activity steps from 2015-2018. Activity-based representations, which model how users act rather than what they post, consistently outperform content models in detecting malicious accounts. When distinguishing trolls -- users engaged in coordinated manipulation -- from ordinary users, policy-based classifiers achieve a median macro-$F_1$ of 94.9%, compared to 91.2% for text embeddings. Policy features also enable earlier detection from short traces and degrade more gracefully under evasion strategies or data corruption. These findings show that behavioral dynamics encode stable, discriminative signals of manipulation and point to resilient, cross-platform detection strategies in the era of synthetic content and limited data access.
- Abstract(参考訳): 悪意あるアクターが物語を広めるためのキャンペーンを調整したオンラインインフルエンス操作の検出は、伝統的にコンテンツ分析やネットワーク機能に依存してきた。
これらのアプローチは、生成モデルが説得力のあるテキストを生成し、プラットフォームは行動データへのアクセスを制限し、アクターは規制の少ないスペースに移行するため、ますます脆弱になっている。
本稿では、ユーザアクティビティをシーケンシャルな意思決定プロセスとしてモデル化することで、悪意あるアクターを行動ポリシーから識別するプラットフォームに依存しないフレームワークを提案する。
このアプローチをRedditの2017年の透明性レポートでロシアインターネット研究機関にリンクされた99アカウントを含む12,064人のRedditユーザに適用し、2015~2018年の3800万以上のアクティビティステップを分析しました。
アクティビティベースの表現は、投稿するよりもユーザーの行動をモデル化し、悪意のあるアカウントを検知するコンテンツモデルよりも一貫して優れています。
トラル(調整された操作を行うユーザ)と一般ユーザを区別する場合、ポリシーベースの分類器は、テキスト埋め込みの91.2%に対して、中央値のマクロであるF_1$の94.9%を達成している。
ポリシー機能は、短いトレースから早期に検出し、回避戦略やデータ破損の下でより優雅に分解することを可能にする。
これらの結果から, 動作力学は, 操作の安定的, 差別的信号を符号化し, 合成コンテンツや限られたデータアクセスの時代において, 弾力的, クロスプラットフォームな検出戦略を示唆している。
関連論文リスト
- RoGBot: Relationship-Oblivious Graph-based Neural Network with Contextual Knowledge for Bot Detection [3.884231159866055]
本稿では,詳細なテキスト機能とユーザメタデータを融合した新しいフレームワークを提案する。
本手法では,つぶやきからの深いセマンティック埋め込みを抽出するために,変換器ベースモデル(BERTなど)を用いる。
Cresci-15、Cresci-17、PAN 2019データセットの実験結果は、我々のアプローチの堅牢性を示している。
論文 参考訳(メタデータ) (2025-10-25T05:14:58Z) - Searching for Privacy Risks in LLM Agents via Simulation [61.229785851581504]
本稿では,プライバシクリティカルなエージェントインタラクションのシミュレーションを通じて,攻撃と防御戦略の改善を交互に行う検索ベースのフレームワークを提案する。
攻撃戦略は、直接の要求から、不正行為や同意偽造といった高度な戦術へとエスカレートする。
発見された攻撃と防御は、さまざまなシナリオやバックボーンモデルにまたがって伝達され、プライバシーに配慮したエージェントを構築するための強力な実用性を示している。
論文 参考訳(メタデータ) (2025-08-14T17:49:09Z) - DATABench: Evaluating Dataset Auditing in Deep Learning from an Adversarial Perspective [70.77570343385928]
内的特徴(IF)と外的特徴(EF)(監査のための技術導入)に依存した既存手法の分類を新たに導入する。
回避攻撃(evasion attack)は、データセットの使用を隠蔽するために設計されたもので、偽造攻撃(forgery attack)は、未使用のデータセットを誤って含んでいることを意図している。
さらに,既存手法の理解と攻撃目標に基づいて,回避のための分離・除去・検出,偽造の逆例に基づく攻撃方法など,系統的な攻撃戦略を提案する。
私たちのベンチマークであるData dataBenchは、17の回避攻撃、5の偽攻撃、9の攻撃で構成されています。
論文 参考訳(メタデータ) (2025-07-08T03:07:15Z) - On the Use of Proxies in Political Ad Targeting [49.61009579554272]
我々は、主要な政治広告主がプロキシ属性をターゲットとして緩和を回避したことを示す。
本研究は政治広告の規制に関する議論に重要な意味を持つ。
論文 参考訳(メタデータ) (2024-10-18T17:15:13Z) - Beyond Trial-and-Error: Predicting User Abandonment After a Moderation Intervention [0.6918368994425961]
現在のコンテンツモデレーションは、リアクティブで試行錯誤的なアプローチに従っている。
我々は、モデレーターが実装前に行動の影響を予測できるように、積極的に予測的なアプローチを導入する。
Reddit上でのオンラインコミュニティの大規模な禁止に対する16,540人のユーザーの反応を調査した。
論文 参考訳(メタデータ) (2024-04-23T08:52:41Z) - SeGA: Preference-Aware Self-Contrastive Learning with Prompts for
Anomalous User Detection on Twitter [14.483830120541894]
本稿では,ユーザの異常検出のための自己コントラスト学習であるSeGAを提案する。
SeGAは、投稿を通じてユーザの好みを要約するために、大きな言語モデルを使用する。
モデル設計と事前学習戦略の有効性を実証的に検証する。
論文 参考訳(メタデータ) (2023-12-17T05:35:28Z) - Relational Graph Neural Networks for Fraud Detection in a Super-App
environment [53.561797148529664]
スーパーアプリケーションの金融サービスにおける不正行為防止のための関係グラフ畳み込みネットワーク手法の枠組みを提案する。
我々は,グラフニューラルネットワークの解釈可能性アルゴリズムを用いて,ユーザの分類タスクに対する最も重要な関係を判定する。
以上の結果から,Super-Appの代替データと高接続性で得られるインタラクションを利用するモデルには,付加価値があることが示唆された。
論文 参考訳(メタデータ) (2021-07-29T00:02:06Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。