論文の概要: Who, Why, and How: Disentangling the Effects of Moderation Source, Context, and Language on Post-Removal Behavior
- arxiv url: http://arxiv.org/abs/2605.16204v1
- Date: Fri, 15 May 2026 17:21:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-18 21:22:26.388178
- Title: Who, Why, and How: Disentangling the Effects of Moderation Source, Context, and Language on Post-Removal Behavior
- Title(参考訳): 誰が、なぜ、どのようにして、モデレーション源、文脈、言語の影響を遠ざけるか
- Authors: Siyi Zhou, Lindsay Young, Marlon Twyman, Emilio Ferrara,
- Abstract要約: 本研究は,Redditにおけるモデレーターソース,違反コンテキスト,言語スタイルがユーザ行動とどのように連携するかを考察する。
ボット・モデレーションは、人間やモデム・モデレーションよりもコンプライアンスが高く、自己検閲も低いことが分かりました。
Modteamモデレーションは最強の自己検閲効果を生み出し、制度的な非人格化が行動退行の意義ある要因であることを示唆している。
- 参考スコア(独自算出の注目度): 6.6219178799592155
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Content moderation is a central mechanism through which platforms attempt to balance user engagement with community governance. Yet existing research has largely treated moderation as a uniform intervention, overlooking how moderator source, violation context, and linguistic style jointly shape user behavior. Drawing on the Human--AI Interaction Theory of Interactive Media Effects (HAII-TIME), this study examines how these three dimensions produce divergent post-moderation behavioral trajectories in a large-scale observational dataset of 11,795,036 moderation events across 9,285,410 users and 61,261 subreddits on Reddit (2021--2025). Using probabilistic behavioral classification, ANOVA, and OLS regression with PCA-derived linguistic features, we find that bot moderation consistently produces higher compliance and lower self-censorship than human or modteam moderation, challenging the assumption that human agency cues are inherently advantageous. Modteam moderation produces the strongest self-censorship effects, suggesting that institutional depersonalization is a meaningful driver of behavioral withdrawal. Violation severity emerges as a critical contingency: linguistic strategies effective in routine contexts -- elaborated explanation, community-scale appeals, direct personal address -- can backfire for serious violations, whereas prosocially framed and emotionally emphatic messages become most effective when stakes are highest. Of 480 linguistic interactions tested, 33 survive FDR correction. These findings extend HAII-TIME by introducing violation salience as a moderator of cue-based processing, and offer empirical grounding for context-adaptive moderation design.
- Abstract(参考訳): コンテンツモデレーションは、プラットフォームがユーザエンゲージメントとコミュニティガバナンスのバランスをとるための中心的なメカニズムです。
しかし、既存の研究は、モデレーターのソース、違反状況、言語スタイルがユーザ動作を協調的に形作る方法を見越して、モデレーションを一様的介入として扱ってきた。
対話型メディアエフェクトの人間-AIインタラクション理論(HAII-TIME)に基づいて,これらの3次元が,Reddit上での11,795,036件のモデレーションイベント,9,285,410件,61,261件のサブレディット(2021-2025件)を大規模観測データセットで生成する方法について検討した(2021-2025)。
確率的行動分類, ANOVA, OLSレグレッションをPCA由来の言語特徴と組み合わせることで, ボット・モデレーションは人間やモデム・モデレーションよりも順応性が高く, 自己検閲性が低いことが判明した。
Modteamモデレーションは最強の自己検閲効果を生み出し、制度的な非人格化が行動退行の意義ある要因であることを示唆している。
日常的な文脈で有効な言語戦略 -- 精巧な説明、コミュニティスケールのアピール、直接の個人的な住所 -- は深刻な違反に対してバックファイアを起こす可能性があるが、社会的にフレーム化され、感情的に強調されるメッセージは、利害が高ければ最も効果的になる。
480の言語相互作用がテストされ、33のFDR補正が生存した。
これらの知見は, 文脈適応型モデレーション設計のための経験的基盤を提供するキューベース処理のモデレーターとして, 違反サリエンスを導入することで, HAII-TIMEを拡張した。
関連論文リスト
- Taming Actor-Observer Asymmetry in Agents via Dialectical Alignment [59.536125286960186]
セルフリフレクションと相互監査を可能にするために、専門的な役割を割り当てるマルチエージェントフレームワークがますます採用されている。
アクター・オブザーバ非対称性(Actor-Observer Asymmetric)と呼ばれる認知バイアスを同時に誘発する。
ReTASは、対立する視点を客観的なコンセンサスに合成するためにエージェントを誘導する。
論文 参考訳(メタデータ) (2026-04-21T15:05:58Z) - Emergent decentralized regulation in a purely synthetic society [6.396911723204044]
エージェントのみのソーシャルネットワークであるMoltbook上でOpenClawエージェントを研究する。
我々は指向性インテンシティ(DI)を用いた行動誘発言語を定量化する
高いDIの投稿は高い正答率を示すことが判明した。
論文 参考訳(メタデータ) (2026-03-13T01:55:22Z) - Towards Highly Transferable Vision-Language Attack via Semantic-Augmented Dynamic Contrastive Interaction [67.45032003041399]
本研究では,先進的かつ意味論的に誘導された摂動を通じて対向的伝達性を高めるセマンティック・ダイナミック・コントラシブ・アタック(SADCA)を提案する。
SADCAは、対立、正、負のサンプルを含む対照的な学習メカニズムを確立し、得られた摂動の意味的不整合を強化する。
複数のデータセットとモデルの実験により、SADCAは対向移動性を大幅に改善し、最先端の手法を一貫して超えることを示した。
論文 参考訳(メタデータ) (2026-03-05T05:46:16Z) - Beyond Trial-and-Error: Predicting User Abandonment After a Moderation Intervention [0.6918368994425961]
現在のコンテンツモデレーションは、リアクティブで試行錯誤的なアプローチに従っている。
我々は、モデレーターが実装前に行動の影響を予測できるように、積極的に予測的なアプローチを導入する。
Reddit上でのオンラインコミュニティの大規模な禁止に対する16,540人のユーザーの反応を調査した。
論文 参考訳(メタデータ) (2024-04-23T08:52:41Z) - Can Language Model Moderators Improve the Health of Online Discourse? [26.191337231826246]
我々は,モデレーション文献に基づく会話モデレーションの有効性の体系的定義を確立する。
本研究では,人間の介入とは無関係にモデルのモデレーション能力を評価するための総合的な評価フレームワークを提案する。
論文 参考訳(メタデータ) (2023-11-16T11:14:22Z) - Decoding Susceptibility: Modeling Misbelief to Misinformation Through a Computational Approach [61.04606493712002]
誤報に対する感受性は、観測不可能な不検証の主張に対する信念の度合いを記述している。
既存の感受性研究は、自己報告された信念に大きく依存している。
本稿では,ユーザの潜在感受性レベルをモデル化するための計算手法を提案する。
論文 参考訳(メタデータ) (2023-11-16T07:22:56Z) - Aligning to Social Norms and Values in Interactive Narratives [89.82264844526333]
我々は、インタラクティブな物語やテキストベースのゲームにおいて、社会的に有益な規範や価値観に沿って行動するエージェントを作成することに注力する。
我々は、特別な訓練を受けた言語モデルに存在する社会的コモンセンス知識を用いて、社会的に有益な値に整合した行動にのみ、その行動空間を文脈的に制限するGAALADエージェントを紹介した。
論文 参考訳(メタデータ) (2022-05-04T09:54:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。