論文の概要: Quantifying Feature Importance for Online Content Moderation
- arxiv url: http://arxiv.org/abs/2510.19882v1
- Date: Wed, 22 Oct 2025 14:02:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-25 03:08:16.436577
- Title: Quantifying Feature Importance for Online Content Moderation
- Title(参考訳): オンラインコンテンツモデレーションにおける特徴の重要性の定量化
- Authors: Benedetta Tessa, Alejandro Moreo, Stefano Cresci, Tiziano Fagni, Fabrizio Sebastiani,
- Abstract要約: 16.8Kユーザの行動変化の予測における社会的行動,言語的,リレーショナル,心理的特徴の有意性について検討した。
本研究は,モデレーション介入に対するユーザの反応を予測する精度の高いシステム開発への道を開くものである。
- 参考スコア(独自算出の注目度): 38.70422886875624
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Accurately estimating how users respond to moderation interventions is paramount for developing effective and user-centred moderation strategies. However, this requires a clear understanding of which user characteristics are associated with different behavioural responses, which is the goal of this work. We investigate the informativeness of 753 socio-behavioural, linguistic, relational, and psychological features, in predicting the behavioural changes of 16.8K users affected by a major moderation intervention on Reddit. To reach this goal, we frame the problem in terms of "quantification", a task well-suited to estimating shifts in aggregate user behaviour. We then apply a greedy feature selection strategy with the double goal of (i) identifying the features that are most predictive of changes in user activity, toxicity, and participation diversity, and (ii) estimating their importance. Our results allow identifying a small set of features that are consistently informative across all tasks, and determining that many others are either task-specific or of limited utility altogether. We also find that predictive performance varies according to the task, with changes in activity and toxicity being easier to estimate than changes in diversity. Overall, our results pave the way for the development of accurate systems that predict user reactions to moderation interventions. Furthermore, our findings highlight the complexity of post-moderation user behaviour, and indicate that effective moderation should be tailored not only to user traits but also to the specific objective of the intervention.
- Abstract(参考訳): ユーザがモデレーション介入にどのように反応するかを正確に推定することは、効果的でユーザ中心のモデレーション戦略を開発する上で最重要である。
しかし、これはどのユーザー特性が異なる行動反応と関連しているかを明確に理解する必要がある。
Reddit上での大きなモデレーション介入によって影響を受ける16.8Kユーザの行動変化を予測するために,753の社会的行動,言語的,リレーショナル,心理的特徴の伝達性について検討した。
この目標を達成するために、私たちは、ユーザ行動の集計におけるシフトを推定するのに適したタスクである"量子化"という観点で問題を定式化します。
次に、二重目的の欲求的特徴選択戦略を適用します。
一 利用者活動、毒性及び参加多様性の変化を最も予測できる特徴を特定すること。
(二)その重要性を見積もる。
この結果から,すべてのタスクに対して一貫した情報的機能セットを識別し,タスク固有の機能か,あるいは汎用性に制限のあるものかを判断することが可能になる。
また, 予測性能はタスクによって異なり, 行動の変化や毒性の変化は, 多様性の変化よりも容易に推定できることがわかった。
全体として,本研究の成果は,モデレーション介入に対するユーザの反応を予測する精度の高いシステム開発への道を開くものである。
さらに, 修正後のユーザ行動の複雑さを強調し, 効果的なモデレーションは, ユーザの特性だけでなく, 介入の具体的な目的にも適応すべきであることを示した。
関連論文リスト
- Personalized Reasoning: Just-In-Time Personalization and Why LLMs Fail At It [81.50711040539566]
現在の大規模言語モデル(LLM)開発は、タスク解決と優先順位調整を別の課題として扱う。
静的ベンチマークを対話型パーソナライズタスクに変換する評価手法であるPreFDISCOを紹介する。
我々のフレームワークは、ユーザコンテキストに応じて、同じ質問が異なる推論チェーンを必要とするシナリオを作成します。
論文 参考訳(メタデータ) (2025-09-30T18:55:28Z) - Stochastic Encodings for Active Feature Acquisition [100.47043816019888]
Active Feature Acquisitionは、インスタンスワイドでシーケンシャルな意思決定問題である。
目的は、テストインスタンスごとに独立して、現在の観測に基づいて計測する機能を動的に選択することである。
一般的なアプローチは強化学習(Reinforcement Learning)であり、トレーニングの困難を経験する。
我々は、教師付きで訓練された潜在変数モデルを導入し、潜在空間における観測不能な実現の可能性の多くにまたがる特徴を推論することで獲得する。
論文 参考訳(メタデータ) (2025-08-03T23:48:46Z) - Traits of a Leader: User Influence Level Prediction through Sociolinguistic Modeling [8.890331069484203]
本研究では,人口統計と人格データを活用することで,ベースラインを大幅に上回るモデルを構築した。
このアプローチは、8つの異なるドメインのランクDCGスコアを一貫して改善する。
論文 参考訳(メタデータ) (2025-01-05T22:37:19Z) - Quantifying User Coherence: A Unified Framework for Cross-Domain Recommendation Analysis [69.37718774071793]
本稿では,レコメンデーションシステムを理解するための新しい情報理論手法を提案する。
9つのデータセットで7つのレコメンデーションアルゴリズムを評価し、測定値と標準的なパフォーマンス指標の関係を明らかにする。
論文 参考訳(メタデータ) (2024-10-03T13:02:07Z) - Learning under Imitative Strategic Behavior with Unforeseeable Outcomes [14.80947863438795]
個人と意思決定者間の相互作用をモデル化するStackelbergゲームを提案する。
両者の目的的差異を3つの解釈可能な項に分解できることを示す。
論文 参考訳(メタデータ) (2024-05-03T00:53:58Z) - Beyond Trial-and-Error: Predicting User Abandonment After a Moderation Intervention [0.6918368994425961]
現在のコンテンツモデレーションは、リアクティブで試行錯誤的なアプローチに従っている。
我々は、モデレーターが実装前に行動の影響を予測できるように、積極的に予測的なアプローチを導入する。
Reddit上でのオンラインコミュニティの大規模な禁止に対する16,540人のユーザーの反応を調査した。
論文 参考訳(メタデータ) (2024-04-23T08:52:41Z) - AntEval: Evaluation of Social Interaction Competencies in LLM-Driven
Agents [65.16893197330589]
大規模言語モデル(LLM)は、幅広いシナリオで人間の振る舞いを再現する能力を示した。
しかし、複雑なマルチ文字のソーシャルインタラクションを扱う能力については、まだ完全には研究されていない。
本稿では,新しいインタラクションフレームワークと評価手法を含むマルチエージェントインタラクション評価フレームワーク(AntEval)を紹介する。
論文 参考訳(メタデータ) (2024-01-12T11:18:00Z) - Diagnosis, Feedback, Adaptation: A Human-in-the-Loop Framework for
Test-Time Policy Adaptation [20.266695694005943]
ポリシーは新しい環境にポリシーがデプロイされたときに発生する状態と報酬の変化によって、しばしば失敗する。
データ拡張は、エージェントの観察におけるタスク非関連の変化にモデルを不変にすることで、ロバスト性を高めることができる。
本稿では,ユーザからのフィードバックを直接活用して,タスク関連概念をパーソナライズする対話型フレームワークを提案する。
論文 参考訳(メタデータ) (2023-07-12T17:55:08Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。