論文の概要: More Than Sum of Its Parts: Deciphering Intent Shifts in Multimodal Hate Speech Detection
- arxiv url: http://arxiv.org/abs/2603.21298v1
- Date: Sun, 22 Mar 2026 15:46:23 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-24 19:11:39.340452
- Title: More Than Sum of Its Parts: Deciphering Intent Shifts in Multimodal Hate Speech Detection
- Title(参考訳): パートの総和以上:マルチモーダルヘイト音声検出におけるインテントシフトの解読
- Authors: Runze Sun, Yu Zheng, Zexuan Xiong, Zhongjin Qu, Lei Chen, Jiwen Lu, Jie Zhou,
- Abstract要約: ソーシャルメディア上でのヘイトスピーチは、サイバースペースの確保には不可欠だが、自動検出システムに大きく依存している。
我々は、モダリティが相互作用する意味的意図変化を特徴付け、良心的憎悪から暗黙的憎悪を構築するか、意味的逆転を通じて毒性を中和する。
本稿では,これらの複雑な手がかりを効果的に解読するために,裁判所エージェントによる非対称推論(Asymmetric Reasoning)フレームワークを提案する。
- 参考スコア(独自算出の注目度): 49.07221734365168
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Combating hate speech on social media is critical for securing cyberspace, yet relies heavily on the efficacy of automated detection systems. As content formats evolve, hate speech is transitioning from solely plain text to complex multimodal expressions, making implicit attacks harder to spot. Current systems, however, often falter on these subtle cases, as they struggle with multimodal content where the emergent meaning transcends the aggregation of individual modalities. To bridge this gap, we move beyond binary classification to characterize semantic intent shifts where modalities interact to construct implicit hate from benign cues or neutralize toxicity through semantic inversion. Guided by this fine-grained formulation, we curate the Hate via Vision-Language Interplay (H-VLI) benchmark where the true intent hinges on the intricate interplay of modalities rather than overt visual or textual slurs. To effectively decipher these complex cues, we further propose the Asymmetric Reasoning via Courtroom Agent DEbate (ARCADE) framework. By simulating a judicial process where agents actively argue for accusation and defense, ARCADE forces the model to scrutinize deep semantic cues before reaching a verdict. Extensive experiments demonstrate that ARCADE significantly outperforms state-of-the-art baselines on H-VLI, particularly for challenging implicit cases, while maintaining competitive performance on established benchmarks. Our code and data are available at: https://github.com/Sayur1n/H-VLI
- Abstract(参考訳): ソーシャルメディア上でヘイトスピーチを議論することは、サイバースペースを確保する上で重要であるが、自動検知システムの有効性に大きく依存している。
コンテンツフォーマットが進化するにつれて、ヘイトスピーチは単なる平易なテキストから複雑なマルチモーダル表現へと移行し、暗黙の攻撃を見つけるのが難しくなっている。
しかしながら、現在のシステムはしばしば、個々のモダリティの集合を超越する創発的意味を持つマルチモーダルコンテンツに苦しむため、これらの微妙なケースに干渉する。
このギャップを埋めるために、我々は二項分類を超えて、モダリティが相互作用し、良心からの暗黙の憎悪を構築したり、意味の逆転を通じて毒性を中和する意味意図シフトを特徴づける。
この微細な定式化によって導かれたHateは、視覚やテキストのスラーではなく、モダリティの複雑なインタープレイに真の意図が掛かるH-VLI(Vision-Language Interplay)ベンチマークによってキュレートされる。
さらに,これらの複雑な手がかりを効果的に解読するために,Courtroom Agent Debate (ARCADE) フレームワークによる非対称推論を提案する。
エージェントが非難と防衛を積極的に主張する司法手続きをシミュレートすることで、ARCADEはモデルに判決に達する前に深い意味を精査するよう強制する。
大規模な実験により、ARCADEはH-VLIの最先端のベースライン、特に暗黙のケースにおいて、確立したベンチマーク上での競合性能を維持しながら、大幅に性能が向上することが示された。
私たちのコードとデータは、https://github.com/Sayur1n/H-VLIで利用可能です。
関連論文リスト
- Towards Highly Transferable Vision-Language Attack via Semantic-Augmented Dynamic Contrastive Interaction [67.45032003041399]
本研究では,先進的かつ意味論的に誘導された摂動を通じて対向的伝達性を高めるセマンティック・ダイナミック・コントラシブ・アタック(SADCA)を提案する。
SADCAは、対立、正、負のサンプルを含む対照的な学習メカニズムを確立し、得られた摂動の意味的不整合を強化する。
複数のデータセットとモデルの実験により、SADCAは対向移動性を大幅に改善し、最先端の手法を一貫して超えることを示した。
論文 参考訳(メタデータ) (2026-03-05T05:46:16Z) - TANDEM: Temporal-Aware Neural Detection for Multimodal Hate Speech [11.020614074201346]
本稿では,音声・視覚的ヘイト検出を構造化推論問題に変換する統合フレームワークであるTANDEMを紹介する。
提案手法では,視覚言語モデルと音声言語モデルが相互に最適化される,新しいタンデム強化学習戦略を採用している。
TANDEM はゼロショットとコンテキスト拡張ベースラインを大きく上回り、HateMM のターゲット識別において 0.73 F1 を達成している。
論文 参考訳(メタデータ) (2026-01-16T10:52:12Z) - DIVER: Dynamic Iterative Visual Evidence Reasoning for Multimodal Fake News Detection [6.225860651499494]
多モーダル偽ニュース検出は、敵対的誤報の軽減に不可欠である。
進化的,エビデンス駆動推論パラダイムに基づくフレームワークであるDIVER(Dynamic Iterative Visual Evidence Reasoning)を提案する。
Weibo、Weibo21、GossipCopの実験では、DIVERは最先端のベースラインを平均2.72%上回っている。
論文 参考訳(メタデータ) (2026-01-12T04:01:33Z) - Explaining multimodal LLMs via intra-modal token interactions [55.27436637894534]
MLLM(Multimodal Large Language Models)は、様々な視覚言語タスクにおいて顕著な成功を収めているが、その内部決定機構は十分に理解されていない。
モーダル内相互作用を利用した解釈可能性の向上を提案する。
論文 参考訳(メタデータ) (2025-09-26T14:39:13Z) - PromptSleuth: Detecting Prompt Injection via Semantic Intent Invariance [10.105673138616483]
大規模言語モデル(LLM)は、仮想アシスタントから自律エージェントに至るまで、現実のアプリケーションにますます統合されている。
攻撃者がパラフレーズ、難読化、マルチタスクのインジェクション戦略で進化するにつれて、既存のベンチマークは、出現する脅威の全スペクトルを捉えるのに十分ではない。
PromptSleuthは,表面的特徴ではなくタスクレベルの意図を推論することで,迅速なインジェクションを検出するセマンティック指向の防衛フレームワークである。
論文 参考訳(メタデータ) (2025-08-28T15:19:07Z) - Cross-Platform Hate Speech Detection with Weakly Supervised Causal Disentanglement [14.437386966111719]
本研究は、弱教師付き因果解離の新しい枠組みであるHATE WATCHを提示する。
明示的なターゲットラベリングの必要性を回避し、入力された特徴をヘイト(ヘイト)の不変表現に効果的に切り離す。
HATE WATCHは、高性能なプラットフォーム間ヘイトスピーチ検出における新しい手法として、ターゲットラベル付きプラットフォーム2と非位置対応プラットフォーム2の実証検証を行った。
論文 参考訳(メタデータ) (2024-04-17T03:25:54Z) - Few-Shot Adversarial Prompt Learning on Vision-Language Models [62.50622628004134]
知覚不能な逆境摂動に対するディープニューラルネットワークの脆弱性は、広く注目を集めている。
それまでの努力は、相手の視覚的特徴をテキストの監督と整合させることで、ゼロショットの敵の堅牢性を達成した。
本稿では、限られたデータで入力シーケンスを適応させることで、対向性を大幅に向上させる、数ショットの対向的プロンプトフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-21T18:28:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。