論文の概要: MemeScouts@LT-EDI 2026: Asking the Right Questions -- Prompted Weak Supervision for Meme Hate Speech Detection
- arxiv url: http://arxiv.org/abs/2604.24179v2
- Date: Tue, 28 Apr 2026 15:12:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 14:06:43.844596
- Title: MemeScouts@LT-EDI 2026: Asking the Right Questions -- Prompted Weak Supervision for Meme Hate Speech Detection
- Title(参考訳): MemeScouts@LT-EDI 2026: Aking the Right Questions -- Prompted Weak Supervision for Meme Hate Speech Detection
- Authors: Ivo Bueno, Lea Hirlimann, Enkelejda Kasneci,
- Abstract要約: 本稿では,主観的質問に基づくラベリング機能にミーム理解を分解する弱い監督(PWS)手法を提案する。
量子化されたQwen3-VLMを用いて,対象とする質問に答えて特徴を抽出し,本手法は直接VLM分類よりも優れる。
本研究は,多言語マルチモーダルヘイトスピーチ検出における弱監視の効果を浮き彫りにした。
- 参考スコア(独自算出の注目度): 11.764894232169153
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detecting hate speech in memes is challenging due to their multimodal nature and subtle, culturally grounded cues such as sarcasm and context. While recent vision-language models (VLMs) enable joint reasoning over text and images, end-to-end prompting can be brittle, as a single prediction must resolve target, stance, implicitness, and irony. These challenges are amplified in multilingual settings. We propose a prompted weak supervision (PWS) approach that decomposes meme understanding into targeted, question-based labeling functions with constrained answer options for homophobia and transphobia detection in the LT-EDI 2026 shared task. Using a quantized Qwen3-VLM to extract features by answering targeted questions, our method outperforms direct VLM classification, with substantial gains for Chinese and Hindi, ranking 1st in English, 2nd in Chinese, and 3rd in Hindi. Iterative refinement via error-driven LF expansion and feature pruning reduces redundancy and improves generalization. Our results highlight the effectiveness of prompted weak supervision for multilingual multimodal hate speech detection.
- Abstract(参考訳): ミームにおけるヘイトスピーチの検出は、そのマルチモーダルな性質と、サルカズムや文脈のような微妙で文化的に根ざした手がかりによって困難である。
近年の視覚言語モデル(VLM)は、テキストや画像に対する共同推論を可能にするが、単一の予測が目標、姿勢、暗黙、皮肉を解決しなければならないため、エンドツーエンドのプロンプトは不安定である。
これらの課題は多言語設定で増幅される。
LT-EDI 2026共有タスクにおいて、ホモフォビアおよびトランスフォビア検出のための制限された解答オプションを持つ、目的の質問ベースのラベリング関数へのミーム理解を分解する弱い監視(PWS)手法を提案する。
本手法は,Qwen3-VLMを定量化して,対象とする質問に答えて特徴を抽出する手法であり,中国語とヒンディー語では高い成績を示し,英語では第1位,中国語では第2位,ヒンディー語では第3位となった。
誤り駆動型LF拡張と機能プルーニングによる反復的改善は冗長性を低減し、一般化を改善する。
本研究は,多言語マルチモーダルヘイトスピーチ検出における弱監視の効果を浮き彫りにした。
関連論文リスト
- Explain the Flag: Contextualizing Hate Speech Beyond Censorship [2.796818629124347]
本稿では,Large Language Models(LLMs)と新たに作成された3つの語彙を組み合わせたハイブリッドアプローチを提案する。
本システムでは,2つの相補的なパイプラインを通して,個人特性と直接グループ目標コンテンツに関連付けられた弁解表現を抽出する。
アウトプットは、なぜコンテンツがフラグ付けされているのかを明確にする根拠付きの説明に融合される。
論文 参考訳(メタデータ) (2026-04-16T13:06:28Z) - More Than Sum of Its Parts: Deciphering Intent Shifts in Multimodal Hate Speech Detection [49.07221734365168]
ソーシャルメディア上でのヘイトスピーチは、サイバースペースの確保には不可欠だが、自動検出システムに大きく依存している。
我々は、モダリティが相互作用する意味的意図変化を特徴付け、良心的憎悪から暗黙的憎悪を構築するか、意味的逆転を通じて毒性を中和する。
本稿では,これらの複雑な手がかりを効果的に解読するために,裁判所エージェントによる非対称推論(Asymmetric Reasoning)フレームワークを提案する。
論文 参考訳(メタデータ) (2026-03-22T15:46:23Z) - Fine-Grained Chinese Hate Speech Understanding: Span-Level Resources, Coded Term Lexicon, and Enhanced Detection Frameworks [13.187315629074428]
Span-level Target-Aware Toxicity extract dataset (STATE ToxiCN)を導入する。
我々は、中国語のコード化されたヘイト用語、LLMのヘイトセマンティクスを解釈する能力について、初めて包括的な研究を行った。
本稿では,注釈付き辞書をモデルに統合し,ヘイトスピーチ検出性能を大幅に向上させる手法を提案する。
論文 参考訳(メタデータ) (2025-07-15T13:19:18Z) - Leveraging the Potential of Prompt Engineering for Hate Speech Detection in Low-Resource Languages [2.8811725782388686]
本稿では,低リソースベンガル言語に着目した大規模言語モデル (LLM) の迅速なエンジニアリングにより,その限界を克服する方法について検討する。
我々は、ゼロショットプロンプト、拒絶抑制、分類器のフラット化、マルチショットプロンプト、ロールプロンプト、そして最後に、低リソース言語でヘイトスピーチを効果的に検出する革新的なメタファーの6つのプロンプトについて検討する。
低リソースのベンガル語におけるメタファーの有効性を証明するため、別の低リソースのヒンディー語と2つの高リソースの言語(英語とドイツ語)で評価した。
論文 参考訳(メタデータ) (2025-06-30T14:59:25Z) - Can Prompting LLMs Unlock Hate Speech Detection across Languages? A Zero-shot and Few-shot Study [59.30098850050971]
この研究は、8つの非英語言語にわたるLLMのプロンプトに基づく検出を評価する。
実世界の評価セットのほとんどにおいて、ゼロショットと少数ショットが微調整エンコーダモデルに遅れを生じさせる一方で、ヘイトスピーチ検出のための関数的テストのより優れた一般化を実現していることを示す。
論文 参考訳(メタデータ) (2025-05-09T16:00:01Z) - Delving Deeper into Cross-lingual Visual Question Answering [115.16614806717341]
標準学習装置に簡単な修正を加えることで、モノリンガル英語のパフォーマンスへの移行ギャップを大幅に減らすことができることを示す。
多言語マルチモーダル変換器の多言語間VQAを多言語間VQAで解析する。
論文 参考訳(メタデータ) (2022-02-15T18:22:18Z) - Leveraging Transformers for Hate Speech Detection in Conversational
Code-Mixed Tweets [36.29939722039909]
本稿では,HASOC 2021サブタスク2のためのMIDAS-IIITDチームによって提案されたシステムについて述べる。
これは、Hindi- Englishのコードミキシングされた会話からヘイトスピーチを検出することに焦点を当てた最初の共有タスクの1つである。
Indic-BERT,XLM-RoBERTa,Multilingual BERTのハード投票アンサンブルがマクロF1スコア0.7253を達成した。
論文 参考訳(メタデータ) (2021-12-18T19:27:33Z) - Cross-lingual hate speech detection based on multilingual
domain-specific word embeddings [4.769747792846004]
トランスファーラーニングの視点から多言語のヘイトスピーチ検出の課題に取り組むことを提案する。
私たちの目標は、ある特定の言語の知識が他の言語の分類に使用できるかどうかを判断することです。
単純かつ特定された多言語ヘイト表現を用いることで分類結果が向上することを示す。
論文 参考訳(メタデータ) (2021-04-30T02:24:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。