Fugu-MT 論文翻訳(概要): Beyond Hate: Differentiating Uncivil and Intolerant Speech in Multimodal Content Moderation

論文の概要: Beyond Hate: Differentiating Uncivil and Intolerant Speech in Multimodal Content Moderation

arxiv url: http://arxiv.org/abs/2603.22985v1
Date: Tue, 24 Mar 2026 09:22:36 GMT
ステータス: 翻訳完了
システム内更新日: 2026-03-25 19:53:37.40297
Title: Beyond Hate: Differentiating Uncivil and Intolerant Speech in Multimodal Content Moderation
Title（参考訳）: ヘイトを超えて:マルチモーダルコンテンツモデレーションにおける非シビルと耐え難い音声の差別化
Authors: Nils A. Herrmann, Tobias Eder, Jingyi He, Georg Groh,
Abstract要約: 我々は,2つの分離可能な次元,非公害と不寛容を区別する微粒なアノテーションスキームを導入する。このスキームをHateful Memesデータセットから2,030のミームに適用する。この結果から,詳細なアノテーションが既存の粗いラベルを補完し,共同で使用すると全体のモデル性能が向上することがわかった。
参考スコア（独自算出の注目度）: 3.5637794289327847
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Current multimodal toxicity benchmarks typically use a single binary hatefulness label. This coarse approach conflates two fundamentally different characteristics of expression: tone and content. Drawing on communication science theory, we introduce a fine-grained annotation scheme that distinguishes two separable dimensions: incivility (rude or dismissive tone) and intolerance (content that attacks pluralism and targets groups or identities) and apply it to 2,030 memes from the Hateful Memes dataset. We evaluate different vision-language models under coarse-label training, transfer learning across label schemes and a joint learning approach that combines the coarse hatefulness label with our fine-grained annotations. Our results show that fine-grained annotations complement existing coarse labels and, when used jointly, improve overall model performance. Moreover, models trained with the fine-grained scheme exhibit more balanced moderation-relevant error profiles and are less prone to under-detection of harmful content than models trained on hatefulness labels alone (FNR-FPR, the difference between false negative and false positive rates: 0.74 to 0.42 for LLaVA-1.6-Mistral-7B; 0.54 to 0.28 for Qwen2.5-VL-7B). This work contributes to data-centric approaches in content moderation by improving the reliability and accuracy of moderation systems through enhanced data quality. Overall, combining both coarse and fine-grained labels provides a practical route to more reliable multimodal moderation.
Abstract（参考訳）: 現在のマルチモーダル毒性ベンチマークでは、通常は単一のバイナリヘイトフルネスラベルを使用する。この粗いアプローチは、表現の基本的な特徴であるトーンと内容の2つを融合させる。コミュニケーション科学理論を基礎として,非現実性(ルールトーンや否定トーン)と不寛容(多元主義を攻撃し,グループやアイデンティティを標的とするコンテンツ)という2つの分離可能な次元を識別し,それをHateful Memesデータセットから2,030のミームに適用する,きめ細かなアノテーションスキームを導入する。我々は、粗いラベルのトレーニング、ラベルスキーム間の伝達学習、粗い憎しみラベルと細かなアノテーションを組み合わせた共同学習アプローチにより、異なる視覚言語モデルを評価する。この結果から,詳細なアノテーションが既存の粗いラベルを補完し,共同で使用すると全体のモデル性能が向上することがわかった。さらに、細粒度スキームでトレーニングされたモデルは、モデレーション関連エラープロファイルのバランスが良くなり、ヘイトフルネスラベルだけでトレーニングされたモデルよりも有害なコンテンツが検出されにくい(FNR-FPR、偽陰性と偽陽性の差:LLaVA-1.6-ミストラル-7Bの0.74から0.42、Qwen2.5-VL-7Bの0.54から0.28)。この研究は、データ品質の向上を通じて、モデレーションシステムの信頼性と精度を向上させることによって、コンテンツモデレーションにおけるデータ中心のアプローチに寄与する。全体として、粗いラベルときめ細かいラベルを組み合わせることで、より信頼性の高いマルチモーダルモデレーションへの実践的なルートを提供する。

関連論文リスト

When in Doubt, Deliberate: Confidence-Based Routing to Expert Debate for Sexism Detection [7.299050989302629]
我々は,(i)低表現,(ii)雑音,(iii)データおよびモデル予測における概念的あいまいさの複合効果に対処する枠組みを提案する。提案手法では,タスク EXIST 2025 タスク 1.1 では F1 が +2.72% 改善され,EDOS A と B では +4.48% と +1.30% が得られた。
論文参考訳（メタデータ） (2025-12-21T05:48:57Z)
UniME-V2: MLLM-as-a-Judge for Universal Multimodal Embedding Learning [101.62386137855704]
本稿では,Universal Multimodal Embedding (UniME-V2)モデルを提案する。提案手法はまず,グローバル検索による潜在的な負のセットを構築する。次に、MLLMを用いてクエリ候補対のセマンティックアライメントを評価するMLLM-as-a-Judge機構を提案する。これらのスコアは、ハード・ネガティブ・マイニングの基礎となり、偽陰性の影響を緩和し、多様な高品質なハード・ネガティブの識別を可能にする。
論文参考訳（メタデータ） (2025-10-15T13:07:00Z)
Labels or Input? Rethinking Augmentation in Multimodal Hate Detection [9.166963162285064]
マルチモーダルヘイト検出を改善するために,マルチモーダルヘイト検出法を提案する。まず、素早い構造、監督、訓練のモダリティを体系的に変化させるプロンプト最適化フレームワークを提案する。次に,2,479個の正中性ミームを生成するマルチモーダルデータ拡張パイプラインを提案する。
論文参考訳（メタデータ） (2025-08-15T21:31:00Z)
Weakly-Supervised Contrastive Learning for Imprecise Class Labels [50.57424331797865]
正対と負対を定義するために「連続的意味的類似性」の概念を導入する。弱教師付きコントラスト学習のためのグラフ理論フレームワークを提案する。我々のフレームワークは非常に多用途であり、多くの弱い教師付き学習シナリオに適用できる。
論文参考訳（メタデータ） (2025-05-28T06:50:40Z)
For Better or For Worse? Learning Minimum Variance Features With Label Augmentation [7.183341902583164]
本研究では,データ拡張手法のラベル拡張の側面が果たす役割を解析する。まず、ラベル拡張で訓練されたバイナリ分類データの線形モデルが、データ内の最小分散特性のみを学ぶことを証明した。次に, 非線形モデルや一般データ分布においても, ラベルの平滑化や混合損失はモデル出力分散の関数によって低く抑えられることを示す。
論文参考訳（メタデータ） (2024-02-10T01:36:39Z)
DualMatch: Robust Semi-Supervised Learning with Dual-Level Interaction [10.775623936099173]
従来の半教師付き学習手法は、通常、異なるデータ拡張ビューのモデル予測を単一レベルのインタラクション方法で一致させる。本稿では,DualMatchと呼ばれる新しいSSL方式を提案する。標準SSL設定では、SOTA法と比較して9%のエラー削減が達成されるが、より困難なクラス不均衡設定でも6%のエラー削減が達成できる。
論文参考訳（メタデータ） (2023-10-25T08:34:05Z)
Label Denoising through Cross-Model Agreement [43.5145547124009]
ノイズのあるラベルを記憶することはモデルの学習に影響を与え、準最適性能をもたらす可能性がある。雑音ラベルから堅牢な機械学習モデルを学習するための新しいフレームワークを提案する。
論文参考訳（メタデータ） (2023-08-27T00:31:04Z)
Pseudo Contrastive Learning for Graph-based Semi-supervised Learning [67.37572762925836]
Pseudo Labelingは、グラフニューラルネットワーク(GNN)の性能向上に使用されるテクニックである。我々はPseudo Contrastive Learning(PCL)と呼ばれるGNNのための一般的なフレームワークを提案する。
論文参考訳（メタデータ） (2023-02-19T10:34:08Z)
Semi-Supervised Learning with Pseudo-Negative Labels for Image Classification [14.100569951592417]
擬陰性ラベルに基づく相互学習フレームワークを提案する。擬似負ラベルの予測確率を下げることにより、二重モデルは予測能力を向上させることができる。我々のフレームワークは、いくつかの主要なベンチマークで最先端の結果を達成する。
論文参考訳（メタデータ） (2023-01-10T14:15:17Z)
Adversarial Dual-Student with Differentiable Spatial Warping for Semi-Supervised Semantic Segmentation [70.2166826794421]
本研究では、教師なしデータ拡張を行うために、微分可能な幾何ワープを提案する。また,平均教師数を改善するために,新しい対角的二重学習フレームワークを提案する。我々のソリューションは、両方のデータセットで得られるパフォーマンスと最先端の結果を大幅に改善します。
論文参考訳（メタデータ） (2022-03-05T17:36:17Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。