論文の概要: Mod-Guide: An LLM-based Content Moderation Feedback System to Address Insensitive Speech toward Indigenous Ethnic and Religious Minority Communities
- arxiv url: http://arxiv.org/abs/2606.13397v1
- Date: Thu, 11 Jun 2026 14:28:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-12 15:55:27.850114
- Title: Mod-Guide: An LLM-based Content Moderation Feedback System to Address Insensitive Speech toward Indigenous Ethnic and Religious Minority Communities
- Title(参考訳): Mod-Guide: 内因性倫理・宗教的マイノリティコミュニティに対する不感な音声に対処するLLMに基づくコンテンツモデレーションフィードバックシステム
- Authors: Dipto Das, Achhiya Sultana, Ankit Singh Chauhan, Saadia Binte Alam, Mohammad Shidujaman, Shion Guha, Sunandan Chakraborty, Syed Ishtiaque Ahmed,
- Abstract要約: この論文はバングラデシュのヒンドゥー教とチャクマ族のコミュニティに焦点を当てている。
我々は、コミュニティメンバーと文化に根ざした無感音声コーパスを共同で作成し、その物語を検索拡張生成(RAG)を用いたモデレーションパイプラインに統合した。
我々のツールMod-Guideは、生きた経験から得られた文脈的手がかりを活用することにより、少数派視点に対するLCM感度を向上させる。
- 参考スコア(独自算出の注目度): 22.15835643081041
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Language operates as a mechanism of both marginalization and resistance, especially for minority communities navigating insensitive and harmful speech online. As content moderation increasingly depends on large language models (LLMs), concerns arise about whether these systems can recognize culturally insensitive speech-language that disregards or marginalizes the cultural and religious perspectives of historically underrepresented communities, often through implicit erasure, misrepresentation, or normative framing, rather than overt hostility. Focusing on Bangladesh's Hindu and Chakma communities -- the country's largest religious and Indigenous ethnic minorities, respectively -- this paper investigates the epistemic limits of LLM-based moderation systems and explores methods for incorporating minority perspectives. We co-created a culturally grounded corpus of insensitive speech with community members and integrated their narratives into moderation pipelines using retrieval augmented generation (RAG). Our tool, Mod-Guide, improves LLM sensitivity to minority viewpoints by leveraging contextual cues derived from lived experience. Through mixed-method evaluations involving both minority and majority participants, we demonstrate that RAG-enhanced moderation responses are more contextually accurate and perceived differently across ethnic lines. This work advances research in human-computer interaction, AI ethics, and social computing by foregrounding restorative justice and hermeneutical inclusion in the design of content moderation systems.
- Abstract(参考訳): 言語は辺境化と抵抗の両方のメカニズムとして機能し、特にインターネット上で無神経で有害なスピーチをナビゲートする少数民族社会のために機能している。
コンテンツモデレーションは、大きな言語モデル(LLM)に依存しているため、これらのシステムが文化的に非感受性な言語を認識できるかどうかという懸念が生じる。
バングラデシュのヒンドゥー教とチャクマ族(それぞれ最大の宗教と先住民の少数民族)に焦点をあて、LLMに基づくモデレーションシステムの疫学的限界を調査し、少数派の視点を取り入れるための方法を探る。
我々は,コミュニティメンバーと文化に根ざした無感音声コーパスを共同で作成し,その物語を検索拡張生成(RAG)を用いたモデレーションパイプラインに統合した。
我々のツールMod-Guideは、生きた経験から得られた文脈的手がかりを活用することにより、少数派視点に対するLCM感度を向上させる。
マイノリティと多数派の両方を含む混合メソッド評価を通じて、RAG強化型モデレーション応答は、文脈的に正確で、民族間で異なる認識を持つことを示した。
この研究は、コンテンツモデレーションシステムの設計において、人間とコンピュータの相互作用、AI倫理、社会コンピューティングの研究を前向きに進める。
関連論文リスト
- Expressing Social Emotions: Misalignment Between LLMs and Human Cultural Emotion Norms [4.123547796999231]
LLMにおける異文化間社会感情表現の心理情報に基づく評価枠組みを提案する。
ヨーロッパ系アメリカ人とラテンアメリカ人の参加者の感情のエンゲージメントと非エンゲージメントの表現を比較した人間の研究を用いて,6つのフロンティアLSMを評価した。
あらゆるモデルは、広く表現されたヨーロッパ系アメリカ人の人格に対して特に目立たない違いが観察されるような、無関係な感情よりも活発な感情を表現している。
アブレーション分析により,これらのパターンは温度のサンプリングに頑健であり,部分的には言語に敏感であり,応答誘発形式に依存していることが明らかとなった。
論文 参考訳(メタデータ) (2026-04-18T00:17:34Z) - Mind the Gap: Pitfalls of LLM Alignment with Asian Public Opinion [8.443928474148114]
大規模言語モデル(LLM)は、多言語で多文化的な設定で徐々に展開されている。
本研究は、宗教のセンシティブな領域を、より広いアライメントのためのプリズムとして重視する。
一般的なモデルは一般に広い社会問題に関する世論と一致しているが、宗教的視点を正確に表現することができない。
論文 参考訳(メタデータ) (2026-03-06T13:29:54Z) - LLMs and Cultural Values: the Impact of Prompt Language and Explicit Cultural Framing [0.21485350418225244]
大規模言語モデル(LLM)は、世界中のユーザによって急速に採用され、さまざまな言語でそれらと対話している。
言語と文化のフレーミングが、異なる国の人的価値にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2025-11-06T02:09:29Z) - From Word to World: Evaluate and Mitigate Culture Bias in LLMs via Word Association Test [50.51344198689069]
我々は,人中心語関連テスト(WAT)を拡張し,異文化間認知による大規模言語モデルのアライメントを評価する。
文化選好に対処するために,モデルの内部表現空間に直接,文化固有の意味的関連性を直接埋め込む革新的なアプローチであるCultureSteerを提案する。
論文 参考訳(メタデータ) (2025-05-24T07:05:10Z) - LLM-C3MOD: A Human-LLM Collaborative System for Cross-Cultural Hate Speech Moderation [13.018071368511507]
非ネイティブモデレーターは、ヘイトスピーチのモデレーションにおいて、文化的に特有の知識、感情、インターネット文化を理解するのに苦労している。
本システムでは, 作業負荷を83.6%削減しつつ, 78%の精度を実現している。
LLMによって適切に支持された非ネイティブモデレーターは、異文化間ヘイトスピーチのモデレーションに効果的に寄与することが示唆された。
論文 参考訳(メタデータ) (2025-03-10T12:20:20Z) - The Shrinking Landscape of Linguistic Diversity in the Age of Large Language Models [7.811355338367627]
大規模言語モデル (LLMs) は, 言語多様性の顕著な低下と関係があることが示唆された。
テキストの中核的な内容は、LLMがテキストを洗練・書き直しする際に保持されるが、書体スタイルを均質化するだけでなく、特定の支配的特徴やバイアスを選択的に増幅し、他を抑圧する方法でスタイル的要素を変更することも示している。
論文 参考訳(メタデータ) (2025-02-16T20:51:07Z) - Large Language Models Reflect the Ideology of their Creators [71.65505524599888]
大規模言語モデル(LLM)は、自然言語を生成するために大量のデータに基づいて訓練される。
本稿では, LLMのイデオロギー的姿勢が創造者の世界観を反映していることを示す。
論文 参考訳(メタデータ) (2024-10-24T04:02:30Z) - Recent Advances in Hate Speech Moderation: Multimodality and the Role of Large Models [52.24001776263608]
この包括的調査は、HSモデレーションの最近の歩みを掘り下げている。
大型言語モデル(LLM)と大規模マルチモーダルモデル(LMM)の急成長する役割を強調した。
研究における既存のギャップを、特に表現不足言語や文化の文脈で特定する。
論文 参考訳(メタデータ) (2024-01-30T03:51:44Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - Towards Understanding and Mitigating Social Biases in Language Models [107.82654101403264]
大規模事前訓練言語モデル(LM)は、望ましくない表現バイアスを示すのに潜在的に危険である。
テキスト生成における社会的バイアスを軽減するためのステップを提案する。
我々の経験的結果と人的評価は、重要な文脈情報を保持しながらバイアスを緩和する効果を示す。
論文 参考訳(メタデータ) (2021-06-24T17:52:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。