論文の概要: Harmonizing Global Voices: Culturally-Aware Models for Enhanced Content
Moderation
- arxiv url: http://arxiv.org/abs/2312.02401v1
- Date: Tue, 5 Dec 2023 00:11:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-06 17:13:34.505689
- Title: Harmonizing Global Voices: Culturally-Aware Models for Enhanced Content
Moderation
- Title(参考訳): グローバル音声の調和:文化性を考慮したコンテンツモデレーションモデル
- Authors: Alex J. Chan, Jos\'e Luis Redondo Garc\'ia, Fabrizio Silvestri, Colm
O'Donnel, Konstantina Palla
- Abstract要約: メディアニュースや記事の広範なデータセットに基づいて大規模な言語モデルをトレーニングし、文化的に直感的なモデルを作成します。
その結果,広範囲なメディアデータセットのトレーニングが文化意識の獲得に成功し,地域レベルでのコンテンツ違反処理の改善につながった。
- 参考スコア(独自算出の注目度): 10.53562175155486
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Content moderation at scale faces the challenge of considering local cultural
distinctions when assessing content. While global policies aim to maintain
decision-making consistency and prevent arbitrary rule enforcement, they often
overlook regional variations in interpreting natural language as expressed in
content. In this study, we are looking into how moderation systems can tackle
this issue by adapting to local comprehension nuances. We train large language
models on extensive datasets of media news and articles to create culturally
attuned models. The latter aim to capture the nuances of communication across
geographies with the goal of recognizing cultural and societal variations in
what is considered offensive content. We further explore the capability of
these models to generate explanations for instances of content violation,
aiming to shed light on how policy guidelines are perceived when cultural and
societal contexts change. We find that training on extensive media datasets
successfully induced cultural awareness and resulted in improvements in
handling content violations on a regional basis. Additionally, these
advancements include the ability to provide explanations that align with the
specific local norms and nuances as evidenced by the annotators' preference in
our conducted study. This multifaceted success reinforces the critical role of
an adaptable content moderation approach in keeping pace with the ever-evolving
nature of the content it oversees.
- Abstract(参考訳): コンテンツモデレーション 規模のコンテンツモデレーションは、コンテンツを評価する際に地域文化の区別を検討するという課題に直面している。
グローバルな政策は意思決定の一貫性を維持し、任意のルール適用を防ぐことを目的としているが、コンテンツで表される自然言語の解釈における地域的バリエーションを見落としていることが多い。
本研究では,局所的理解ニュアンスに適応することで,モデレーションシステムがこの問題にどのように対処できるかを検討する。
メディアニュースや記事の広範なデータセットに基づいて大規模な言語モデルをトレーニングし、文化的に直感的なモデルを作成します。
後者は、攻撃的コンテンツと見なされるものにおける文化的・社会的バリエーションを認識することを目的として、地理間のコミュニケーションのニュアンスを捉えることを目的としている。
さらに、これらのモデルがコンテンツ違反の事例を説明する能力について検討し、文化的・社会的文脈の変化が政策ガイドラインがどのように認識されるかを明らかにすることを目的とする。
その結果,広範囲なメディアデータセットのトレーニングが文化意識の獲得に成功し,地域レベルでのコンテンツ違反処理の改善につながった。
さらに,本研究における注釈者の嗜好が示すように,特定の局所規範やニュアンスに沿う説明を提供する能力も備えている。
この多面的な成功は、それが監督するコンテンツの進化を続ける性質とペースを維持するために、適応可能なコンテンツモデレーションアプローチの重要な役割を強化する。
関連論文リスト
- Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - Bridging Cultural Nuances in Dialogue Agents through Cultural Value
Surveys [20.82269206759988]
cuDialogは、文化レンズを使った対話生成のための第一級ベンチマークである。
対話交換から文化的属性を抽出できるベースラインモデルを開発した。
本稿では,対話型エンコーディング機能に文化的次元を組み込むことを提案する。
論文 参考訳(メタデータ) (2024-01-18T19:42:04Z) - Curriculum Recommendations Using Transformer Base Model with InfoNCE
Loss And Language Switching Method [1.7374356596021938]
カリキュラム勧告パラダイムは、教育技術とカリキュラム開発における進化を続ける領域における学習平等の促進に特化している。
言語翻訳や障害によって引き起こされる内容の衝突や破壊に対処し、完全にアクセス可能でパーソナライズされた学習体験の創造を妨げる可能性がある。
論文 参考訳(メタデータ) (2024-01-18T03:09:06Z) - Not All Countries Celebrate Thanksgiving: On the Cultural Dominance in
Large Language Models [89.94270049334479]
本稿では,大規模言語モデル(LLM)における文化的優位性について述べる。
LLMは、ユーザーが非英語で尋ねるときに期待する文化とは無関係な、不適切な英語文化関連の回答を提供することが多い。
論文 参考訳(メタデータ) (2023-10-19T05:38:23Z) - Foundational Models Defining a New Era in Vision: A Survey and Outlook [151.49434496615427]
視覚シーンの構成的性質を観察し、推論する視覚システムは、我々の世界を理解するのに不可欠である。
モデルは、このようなモダリティと大規模なトレーニングデータとのギャップを埋めることを学び、コンテキスト推論、一般化、テスト時の迅速な機能を容易にした。
このようなモデルの出力は、例えば、バウンディングボックスを設けて特定のオブジェクトをセグメント化したり、画像や映像シーンについて質問したり、言語命令でロボットの動作を操作することで対話的な対話を行うなど、リトレーニングすることなく、人為的なプロンプトによって変更することができる。
論文 参考訳(メタデータ) (2023-07-25T17:59:18Z) - Natural Language Decompositions of Implicit Content Enable Better Text
Representations [56.85319224208865]
本稿では,暗黙的に伝達されたコンテンツを明示的に考慮したテキスト分析手法を提案する。
我々は大きな言語モデルを用いて、観察されたテキストと推論的に関係する命題の集合を生成する。
本研究は,NLPにおいて,文字のみではなく,観察された言語の背景にある意味をモデル化することが重要であることを示唆する。
論文 参考訳(メタデータ) (2023-05-23T23:45:20Z) - Countering Malicious Content Moderation Evasion in Online Social
Networks: Simulation and Detection of Word Camouflage [64.78260098263489]
ツイストとカモフラージュキーワードは、プラットフォームコンテンツモデレーションシステムを回避する最もよく使われるテクニックである。
本稿では,コンテンツ回避の新たな手法をシミュレートし,検出する多言語ツールを開発することにより,悪意ある情報に対する対処に大きく貢献する。
論文 参考訳(メタデータ) (2022-12-27T16:08:49Z) - American cultural regions mapped through the lexical analysis of social
media [1.8199326045904993]
本研究は,マイクロブログ投稿からの大規模データセットの自動解析に基づいて,文化的地域を推定する手法を導入することで,この方向への重要な一歩を踏み出した。
特に、記述された言論の地域的変化は、アメリカのソーシャルメディアで測定される。
この低次元空間におけるデータの階層的クラスタリングを通じて、この手法は明確な文化的領域とそれらを定義する議論のトピックを生み出す。
論文 参考訳(メタデータ) (2022-08-16T10:18:47Z) - A Holistic Approach to Undesired Content Detection in the Real World [4.626056557184189]
実世界のコンテンツモデレーションのための堅牢な自然言語分類システムを構築するための総合的なアプローチを提案する。
このようなシステムの成功は、コンテンツの設計やラベリング命令を含む、慎重に設計され実行された一連のステップに依存している。
我々のモデレーションシステムは、性的コンテンツ、憎悪コンテンツ、暴力、自傷行為、ハラスメントなど、望ましくないコンテンツの幅広いカテゴリーを検出するために訓練されている。
論文 参考訳(メタデータ) (2022-08-05T16:47:23Z) - Measuring Commonality in Recommendation of Cultural Content: Recommender
Systems to Enhance Cultural Citizenship [67.5613995938273]
そこで本稿では,文化内容の特定のカテゴリにおいて,特定のユーザ集団に親しみのあるレコメンデーションの度合いを反映した新しい尺度として,共通性を導入する。
以上の結果から,共通性は既存の指標と相補的なシステム行動の特性を捉え,利用者の文化的市民性を高めることを目的としたリコメンデータシステムにおける代替的非個人化介入の必要性が示唆された。
論文 参考訳(メタデータ) (2022-08-02T19:14:49Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。