論文の概要: Chinese Toxic Language Mitigation via Sentiment Polarity Consistent Rewrites
- arxiv url: http://arxiv.org/abs/2505.15297v1
- Date: Wed, 21 May 2025 09:27:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-22 15:42:59.414579
- Title: Chinese Toxic Language Mitigation via Sentiment Polarity Consistent Rewrites
- Title(参考訳): 感性極性に一貫性のある書き直しによる中国語の有害言語軽減
- Authors: Xintong Wang, Yixiao Liu, Jingheng Pan, Liang Ding, Longyue Wang, Chris Biemann,
- Abstract要約: ToxiRewriteCNは、感情極性を維持するために明示的に設計された最初の中国のデータセットである。
1,556個の注釈付き三つ子からなり、それぞれに有毒な文、無害な非有毒な書き直し、ラベル付き有毒なスパンを含む。
標準的な表現、絵文字誘発、ホモフォニックな毒性、シングルターンとマルチターンの対話の5つの現実シナリオをカバーしている。
- 参考スコア(独自算出の注目度): 39.3555146467512
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Detoxifying offensive language while preserving the speaker's original intent is a challenging yet critical goal for improving the quality of online interactions. Although large language models (LLMs) show promise in rewriting toxic content, they often default to overly polite rewrites, distorting the emotional tone and communicative intent. This problem is especially acute in Chinese, where toxicity often arises implicitly through emojis, homophones, or discourse context. We present ToxiRewriteCN, the first Chinese detoxification dataset explicitly designed to preserve sentiment polarity. The dataset comprises 1,556 carefully annotated triplets, each containing a toxic sentence, a sentiment-aligned non-toxic rewrite, and labeled toxic spans. It covers five real-world scenarios: standard expressions, emoji-induced and homophonic toxicity, as well as single-turn and multi-turn dialogues. We evaluate 17 LLMs, including commercial and open-source models with variant architectures, across four dimensions: detoxification accuracy, fluency, content preservation, and sentiment polarity. Results show that while commercial and MoE models perform best overall, all models struggle to balance safety with emotional fidelity in more subtle or context-heavy settings such as emoji, homophone, and dialogue-based inputs. We release ToxiRewriteCN to support future research on controllable, sentiment-aware detoxification for Chinese.
- Abstract(参考訳): 話者の本来の意図を維持しながら攻撃的言語をデトックス化することは、オンラインインタラクションの品質を改善する上で、難しいが重要な目標である。
大きな言語モデル(LLM)は有害な内容の書き直しを約束するが、しばしば過度に丁寧な書き直しをし、感情的なトーンとコミュニケーション意図を歪めてしまう。
この問題は中国語では特に急性であり、しばしば絵文字、ホモフォン、言論の文脈を通じて毒性が暗黙的に現れる。
感性極性を保つために設計された中国初のデトキシ化データセットであるToxiRewriteCNを提案する。
データセットは、1,556個の注釈付き三つ子からなり、それぞれに有毒な文、感傷的な非有毒な書き直し、ラベル付き有毒なスパンを含む。
標準的な表現、絵文字誘発、ホモフォニックな毒性、シングルターンとマルチターンの対話の5つの現実シナリオをカバーしている。
各種アーキテクチャを持つ商用およびオープンソースモデルを含む17のLCMを, 解毒精度, 流布率, コンテンツ保存率, 感情極性という4次元にわたって評価した。
その結果、商業モデルとMoEモデルは全体として最もよく機能するが、すべてのモデルは、絵文字、ホモフォン、対話ベースの入力など、より微妙でコンテキストの多い設定において、安全性と感情的忠実さのバランスをとるのに苦労していることがわかった。
toxiRewriteCN をリリースし,中国における制御可能な感傷的解毒反応の今後の研究を支援する。
関連論文リスト
- ToxicTone: A Mandarin Audio Dataset Annotated for Toxicity and Toxic Utterance Tonality [35.517662288248225]
ToxicToneはこの種の公開データセットとしては最大である。
我々のデータは、様々な現実世界のオーディオから導き出され、13のトピックに分類される。
本研究では,音響的,言語的,感情的特徴を統合したマルチモーダル検出フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-21T17:25:27Z) - Pragmatic Inference Chain (PIC) Improving LLMs' Reasoning of Authentic Implicit Toxic Language [10.295731340480417]
PIC(Pragmatic Inference Chain)は,認知科学と言語学の学際的知見に基づく新たなプロンプト手法である。
GPT-4o、Llama-3.1-70B-Instruct、DeepSeek-v2.5の成功率を大幅に向上させる。
論文 参考訳(メタデータ) (2025-03-03T13:51:05Z) - Multilingual and Explainable Text Detoxification with Parallel Corpora [58.83211571400692]
並列テキストデトックス化コーパスを新しい言語に拡張する。
本研究は, 有毒な文と非有毒な文の両方の記述的特徴について, 自動的, 説明可能な分析を行う。
そこで我々は,Chain-of-Thoughts推論手法に触発された新しいテキスト解毒法を実験した。
論文 参考訳(メタデータ) (2024-12-16T12:08:59Z) - Text Detoxification as Style Transfer in English and Hindi [1.183205689022649]
本論文は, 有毒テキストを非有毒テキストに自動的に変換するテキストデトックス化に焦点を当てている。
類似したタスクからの知識伝達,マルチタスク学習,削除と再構築の3つのアプローチを提案する。
以上の結果から,本手法は実際の内容の保存と流布の維持を両立しながら,テキストの脱毒を効果的にバランスさせることが示唆された。
論文 参考訳(メタデータ) (2024-02-12T16:30:41Z) - Sentiment-enhanced Graph-based Sarcasm Explanation in Dialogue [63.32199372362483]
本稿では,SEntiment-enhanceD Graph を用いたマルチモーダルサルカズム記述フレームワーク EDGE を提案する。
特に,まずレキシコン誘導型発話感情推論モジュールを提案し,そこでは発話感情改善戦略を考案する。
次に,マルチモーダル感情分析モデル JCA を拡張し,映像音声クリップ毎に共同感情ラベルを導出することにより,JCA-SI (Joint Cross Attention-based Sentiment Inference) というモジュールを開発する。
論文 参考訳(メタデータ) (2024-02-06T03:14:46Z) - Seamless: Multilingual Expressive and Streaming Speech Translation [71.12826355107889]
本稿では,エンドツーエンドの表現型および多言語翻訳をストリーミング形式で実現するモデル群を紹介する。
まず,多言語およびマルチモーダルのSeamlessM4Tモデル-SeamlessM4T v2の改良版をコントリビュートする。
SeamlessExpressiveとSeamlessStreamingの主なコンポーネントをまとめてSeamlessを作ります。
論文 参考訳(メタデータ) (2023-12-08T17:18:42Z) - Speech Toxicity Analysis: A New Spoken Language Processing Task [32.297717021285344]
ヘイトスピーチ(英: hate speech)またはヘイトスピーチ(英: hate speech)は、今日のオンラインソーシャルメディアを悩ませる重要な問題の1つである。
音声音声から有害性を検出する新しい音声言語処理タスクを提案する。
DeToxyは、様々な公開音声データベースから得られた英語音声に対する、初めて公開された毒性アノテートデータセットである。
論文 参考訳(メタデータ) (2021-10-14T17:51:04Z) - Challenges in Automated Debiasing for Toxic Language Detection [81.04406231100323]
バイアスド・アソシエーションは、有害な言語を検出するための分類器の開発において課題となっている。
我々は最近,有害な言語検出に適用されたテキスト分類データセットとモデルに対するデバイアス法について検討した。
我々の焦点は語彙(例えば、誓い言葉、スラー、アイデンティティの言及)と方言マーカー(特にアフリカ系アメリカ人の英語)である。
論文 参考訳(メタデータ) (2021-01-29T22:03:17Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。