論文の概要: Self-Supervised Euphemism Detection and Identification for Content
Moderation
- arxiv url: http://arxiv.org/abs/2103.16808v1
- Date: Wed, 31 Mar 2021 04:52:38 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-02 03:13:55.219590
- Title: Self-Supervised Euphemism Detection and Identification for Content
Moderation
- Title(参考訳): 自己監督型エフェミズム検出とコンテンツモデレーションの同定
- Authors: Wanzheng Zhu, Hongyu Gong, Rohan Bansal, Zachary Weinberg, Nicolas
Christin, Giulia Fanti, Suma Bhat
- Abstract要約: ユーヘミズムの一般的な使用法は、ソーシャルメディアプラットフォームによって強制されるコンテンツモデレーションポリシーを回避することである。
通常、人間のモデレーターは、ある単語がエキシマティックに使われていることは明らかであるが、秘密の意味が何であるかは分かっていない。
本論文は, 共起的に使用される単語を検知し, 各単語の秘密意味を識別できる教師なしアルゴリズムを示す。
- 参考スコア(独自算出の注目度): 16.322965299627974
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Fringe groups and organizations have a long history of using
euphemisms--ordinary-sounding words with a secret meaning--to conceal what they
are discussing. Nowadays, one common use of euphemisms is to evade content
moderation policies enforced by social media platforms. Existing tools for
enforcing policy automatically rely on keyword searches for words on a "ban
list", but these are notoriously imprecise: even when limited to swearwords,
they can still cause embarrassing false positives. When a commonly used
ordinary word acquires a euphemistic meaning, adding it to a keyword-based ban
list is hopeless: consider "pot" (storage container or marijuana?) or "heater"
(household appliance or firearm?) The current generation of social media
companies instead hire staff to check posts manually, but this is expensive,
inhumane, and not much more effective. It is usually apparent to a human
moderator that a word is being used euphemistically, but they may not know what
the secret meaning is, and therefore whether the message violates policy. Also,
when a euphemism is banned, the group that used it need only invent another
one, leaving moderators one step behind.
This paper will demonstrate unsupervised algorithms that, by analyzing words
in their sentence-level context, can both detect words being used
euphemistically, and identify the secret meaning of each word. Compared to the
existing state of the art, which uses context-free word embeddings, our
algorithm for detecting euphemisms achieves 30-400% higher detection accuracies
of unlabeled euphemisms in a text corpus. Our algorithm for revealing
euphemistic meanings of words is the first of its kind, as far as we are aware.
In the arms race between content moderators and policy evaders, our algorithms
may help shift the balance in the direction of the moderators.
- Abstract(参考訳): フリンジグループや組織は、彼らが議論していることを隠すために、遠近法(通常、秘密の意味を持つ言葉)を使う長い歴史を持っています。
今日では、ユーフェミズムの一般的な使用は、ソーシャルメディアプラットフォームによって強制されるコンテンツモデレーションポリシーを回避することである。
ポリシーを強制するための既存のツールは、自動的に「禁止リスト」の単語のキーワード検索に依存しているが、これらは不正確である。
普通に使われる単語がユーフェミズム的な意味を持つ場合、キーワードベースの禁止リストに追加することは期待できない: "pot" (storage container or marijuana?
または「ヒーター」(ハウスホルダーの器具や銃器?
現在のソーシャルメディア企業は、手動で投稿をチェックするためにスタッフを雇っているが、これは高価で非人間的であり、あまり効果的ではない。
通常、人間のモデレーターは、ある単語がエキシマティックに使われていることは明らかであるが、秘密の意味が何であるかを知らないため、メッセージがポリシーに違反しているかどうかを判断する。
また、ユーフェミズムが禁止された場合、それを使ったグループは別のものを発明するだけで、モデレーターは一歩遅れる。
本論文は,文レベルの文脈で単語を解析することにより,共起的に使用される単語を検出でき,各単語の秘密意味を識別できる教師なしアルゴリズムを示す。
文脈なしの単語埋め込みを用いた既存の技術と比較すると,提案手法はテキストコーパスでラベルなしのオイフェミズムの検出精度を30~400%向上させる。
単語の意味を明らかにするアルゴリズムは、私たちが知っている限りでは、最初のものである。
コンテンツモデレーターとポリシー回避器の武器競争において、我々のアルゴリズムはモデレーターの方向のバランスをシフトするのに役立ちます。
関連論文リスト
- Impromptu Cybercrime Euphemism Detection [20.969469059941545]
本稿では,Impromptu Cybercrime Euphemisms Detectionデータセットを紹介する。
本稿では,この問題に適した検出フレームワークを提案する。
提案手法は,従来の最先端のエウヘミズム検出器と比較して,76倍の精度向上を実現している。
論文 参考訳(メタデータ) (2024-12-02T11:56:06Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - Beyond Plain Toxic: Detection of Inappropriate Statements on Flammable
Topics for the Russian Language [76.58220021791955]
本稿では,不合理性という二項的概念と,センシティブなトピックの多項的概念に基づいてラベル付けされた2つのテキストコレクションについて述べる。
不適切な概念を客観するために、クラウドソーシングではデータ駆動方式で定義する。
論文 参考訳(メタデータ) (2022-03-04T15:59:06Z) - Euphemistic Phrase Detection by Masked Language Model [9.49544185939481]
ソーシャルメディアコーパス上でフレーズマイニングを行い、高品質なフレーズを抽出する。
次に,単語埋め込み類似性を利用して,語句候補の集合を選択する。
本アルゴリズムを用いて,20~50%の高精度な検出精度を報告した。
論文 参考訳(メタデータ) (2021-09-10T04:57:30Z) - Semantic-Preserving Adversarial Text Attacks [85.32186121859321]
深層モデルの脆弱性を調べるために, Bigram と Unigram を用いた適応的セマンティック保存最適化法 (BU-SPO) を提案する。
提案手法は,既存手法と比較して最小の単語数を変更することで,攻撃成功率とセマンティックス率を最大化する。
論文 参考訳(メタデータ) (2021-08-23T09:05:18Z) - Fluent: An AI Augmented Writing Tool for People who Stutter [47.10916891482696]
スタブリング(PWS)を行う人々は、そのスタブリングを隠すために異なる戦略を採用するかもしれない。
一般的な戦略の1つは単語置換(英語版)であり、それは個人が単語を打つことを避け、代わりに代替語を使うものである。
本稿では,PWSのスクリプト記述を支援するAI拡張書記ツールであるFluentについて紹介する。
論文 参考訳(メタデータ) (2021-08-23T04:08:27Z) - Towards Dark Jargon Interpretation in Underground Forums [37.15748678894555]
暗黒ジャーゴンを自動同定し,解釈するための新しい手法を提案する。
暗黒語から隠れた意味のない「クリーン」語へのマッピングとして問題を定式化する。
本手法は,共有語彙上の確率分布の形でダークワードとクリーンワードの解釈可能な表現を利用する。
論文 参考訳(メタデータ) (2020-11-05T18:08:32Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - The Grievance Dictionary: Understanding Threatening Language Use [0.8373151777137792]
グリーバンス辞典は、グリーヴァンスに満ちた暴力の脅威評価の文脈で言語の使用を自動的に理解するために使用することができる。
この辞書は暴力的で非暴力的な個人によって書かれたテキストに適用することで検証された。
論文 参考訳(メタデータ) (2020-09-10T12:06:48Z) - Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems [54.49880724137688]
語彙外単語(OOV)の問題は、音声認識システムにおいて典型的である。
OOVをカバーするための一般的なアプローチの1つは、単語ではなくサブワード単位を使用することである。
本稿では,グラフ構築法と探索法の両方のレベルで,この解の既存手法について検討する。
論文 参考訳(メタデータ) (2020-03-19T21:24:45Z) - Humpty Dumpty: Controlling Word Meanings via Corpus Poisoning [29.181547214915238]
埋め込み空間における単語の位置を変更することで、攻撃者が新しい単語や既存の単語の「意味」を制御できることが示される。
埋め込みに対する攻撃は、さまざまな下流タスクに影響を与える可能性がある。
論文 参考訳(メタデータ) (2020-01-14T17:48:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。