論文の概要: PejorativITy: Disambiguating Pejorative Epithets to Improve Misogyny Detection in Italian Tweets
- arxiv url: http://arxiv.org/abs/2404.02681v1
- Date: Wed, 3 Apr 2024 12:24:48 GMT
- ステータス: 処理完了
- システム内更新日: 2024-04-04 17:31:03.073469
- Title: PejorativITy: Disambiguating Pejorative Epithets to Improve Misogyny Detection in Italian Tweets
- Title(参考訳): PejorativITy: イタリアのつぶやきにおけるミソジニー検出を改善するためにペジョラティヴィティを曖昧に
- Authors: Arianna Muti, Federico Ruggeri, Cagri Toraman, Lorenzo Musetti, Samuel Algherini, Silvia Ronchi, Gianmarco Saretto, Caterina Zapparoli, Alberto Barrón-Cedeño,
- Abstract要約: 語レベルではイタリア語のツイートを手動で注釈付けし,文レベルでは誤用する新しいコーパスであるPejorativITyを提示する。
本研究では,不明瞭な単語に関する情報を誤検出を対象とするモデルに注入する効果を評価する。
- 参考スコア(独自算出の注目度): 11.224028161937296
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Misogyny is often expressed through figurative language. Some neutral words can assume a negative connotation when functioning as pejorative epithets. Disambiguating the meaning of such terms might help the detection of misogyny. In order to address such task, we present PejorativITy, a novel corpus of 1,200 manually annotated Italian tweets for pejorative language at the word level and misogyny at the sentence level. We evaluate the impact of injecting information about disambiguated words into a model targeting misogyny detection. In particular, we explore two different approaches for injection: concatenation of pejorative information and substitution of ambiguous words with univocal terms. Our experimental results, both on our corpus and on two popular benchmarks on Italian tweets, show that both approaches lead to a major classification improvement, indicating that word sense disambiguation is a promising preliminary step for misogyny detection. Furthermore, we investigate LLMs' understanding of pejorative epithets by means of contextual word embeddings analysis and prompting.
- Abstract(参考訳): ミソジニーはしばしば比喩的な言語で表現される。
いくつかの中性語は、悲観的表現として機能するときに否定的な意味を仮定することができる。
このような言葉の意味を曖昧にすることは、誤認を検出するのに役立つかもしれない。
このような課題に対処するために,1200のイタリア語ツイートを手作業で注釈付けした新しいコーパスであるPejorativITyを紹介した。
本研究では,不明瞭な単語に関する情報を誤検出を対象とするモデルに注入する効果を評価する。
特に,説明的情報の結合と曖昧な単語を単音節で置換する2つの異なる注入方法を探究する。
我々のコーパスと2つの人気のあるイタリアのつぶやきのベンチマークによる実験結果から、どちらの手法も大きな分類改善につながることが示され、単語感覚の曖昧さが誤検出のための有望な予備的なステップであることが示唆された。
さらに,文脈的単語埋め込み分析とプロンプトによるLLMの語句認識について検討した。
関連論文リスト
- Verbreitungsmechanismen sch\"adigender Sprache im Netz: Anatomie zweier
Shitstorms [0.9898607871253772]
私たちは、ビジネスの世界からよく知られた個人に対して、2つの模範的でクロスメディアなたわごとに焦点を合わせています。
どちらも共通点があり、最初は、暴風雨の標的となる人物による議論の的になっている。
本稿では,2つのメディアにまたがる乱れ波の拡散について検討し,その時間経過を解析するための計算言語学的手法の適用性を検証する。
論文 参考訳(メタデータ) (2023-12-12T12:00:04Z) - Measuring Misogyny in Natural Language Generation: Preliminary Results
from a Case Study on two Reddit Communities [7.499634046186994]
自然言語生成における誤語測定の課題について考察する。
Redditでは2つの優れたIncelコミュニティのデータを使用します。
論文 参考訳(メタデータ) (2023-12-06T07:38:46Z) - Grammatical Gender's Influence on Distributional Semantics: A Causal
Perspective [100.47362690469669]
言語間のジェンダーの割り当てにどの程度の意味が影響するかは、現代言語学と認知科学における活発な研究分野である。
我々は、名詞の文法的性別、意味、形容詞選択の間の相互作用を共同で表現する、新しい因果的グラフィカルモデルを提供する。
文法的ジェンダーが形容詞選択にほぼゼロ効果があることに気付き、ネオ・ヴォルフの仮説を疑問視する。
論文 参考訳(メタデータ) (2023-11-30T13:58:13Z) - That was the last straw, we need more: Are Translation Systems Sensitive
to Disambiguating Context? [64.38544995251642]
我々は、源泉に存在している意味的あいまいさ(本研究における英語)について研究する。
我々は、リテラルと図形の両方にオープンなイディオムに焦点を当てている。
現在のMTモデルは、たとえ文脈が比喩的解釈を示しているとしても、英語のイディオムを文字通りに翻訳する。
論文 参考訳(メタデータ) (2023-10-23T06:38:49Z) - Neighboring Words Affect Human Interpretation of Saliency Explanations [65.29015910991261]
単語レベルのサリエンシの説明は、しばしばテキストベースのモデルで特徴属性を伝えるために使われる。
近年の研究では、単語の長さなどの表面的要因が、コミュニケーションされたサリエンシスコアの人間の解釈を歪めてしまうことが報告されている。
本研究では,単語の近傍にある単語のマーキングが,その単語の重要性に対する説明者の認識にどのように影響するかを検討する。
論文 参考訳(メタデータ) (2023-05-04T09:50:25Z) - We're Afraid Language Models Aren't Modeling Ambiguity [136.8068419824318]
あいまいさの管理は人間の言語理解の重要な部分です。
文中のあいまいさは,他の文との係り受け関係に与える影響によって特徴付けられる。
我々は,多ラベルNLIモデルが曖昧さによって誤解を招く野生の政治的主張にフラグを付けることができることを示す。
論文 参考訳(メタデータ) (2023-04-27T17:57:58Z) - Shades of meaning: Uncovering the geometry of ambiguous word
representations through contextualised language models [6.760960482418417]
語彙的曖昧さは言語科学に深く永続的な挑戦をもたらす。
我々の研究は、一連のシミュレーションを通して、語彙的あいまいさの心理的理解に関する新たな洞察を提供する。
論文 参考訳(メタデータ) (2023-04-26T14:47:38Z) - The Causal Structure of Semantic Ambiguities [0.0]
本研究は,(1)異なる解釈の連立可否度,(2)プロセスにおいて特定の単語がより重要な役割を果たす因果構造,の2つの特徴を同定する。
我々はこの理論を、心理学文献から抽出された曖昧なフレーズのデータセットと、私たちによって収集された人間の妥当性に応用した。
論文 参考訳(メタデータ) (2022-06-14T12:56:34Z) - Under the Morphosyntactic Lens: A Multifaceted Evaluation of Gender Bias
in Speech Translation [20.39599469927542]
ジェンダーバイアスは言語技術に影響を及ぼす問題として広く認識されている。
現代の評価慣行のほとんどは、合成条件下での職業名詞の狭いセットに単語レベルの焦点をあてている。
このようなプロトコルは、性合意のモルフォシンタクティック連鎖を特徴とする文法性言語の重要な特徴を見落としている。
論文 参考訳(メタデータ) (2022-03-18T11:14:16Z) - Do Context-Aware Translation Models Pay the Right Attention? [61.25804242929533]
コンテキスト対応機械翻訳モデルは文脈情報を活用するように設計されているが、しばしば失敗する。
本稿では,人間の翻訳者が曖昧な単語を解くために使用する文脈について述べる。
SCAT(Supporting Context for Ambiguous Translations)は、14K翻訳のコンテキストワードをサポートする新しい英仏データセットです。
SCATを用いて,支援語の位置的特徴と語彙的特徴をあいまいにするために使用される文脈を詳細に分析する。
論文 参考訳(メタデータ) (2021-05-14T17:32:24Z) - Speakers Fill Lexical Semantic Gaps with Context [69.30534067031734]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。