論文の概要: CATs are Fuzzy PETs: A Corpus and Analysis of Potentially Euphemistic
Terms
- arxiv url: http://arxiv.org/abs/2205.02728v1
- Date: Thu, 5 May 2022 16:01:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-05-06 17:34:02.601982
- Title: CATs are Fuzzy PETs: A Corpus and Analysis of Potentially Euphemistic
Terms
- Title(参考訳): CATはファジィPETである:コーパスと潜在的エフェム的用語の解析
- Authors: Martha Gavidia, Patrick Lee, Anna Feldman, Jing Peng
- Abstract要約: 本研究は,GloWbEコーパスのサンプルテキストとともに,潜在的なエキシマティック用語(PET)のコーパスを提示する。
その結果,エキシマティックテキストの感情分析により,PETは一般的に否定的感情や攻撃的な感情を減少させることがわかった。
アノテーションタスクにおいて,PETをエウヘミスティックかどうかのラベル付けを依頼される場合,不一致の事例を観察する。
- 参考スコア(独自算出の注目度): 2.666791490663749
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Euphemisms have not received much attention in natural language processing,
despite being an important element of polite and figurative language.
Euphemisms prove to be a difficult topic, not only because they are subject to
language change, but also because humans may not agree on what is a euphemism
and what is not. Nevertheless, the first step to tackling the issue is to
collect and analyze examples of euphemisms. We present a corpus of potentially
euphemistic terms (PETs) along with example texts from the GloWbE corpus.
Additionally, we present a subcorpus of texts where these PETs are not being
used euphemistically, which may be useful for future applications. We also
discuss the results of multiple analyses run on the corpus. Firstly, we find
that sentiment analysis on the euphemistic texts supports that PETs generally
decrease negative and offensive sentiment. Secondly, we observe cases of
disagreement in an annotation task, where humans are asked to label PETs as
euphemistic or not in a subset of our corpus text examples. We attribute the
disagreement to a variety of potential reasons, including if the PET was a
commonly accepted term (CAT).
- Abstract(参考訳): ユーフェミズムは自然言語処理においてあまり注目されていないが、礼儀正しい言語やフィギュラティブ言語の重要な要素である。
ユーフェミズムは、言語変化の対象であるだけでなく、人間がユーフェミズムと何がそうでないことに同意しないため、難しいトピックであることが証明されている。
それにもかかわらず、この問題に取り組む最初のステップは、ユーフェミズムの例を収集し分析することである。
本研究は,GloWbEコーパスのサンプルテキストとともに,潜在的なエキシマティック用語(PET)のコーパスを提示する。
さらに,これらのPETがエキシマティックに使われていないテキストのサブコーパスを提示する。
また,コーパス上で複数の解析結果について考察する。
まず,エキシマティックテキストに対する感情分析により,PETは一般的にネガティブ感と攻撃感を減少させることがわかった。
第2に,人間のコーパステキストの例のサブセットにペットを優美性があるか否かを問う,アノテーションタスクにおける不一致の事例を観察した。
PETが一般的に受け入れられている用語(CAT)であるかどうかなど,様々な潜在的な理由から意見の相違が指摘されている。
関連論文リスト
- That was the last straw, we need more: Are Translation Systems Sensitive
to Disambiguating Context? [64.38544995251642]
我々は、源泉に存在している意味的あいまいさ(本研究における英語)について研究する。
我々は、リテラルと図形の両方にオープンなイディオムに焦点を当てている。
現在のMTモデルは、たとえ文脈が比喩的解釈を示しているとしても、英語のイディオムを文字通りに翻訳する。
論文 参考訳(メタデータ) (2023-10-23T06:38:49Z) - FEED PETs: Further Experimentation and Expansion on the Disambiguation
of Potentially Euphemistic Terms [3.1648534725322666]
我々は,ヨルバ語,スペイン語,マンダリン中国語の3つの異なる言語で,新しいエウヘミズムコーパスを提示する。
トランスフォーマーは、あいまいなPETを分類するのが一般的である。
我々は,多言語トランスフォーマーモデルmBERTとXLM-RoBERTaを用いて,各言語でエウヘミズムの曖昧化実験を行う。
論文 参考訳(メタデータ) (2023-05-31T22:23:20Z) - A Report on the Euphemisms Detection Shared Task [2.9972063833424216]
本稿では,EMNLP 2022と共同で開催されている第3回言語処理ワークショップ(2022図)の共用課題について述べる。
参加者は、入力テキストを入力し、その中にエウヘミズムが含まれているかどうかを識別する、エウヘミズム検出タスクを調査するために招待された。
入力データは、GloWbEコーパスから収集された潜在的発語(PET)を含む文のコーパスである。
論文 参考訳(メタデータ) (2022-11-23T22:06:35Z) - Are Representations Built from the Ground Up? An Empirical Examination
of Local Composition in Language Models [91.3755431537592]
構成的・非構成的句を表現することは言語理解にとって重要である。
まず,より長いフレーズのLM-内部表現を,その構成成分から予測する問題を定式化する。
意味的構成性の人間の判断と相関する予測精度を期待するが、大部分はそうではない。
論文 参考訳(メタデータ) (2022-10-07T14:21:30Z) - Subject Verb Agreement Error Patterns in Meaningless Sentences: Humans
vs. BERT [64.40111510974957]
英語における主語数合意に意味が干渉するかどうかを検証する。
意味的によく形づくられた、意味のないアイテムを生成します。
BERTと人間はどちらも、セマンティックな操作に敏感である。
論文 参考訳(メタデータ) (2022-09-21T17:57:23Z) - Searching for PETs: Using Distributional and Sentiment-Based Methods to
Find Potentially Euphemistic Terms [2.666791490663749]
本稿では,言語的に駆動される概念の証明として,潜在的にエフェヘミスティックな用語(PET)を求めることを提案する。
PETは特定の意味のある話題に対して一般的に使用される傾向があることを認識して,文から句候補を選択・フィルタリングするために分布類似性を利用する。
本研究は, 単語・多語PETの検出に有効であることを示すために, ユープレキシムを含む文のコーパスを用いて実験を行った。
論文 参考訳(メタデータ) (2022-05-20T22:21:21Z) - Beyond Plain Toxic: Detection of Inappropriate Statements on Flammable
Topics for the Russian Language [76.58220021791955]
本稿では,不合理性という二項的概念と,センシティブなトピックの多項的概念に基づいてラベル付けされた2つのテキストコレクションについて述べる。
不適切な概念を客観するために、クラウドソーシングではデータ駆動方式で定義する。
論文 参考訳(メタデータ) (2022-03-04T15:59:06Z) - Do Context-Aware Translation Models Pay the Right Attention? [61.25804242929533]
コンテキスト対応機械翻訳モデルは文脈情報を活用するように設計されているが、しばしば失敗する。
本稿では,人間の翻訳者が曖昧な単語を解くために使用する文脈について述べる。
SCAT(Supporting Context for Ambiguous Translations)は、14K翻訳のコンテキストワードをサポートする新しい英仏データセットです。
SCATを用いて,支援語の位置的特徴と語彙的特徴をあいまいにするために使用される文脈を詳細に分析する。
論文 参考訳(メタデータ) (2021-05-14T17:32:24Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Humpty Dumpty: Controlling Word Meanings via Corpus Poisoning [29.181547214915238]
埋め込み空間における単語の位置を変更することで、攻撃者が新しい単語や既存の単語の「意味」を制御できることが示される。
埋め込みに対する攻撃は、さまざまな下流タスクに影響を与える可能性がある。
論文 参考訳(メタデータ) (2020-01-14T17:48:52Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。