論文の概要: Searching for PETs: Using Distributional and Sentiment-Based Methods to
Find Potentially Euphemistic Terms
- arxiv url: http://arxiv.org/abs/2205.10451v1
- Date: Fri, 20 May 2022 22:21:21 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-05 21:41:47.221889
- Title: Searching for PETs: Using Distributional and Sentiment-Based Methods to
Find Potentially Euphemistic Terms
- Title(参考訳): PETの探索:分布的・知覚的手法による潜在的エフェミスティックな用語の探索
- Authors: Patrick Lee and Martha Gavidia and Anna Feldman and Jing Peng
- Abstract要約: 本稿では,言語的に駆動される概念の証明として,潜在的にエフェヘミスティックな用語(PET)を求めることを提案する。
PETは特定の意味のある話題に対して一般的に使用される傾向があることを認識して,文から句候補を選択・フィルタリングするために分布類似性を利用する。
本研究は, 単語・多語PETの検出に有効であることを示すために, ユープレキシムを含む文のコーパスを用いて実験を行った。
- 参考スコア(独自算出の注目度): 2.666791490663749
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper presents a linguistically driven proof of concept for finding
potentially euphemistic terms, or PETs. Acknowledging that PETs tend to be
commonly used expressions for a certain range of sensitive topics, we make use
of distributional similarities to select and filter phrase candidates from a
sentence and rank them using a set of simple sentiment-based metrics. We
present the results of our approach tested on a corpus of sentences containing
euphemisms, demonstrating its efficacy for detecting single and multi-word PETs
from a broad range of topics. We also discuss future potential for
sentiment-based methods on this task.
- Abstract(参考訳): 本稿では,言語的に駆動された概念の証明として,潜在的にエフェヘミスティックな用語(PET)を求める。
PETは特定の意味のある話題の表現として一般的に使用される傾向があることを認識して,文から句候補を選択し,フィルタリングするために分布的類似性を利用して,単純な感情ベースの指標を用いてそれらをランク付けする。
本研究は, ユーフェミズムを含む文のコーパスを用いて, 幅広い話題から単語・多語PETの検出の有効性を実証した。
また,この課題に対する感情ベース手法の今後の可能性についても論じる。
関連論文リスト
- Dense X Retrieval: What Retrieval Granularity Should We Use? [56.90827473115201]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
本稿では,高密度検索のための新しい検索ユニット,命題を提案する。
実験により、提案のような細粒度単位によるコーパスのインデックス付けは、検索タスクにおける通過レベル単位を著しく上回っていることが明らかとなった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - FEED PETs: Further Experimentation and Expansion on the Disambiguation
of Potentially Euphemistic Terms [3.1648534725322666]
我々は,ヨルバ語,スペイン語,マンダリン中国語の3つの異なる言語で,新しいエウヘミズムコーパスを提示する。
トランスフォーマーは、あいまいなPETを分類するのが一般的である。
我々は,多言語トランスフォーマーモデルmBERTとXLM-RoBERTaを用いて,各言語でエウヘミズムの曖昧化実験を行う。
論文 参考訳(メタデータ) (2023-05-31T22:23:20Z) - Word Sense Induction with Knowledge Distillation from BERT [6.88247391730482]
本稿では、文脈における単語の感覚に注意を払って、事前学習された言語モデル(BERT)から複数の単語感覚を抽出する手法を提案する。
文脈的単語類似性および感覚誘導タスクの実験は、この手法が最先端のマルチセンス埋め込みよりも優れているか、あるいは競合していることを示している。
論文 参考訳(メタデータ) (2023-04-20T21:05:35Z) - Relational Sentence Embedding for Flexible Semantic Matching [86.21393054423355]
文埋め込みの可能性を明らかにするための新しいパラダイムとして,文埋め込み(Sentence Embedding, RSE)を提案する。
RSEは文関係のモデル化に有効で柔軟性があり、一連の最先端の埋め込み手法より優れている。
論文 参考訳(メタデータ) (2022-12-17T05:25:17Z) - A Report on the Euphemisms Detection Shared Task [2.9972063833424216]
本稿では,EMNLP 2022と共同で開催されている第3回言語処理ワークショップ(2022図)の共用課題について述べる。
参加者は、入力テキストを入力し、その中にエウヘミズムが含まれているかどうかを識別する、エウヘミズム検出タスクを調査するために招待された。
入力データは、GloWbEコーパスから収集された潜在的発語(PET)を含む文のコーパスである。
論文 参考訳(メタデータ) (2022-11-23T22:06:35Z) - Sentiment-Aware Word and Sentence Level Pre-training for Sentiment
Analysis [64.70116276295609]
SentiWSPは、WordレベルとSentenceレベルの事前トレーニングタスクを組み合わせた、Sentiment対応の事前トレーニング言語モデルである。
SentiWSPは、様々な文レベルおよびアスペクトレベルの感情分類ベンチマーク上で、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T12:25:29Z) - DICTDIS: Dictionary Constrained Disambiguation for Improved NMT [50.888881348723295]
我々は辞書から派生した複数の候補翻訳の曖昧さを解消する語彙制約付きNMTシステムであるDictDisを提案する。
我々は、規制、金融、工学を含む様々な分野において、英語・ヒンディー語・英語・ドイツ語文に関する広範な実験を通じて、DictDisの有用性を実証する。
論文 参考訳(メタデータ) (2022-10-13T13:04:16Z) - Entity Disambiguation with Entity Definitions [50.01142092276296]
ローカルモデルはEntity Disambiguation (ED)で最近驚くべきパフォーマンスを達成した
それまでの研究は、各候補者のテキスト表現として、ウィキペディアのタイトルのみを使うことに限られていた。
本稿では、この制限に対処し、より表現力のあるテキスト表現がそれを緩和できる範囲について検討する。
提案する6つのベンチマークのうち2つに新たな技術の現状を報告し,未知のパターンに対する一般化能力を強く改善する。
論文 参考訳(メタデータ) (2022-10-11T17:46:28Z) - CATs are Fuzzy PETs: A Corpus and Analysis of Potentially Euphemistic
Terms [2.666791490663749]
本研究は,GloWbEコーパスのサンプルテキストとともに,潜在的なエキシマティック用語(PET)のコーパスを提示する。
その結果,エキシマティックテキストの感情分析により,PETは一般的に否定的感情や攻撃的な感情を減少させることがわかった。
アノテーションタスクにおいて,PETをエウヘミスティックかどうかのラベル付けを依頼される場合,不一致の事例を観察する。
論文 参考訳(メタデータ) (2022-05-05T16:01:39Z) - POSSCORE: A Simple Yet Effective Evaluation of Conversational Search
with Part of Speech Labelling [25.477834359694473]
Google AssistantやMicrosoft Cortanaのような会話型検索システムは、ユーザーが自然言語対話を通じて検索システムとの通信を許可する新しい検索パラダイムを提供する。
本稿では,会話検索のための簡易かつ効果的な自動評価手法POSSCOREを提案する。
我々の指標は人間の嗜好と相関し、最先端の基準指標よりも大幅に改善できることが示される。
論文 参考訳(メタデータ) (2021-09-07T12:31:29Z) - More Than Words: Collocation Tokenization for Latent Dirichlet
Allocation Models [71.42030830910227]
モデルが異なる環境でクラスタリングの品質を測定するための新しい指標を提案する。
マージトークンでトレーニングされたトピックは、マージされていないモデルよりも、より明確で、一貫性があり、トピックを区別する効果が高いトピックキーをもたらすことを示す。
論文 参考訳(メタデータ) (2021-08-24T14:08:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。