論文の概要: ConMeC: A Dataset for Metonymy Resolution with Common Nouns
- arxiv url: http://arxiv.org/abs/2502.06087v2
- Date: Tue, 11 Feb 2025 03:39:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-02-12 14:08:19.862546
- Title: ConMeC: A Dataset for Metonymy Resolution with Common Nouns
- Title(参考訳): ConMeC: 共通名詞によるMetonymy解決のためのデータセット
- Authors: Saptarshi Ghosh, Tianyu Jiang,
- Abstract要約: 我々は、NLPシステムは、文脈における共通名詞のメトニム的使用を識別できるべきであると論じる。
6,000の文からなる新しいメトニミーデータセットConMeCを作成します。
本稿では,大規模言語モデルを用いたメトニミー検出のためのチェーン・オブ・ソートに基づくプロンプト手法を提案する。
- 参考スコア(独自算出の注目度): 7.940559903592699
- License:
- Abstract: Metonymy plays an important role in our daily communication. People naturally think about things using their most salient properties or commonly related concepts. For example, by saying "The bus decided to skip our stop today," we actually mean that the bus driver made the decision, not the bus. Prior work on metonymy resolution has mainly focused on named entities. However, metonymy involving common nouns (such as desk, baby, and school) is also a frequent and challenging phenomenon. We argue that NLP systems should be capable of identifying the metonymic use of common nouns in context. We create a new metonymy dataset ConMeC, which consists of 6,000 sentences, where each sentence is paired with a target common noun and annotated by humans to indicate whether that common noun is used metonymically or not in that context. We also introduce a chain-of-thought based prompting method for detecting metonymy using large language models (LLMs). We evaluate our LLM-based pipeline, as well as a supervised BERT model on our dataset and three other metonymy datasets. Our experimental results demonstrate that LLMs could achieve performance comparable to the supervised BERT model on well-defined metonymy categories, while still struggling with instances requiring nuanced semantic understanding. Our dataset is publicly available at: https://github.com/SaptGhosh/ConMeC.
- Abstract(参考訳): Metonymyは日々のコミュニケーションにおいて重要な役割を担います。
人々は自然に、最も健全な性質や一般的に関連する概念を使って物事について考えます。
例えば、「今日バスは停留所をスキップすることにしました」と言うと、バスの運転手はバスではなく、その決定を下しました。
メトニミー解決に関する以前の研究は、主に名前付きエンティティに焦点を当てていた。
しかし、一般的な名詞(例えば、机、赤ちゃん、学校)を含むメトニミーもまた、頻繁で困難な現象である。
我々は、NLPシステムは、文脈における共通名詞のメトニム的使用を識別できるべきであると論じる。
我々は6,000の文からなる新しいメトニマスデータセットConMeCを作成し、そこでは各文を目標の共通名詞とペア付けし、その文脈で共通名詞がメトニム的に使用されるか否かを示す。
また,大規模言語モデル (LLM) を用いたメトニミー検出のためのチェーン・オブ・シンセサイザー手法を提案する。
LLMベースのパイプラインと、私たちのデータセットと他の3つのメトニミーデータセットの教師付きBERTモデルを評価します。
実験の結果, LLMは, 厳密な意味理解を必要とするケースに悩まされながら, 適切に定義されたメトニミーカテゴリにおける教師付きBERTモデルに匹敵する性能を実現することができた。
私たちのデータセットは、https://github.com/SaptGhosh/ConMeC.comで公開されています。
関連論文リスト
- Resolving Regular Polysemy in Named Entities [1.124958340749622]
本稿では,中国語のWordnet(CWN)に対して共通語を曖昧にするための単語感覚曖昧化(WSD)モデルと,ドットオブジェクトとしての固有名を提案する。
比較的スパースな意味のデータセットであっても,一般名詞と固有名詞の両方で競争結果が得られることを示す。
論文 参考訳(メタデータ) (2024-01-18T07:18:03Z) - Toward a Critical Toponymy Framework for Named Entity Recognition: A
Case Study of Airbnb in New York City [3.772536125765649]
批判的トポニミー(Critical toponymy)は、権力、資本、抵抗のダイナミクスを地名と彼らが参照する場所を通して調べている。
我々は、2010年代のニューヨーク市Airbnbリスティング47,440件の注釈付きデータセットを通じて、人々が場所を参照する方法を文化資本と経済資本がどのように形作るかを測定する方法を開発した。
本研究は, 地域, 住宅, 観光市場, ジェントリフィケーションなど, これまでに検討されてきた様々な言語信号について, 批判的トポニミーの新たな方向性を示唆するものである。
論文 参考訳(メタデータ) (2023-10-23T19:09:07Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Disambiguation of Company names via Deep Recurrent Networks [101.90357454833845]
企業名文字列の埋め込みである教師付き学習を通じて,Siamese LSTM Network を抽出する手法を提案する。
私たちは、ラベル付けされるサンプルを優先するActive Learningアプローチが、より効率的な全体的な学習パイプラインをもたらす方法を分析します。
論文 参考訳(メタデータ) (2023-03-07T15:07:57Z) - Chinese Word Sense Embedding with SememeWSD and Synonym Set [17.37973450772783]
本稿では,多文単語のすべての感覚に異なるベクトルを割り当てるために,SememeWSD Synonym(SWSDS)モデルを提案する。
OpenHowNetから単語センスの上位10の同義語を取得し、単語センスのベクトルとして同義語の平均ベクトルを算出する。
実験では,Gensimのwmdistance法を用いて意味的類似性計算におけるSWSDSモデルの評価を行った。
論文 参考訳(メタデータ) (2022-06-29T03:42:03Z) - Impact of Target Word and Context on End-to-End Metonymy Detection [11.244268226976478]
メトニミー(Metonymy)は、ある実体が別の関連エンティティによって参照される言語である。
これまで、メトニミー検出法は、文中の1つの名詞句のみを曖昧にしようと試みてきた。
目的語はデータセットのメトニミーの検出にはあまり役に立たないことを示す。
論文 参考訳(メタデータ) (2021-12-06T18:59:27Z) - ALL Dolphins Are Intelligent and SOME Are Friendly: Probing BERT for
Nouns' Semantic Properties and their Prototypicality [4.915907527975786]
我々は、参照範囲を制限しない形容詞で表される英語の名詞を構成するためにBERT(Devlin et al.)を探索する。
本研究は,名詞間の関連性の強さと意味的特徴を捉える心理言語学的データセットに基づく。
そこで, BERTでは, 形容詞の意味を推論する上で必要な情報を活用することができた。
論文 参考訳(メタデータ) (2021-10-12T21:43:37Z) - SChME at SemEval-2020 Task 1: A Model Ensemble for Detecting Lexical
Semantic Change [58.87961226278285]
本稿では,SemEval-2020 Task 1における語彙意味変化の教師なし検出法であるSChMEについて述べる。
SChMEは、分布モデル(単語埋め込み)とワード周波数モデルの信号を組み合わせたモデルアンサンブルを使用し、各モデルは、その特徴に応じて単語が苦しむ確率を示す投票を行う。
論文 参考訳(メタデータ) (2020-12-02T23:56:34Z) - NLP-CIC @ DIACR-Ita: POS and Neighbor Based Distributional Models for
Lexical Semantic Change in Diachronic Italian Corpora [62.997667081978825]
本稿では,イタリア語に対する教師なし語彙意味変化のシステムと知見について述べる。
その課題は、対象の単語が時間とともにその意味を進化させたかどうかを判断することであり、それは2つの時間固有のデータセットからの原文のみに依存する。
本研究では,各期間に対象単語を表す2つのモデルを提案し,しきい値と投票方式を用いて変化単語を予測する。
論文 参考訳(メタデータ) (2020-11-07T11:27:18Z) - CycAs: Self-supervised Cycle Association for Learning Re-identifiable
Descriptions [61.724894233252414]
本稿では,人物再識別(re-ID)問題に対する自己教師型学習手法を提案する。
既存の教師なしのメソッドは通常、ビデオトラッカーやクラスタリングのような擬似ラベルに依存している。
疑似ラベルを使わずに、生のビデオから歩行者の埋め込みを学習できる別の教師なし手法を導入する。
論文 参考訳(メタデータ) (2020-07-15T09:52:35Z) - Lexical Sememe Prediction using Dictionary Definitions by Capturing
Local Semantic Correspondence [94.79912471702782]
セメムは人間の言語の最小の意味単位として定義されており、多くのNLPタスクで有用であることが証明されている。
本稿では,このようなマッチングを捕捉し,セメムを予測できるセメム対応プールモデルを提案する。
我々は,有名なSememe KB HowNetのモデルとベースライン手法を評価し,そのモデルが最先端のパフォーマンスを実現することを発見した。
論文 参考訳(メタデータ) (2020-01-16T17:30:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。