論文の概要: Definition generation for lexical semantic change detection
- arxiv url: http://arxiv.org/abs/2406.14167v1
- Date: Thu, 20 Jun 2024 10:13:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-06-21 14:21:16.573386
- Title: Definition generation for lexical semantic change detection
- Title(参考訳): 語彙意味変化検出のための定義生成
- Authors: Mariia Fedorova, Andrey Kutuzov, Yves Scherrer,
- Abstract要約: ダイアクロニック辞書意味変化検出(LSCD)タスクにおける意味表現として,大言語モデルによって生成された文脈化された単語定義を用いる。
つまり、生成された定義を感覚として使用し、比較対象単語の変化スコアを、比較対象単語の分布を2つの期間に比較して検索する。
本手法は従来の非教師付きLSCD法と同等か優れる。
- 参考スコア(独自算出の注目度): 3.7297237438000788
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We use contextualized word definitions generated by large language models as semantic representations in the task of diachronic lexical semantic change detection (LSCD). In short, generated definitions are used as `senses', and the change score of a target word is retrieved by comparing their distributions in two time periods under comparison. On the material of five datasets and three languages, we show that generated definitions are indeed specific and general enough to convey a signal sufficient to rank sets of words by the degree of their semantic change over time. Our approach is on par with or outperforms prior non-supervised sense-based LSCD methods. At the same time, it preserves interpretability and allows to inspect the reasons behind a specific shift in terms of discrete definitions-as-senses. This is another step in the direction of explainable semantic change modeling.
- Abstract(参考訳): ダイアクロニック語彙変化検出(LSCD)タスクにおける意味表現として,大規模言語モデルによって生成された文脈的単語定義を用いる。
簡単に言えば、生成された定義を「センス」として使用し、比較中の2つの期間における分布を比較することにより、対象単語の変化スコアを検索する。
5つのデータセットと3つの言語を用いて、生成した定義は、時間とともに意味の変化の度合いによって単語の集合をランク付けするのに十分な信号を伝えるのに十分であることを示す。
本手法は,従来の非教師付きセンスベースLSCD法と同等か優れる。
同時に、解釈可能性を保持し、個別の定義=感覚の観点から、特定のシフトの背後にある理由を検査することができる。
これは、説明可能なセマンティックチェンジモデリングの方向性の別のステップである。
関連論文リスト
- Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。
意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。
グループ化されたサブワードの検査では 様々な意味的類似性を示します
論文 参考訳(メタデータ) (2024-11-07T08:38:32Z) - Using Synchronic Definitions and Semantic Relations to Classify Semantic Change Types [1.3436368800886478]
本稿では、同期語彙関係と単語の意味定義の両方から情報を活用するモデルを提案する。
具体的には,WordNet の構文定義と階層情報を用いて,Blank (1997) のセマンティックチェンジ型データセットのデジタル化バージョンでそれをテストする。
論文 参考訳(メタデータ) (2024-06-05T16:52:21Z) - "Definition Modeling: To model definitions." Generating Definitions With
Little to No Semantics [0.4061135251278187]
我々は、このタスクが期待するほど意味論を含まないかもしれないという証拠を提示する。
文献から得られた先行モデルは、明示的なポリセミズムのような意味的側面にかなり敏感であることを示す。
論文 参考訳(メタデータ) (2023-06-14T11:08:38Z) - Interpretable Word Sense Representations via Definition Generation: The
Case of Semantic Change Analysis [3.515619810213763]
本稿では,文脈化された単語の用法を解釈可能な単語と単語感覚表現として自動生成する自然言語定義を提案する。
得られた感覚ラベルが、意味変化分析に既存のアプローチをより解釈可能なものにする方法を実証する。
論文 参考訳(メタデータ) (2023-05-19T20:36:21Z) - Unsupervised Semantic Variation Prediction using the Distribution of
Sibling Embeddings [17.803726860514193]
単語の意味的変化の検出は,様々なNLPアプリケーションにおいて重要な課題である。
意味表現だけではそのような意味的バリエーションを正確に捉えることはできないと我々は主張する。
対象単語の文脈的埋め込みのコホート全体を利用する手法を提案する。
論文 参考訳(メタデータ) (2023-05-15T13:58:21Z) - Distance Based Image Classification: A solution to generative
classification's conundrum? [70.43638559782597]
差別的境界は、何によって意味論を定義するため、直観に反するものであると論じる。
本稿では,シェル理論の階層的生成過程によって意味的因子が許容される新しい生成モデルを提案する。
本モデルを用いて,意味的手がかりを保ちながら雑音の影響を抑える分類手法を開発した。
論文 参考訳(メタデータ) (2022-10-04T03:35:13Z) - Connect-the-Dots: Bridging Semantics between Words and Definitions via
Aligning Word Sense Inventories [47.03271152494389]
Word Sense Disambiguationは、そのコンテキストに応じて、ある単語の正確な意味を自動的に識別することを目的としている。
既存の教師付きモデルは、限られた訓練データのために稀な単語感覚の正確な予測に苦慮している。
我々は,定義文を異なる意味の在庫から同じ意味に整合させ,豊富な語彙知識を収集する光沢アライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-27T00:04:33Z) - Fake it Till You Make it: Self-Supervised Semantic Shifts for
Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。
本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。
3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文 参考訳(メタデータ) (2021-01-30T18:59:43Z) - SChME at SemEval-2020 Task 1: A Model Ensemble for Detecting Lexical
Semantic Change [58.87961226278285]
本稿では,SemEval-2020 Task 1における語彙意味変化の教師なし検出法であるSChMEについて述べる。
SChMEは、分布モデル(単語埋め込み)とワード周波数モデルの信号を組み合わせたモデルアンサンブルを使用し、各モデルは、その特徴に応じて単語が苦しむ確率を示す投票を行う。
論文 参考訳(メタデータ) (2020-12-02T23:56:34Z) - SST-BERT at SemEval-2020 Task 1: Semantic Shift Tracing by Clustering in
BERT-based Embedding Spaces [63.17308641484404]
本稿では,異なる単語の意味の表現として,各単語の異なる事象のクラスタを特定することを提案する。
得られたクラスタの分解は、自然に4つのターゲット言語において、各ターゲットワードごとの意味的シフトのレベルを定量化することができる。
当社のアプローチは,提供されたすべてのSemEvalベースラインを抜いて,個別(言語毎)と全体の両方で良好に動作します。
論文 参考訳(メタデータ) (2020-10-02T08:38:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。