論文の概要: Enriching Word Usage Graphs with Cluster Definitions
- arxiv url: http://arxiv.org/abs/2403.18024v1
- Date: Tue, 26 Mar 2024 18:22:05 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-28 21:24:43.315031
- Title: Enriching Word Usage Graphs with Cluster Definitions
- Title(参考訳): クラスタ定義による単語使用グラフの強化
- Authors: Mariia Fedorova, Andrey Kutuzov, Nikolay Arefyev, Dominik Schlechtweg,
- Abstract要約: 本稿では,複数の言語に対する既存のWUGを,意味定義として機能するクラスタラベルに富んだ単語使用グラフ(WUG)のデータセットを提案する。
それらは、微調整エンコーダ-デコーダ言語モデルによってスクラッチから生成される。
人体評価の結果、これらの定義はWordNetから選択した定義よりもWUGの既存のクラスタとよく一致していることがわかった。
- 参考スコア(独自算出の注目度): 5.3135532294740475
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We present a dataset of word usage graphs (WUGs), where the existing WUGs for multiple languages are enriched with cluster labels functioning as sense definitions. They are generated from scratch by fine-tuned encoder-decoder language models. The conducted human evaluation has shown that these definitions match the existing clusters in WUGs better than the definitions chosen from WordNet by two baseline systems. At the same time, the method is straightforward to use and easy to extend to new languages. The resulting enriched datasets can be extremely helpful for moving on to explainable semantic change modeling.
- Abstract(参考訳): 本稿では、単語使用グラフ(WUG)のデータセットを提示し、複数の言語用の既存のWUGを、意味定義として機能するクラスタラベルで豊かにする。
それらは、微調整エンコーダ-デコーダ言語モデルによってスクラッチから生成される。
評価の結果、これらの定義はWordNetから選択した2つのベースラインシステムよりもWUGの既存のクラスタとよく一致していることがわかった。
同時に、このメソッドは使いやすく、新しい言語への拡張も容易である。
結果として得られたリッチなデータセットは、説明可能なセマンティックチェンジモデリングに移行する上で非常に役立ちます。
関連論文リスト
- LGDE: Local Graph-based Dictionary Expansion [0.923607423080658]
ローカルグラフベース辞書拡張(英: Local Graph-based Dictionary Expansion、LGDE)は、単語の意味的近傍をデータ駆動で発見する手法である。
本稿では,LGDEが単語の類似性に基づくしきい値法よりもはるかに優れた性能で,キーワードのリストを充実させることを示す。
実験結果と専門ユーザ評価の結果から,LGDEは,多様体学習に基づく類似性ネットワークにより,より有用なキーワードでシード辞書を拡張していることが示唆された。
論文 参考訳(メタデータ) (2024-05-13T14:07:15Z) - Contextual Dictionary Lookup for Knowledge Graph Completion [32.493168863565465]
知識グラフ補完(KGC)は、知識グラフの不完全性(KGs)を解決することを目的として、既知の三重項から欠落するリンクを予測する。
既存の埋め込みモデルは、それぞれの関係を一意なベクトルにマッピングし、異なる実体の下でそれらの特定の粒度のセマンティクスを見渡す。
本稿では,従来の埋め込みモデルを用いて,関係の微粒なセマンティクスをエンド・ツー・エンドで学習することのできる,文脈辞書検索を利用した新しい手法を提案する。
論文 参考訳(メタデータ) (2023-06-13T12:13:41Z) - Interpretable Word Sense Representations via Definition Generation: The
Case of Semantic Change Analysis [3.515619810213763]
本稿では,文脈化された単語の用法を解釈可能な単語と単語感覚表現として自動生成する自然言語定義を提案する。
得られた感覚ラベルが、意味変化分析に既存のアプローチをより解釈可能なものにする方法を実証する。
論文 参考訳(メタデータ) (2023-05-19T20:36:21Z) - Always Keep your Target in Mind: Studying Semantics and Improving
Performance of Neural Lexical Substitution [124.99894592871385]
本稿では,従来の言語モデルと最近の言語モデルの両方を用いた語彙置換手法の大規模比較研究を行う。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによるすでに競合する結果がさらに大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-06-07T16:16:19Z) - Graph Adaptive Semantic Transfer for Cross-domain Sentiment
Classification [68.06496970320595]
クロスドメイン感情分類(CDSC)は、ソースドメインから学んだ伝達可能なセマンティクスを使用して、ラベルなしのターゲットドメインにおけるレビューの感情を予測することを目的としている。
本稿では、単語列と構文グラフの両方からドメイン不変セマンティクスを学習できる適応型構文グラフ埋め込み法であるグラフ適応意味伝達(GAST)モデルを提案する。
論文 参考訳(メタデータ) (2022-05-18T07:47:01Z) - Taxonomy Enrichment with Text and Graph Vector Representations [61.814256012166794]
我々は,既存の分類学に新たな語を加えることを目的とした分類学の豊かさの問題に対処する。
我々は,この課題に対して,少ない労力で高い結果を得られる新しい手法を提案する。
我々は、異なるデータセットにわたる最先端の結果を達成し、ミスの詳細なエラー分析を提供する。
論文 参考訳(メタデータ) (2022-01-21T09:01:12Z) - Cross-lingual Transfer for Text Classification with Dictionary-based
Heterogeneous Graph [10.64488240379972]
言語間テキスト分類では,高ソース言語におけるタスク固有トレーニングデータが利用可能であることが求められている。
このようなトレーニングデータの収集は,ラベル付けコストやタスク特性,プライバシの懸念などによって不可能になる可能性がある。
本稿では,ハイソース言語とバイリンガル辞書のタスク非依存語埋め込みのみを利用する代替手法を提案する。
論文 参考訳(メタデータ) (2021-09-09T16:40:40Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z) - Infusing Finetuning with Semantic Dependencies [62.37697048781823]
シンタックスとは異なり、セマンティクスは今日の事前訓練モデルによって表面化されないことを示す。
次に、畳み込みグラフエンコーダを使用して、タスク固有の微調整にセマンティック解析を明示的に組み込む。
論文 参考訳(メタデータ) (2020-12-10T01:27:24Z) - XL-WiC: A Multilingual Benchmark for Evaluating Semantic
Contextualization [98.61159823343036]
単語の意味を正確にモデル化する能力を評価するために,Word-in-Context データセット (WiC) を提案する。
我々は、XL-WiCという大規模なマルチ言語ベンチマークを提案し、12の新しい言語でゴールドスタンダードを特徴付けました。
実験結果から、ターゲット言語にタグ付けされたインスタンスが存在しない場合でも、英語データのみにトレーニングされたモデルは、競争力のあるパフォーマンスが得られることが示された。
論文 参考訳(メタデータ) (2020-10-13T15:32:00Z) - Combining Neural Language Models for WordSense Induction [0.5199765487172326]
単語感覚誘導(WSI)は、この単語の表現された感覚に応じて曖昧な単語の発生をグループ化する問題である。
近年,この課題に対する新たなアプローチが提案され,特定の文脈におけるあいまいな単語の代用となる可能性が示唆された。
本研究では、このアプローチをロシア語に適用し、2つの方法で改善する。
論文 参考訳(メタデータ) (2020-06-23T17:57:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。