論文の概要: Word Sense Linking: Disambiguating Outside the Sandbox
- arxiv url: http://arxiv.org/abs/2412.09370v1
- Date: Thu, 12 Dec 2024 15:38:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-13 13:34:16.607280
- Title: Word Sense Linking: Disambiguating Outside the Sandbox
- Title(参考訳): 単語センスリンク:サンドボックスの外の曖昧さ
- Authors: Andrei Stefan Bejgu, Edoardo Barba, Luigi Procopio, Alberte Fernández-Castro, Roberto Navigli,
- Abstract要約: 我々は、入力テキストと参照センスのインベントリが与えられた場合、どの範囲を曖昧にするかを識別し、最も適切な意味にリンクする必要がある、Word Sense Linking (WSL) という新しいタスクを提案する。
我々は,このタスクのためのトランスフォーマーベースのアーキテクチャを提案し,WSLにスケールした最新のWSDシステムの性能と性能の両方を徹底的に評価した。
- 参考スコア(独自算出の注目度): 45.99018543644643
- License:
- Abstract: Word Sense Disambiguation (WSD) is the task of associating a word in a given context with its most suitable meaning among a set of possible candidates. While the task has recently witnessed renewed interest, with systems achieving performances above the estimated inter-annotator agreement, at the time of writing it still struggles to find downstream applications. We argue that one of the reasons behind this is the difficulty of applying WSD to plain text. Indeed, in the standard formulation, models work under the assumptions that a) all the spans to disambiguate have already been identified, and b) all the possible candidate senses of each span are provided, both of which are requirements that are far from trivial. In this work, we present a new task called Word Sense Linking (WSL) where, given an input text and a reference sense inventory, systems have to both identify which spans to disambiguate and then link them to their most suitable meaning.We put forward a transformer-based architecture for the task and thoroughly evaluate both its performance and those of state-of-the-art WSD systems scaled to WSL, iteratively relaxing the assumptions of WSD. We hope that our work will foster easier integration of lexical semantics into downstream applications.
- Abstract(参考訳): 単語センス曖昧化(英: Word Sense Disambiguation、WSD)とは、ある文脈における単語を、可能な候補の集合の中で最も適切な意味に関連付けるタスクである。
このタスクは、最近再び関心を惹き付けており、アノテータ間契約よりも高いパフォーマンスを達成するシステムもあるが、執筆時点では、下流のアプリケーションを見つけるのに苦戦している。
この背景にある理由の1つは、WSDを平易なテキストに適用することの難しさです。
実際、標準定式化では、モデルは仮定の下で機能する。
a) 曖昧にするためのすべてのスパンは、既に特定されており、
b) 各スパンの可能なすべての候補感覚が提供され,どちらも自明さからかけ離れている要件である。
本稿では、入力テキストと参照センスのインベントリが与えられた場合、どの範囲を曖昧にするかを識別し、最も適切な意味にリンクする必要がある新しいタスクであるWord Sense Linking(WSL)を提案し、そのタスクのためにトランスフォーマーベースのアーキテクチャを提案し、WSLにスケールした最先端のWSDシステムの性能と性能の両方を徹底的に評価し、WSDの仮定を反復的に緩和する。
下流アプリケーションへの語彙的セマンティクスの統合がより容易になることを期待しています。
関連論文リスト
- Can LLMs assist with Ambiguity? A Quantitative Evaluation of various Large Language Models on Word Sense Disambiguation [5.816964541847194]
本研究では,Large Language Models (LLMs) を用いた単語センス曖昧化(WSD)の改善について検討する。
提案手法では,プロンプトをPOSタグ,曖昧な単語のシノニム,アスペクトベース・センス・フィルタリング,少数ショットプロンプトで支援する。
数ショットのChain of Thought (COT)プロンプトベースのアプローチを利用することで、本研究はパフォーマンスを大幅に改善したことを示す。
論文 参考訳(メタデータ) (2024-11-27T13:35:32Z) - What do Language Models know about word senses? Zero-Shot WSD with
Language Models and Domain Inventories [23.623074512572593]
我々は,言語モデルが推論時間における感覚間の識別能力の程度を調査することを目的としている。
我々は、単語感覚とドメインの関係を利用して、単語センスの曖昧さ(WSD)をテキスト・エンターテイメント問題として位置づける。
以上の結果から,本手法は実効性があり,教師付きシステムに近いことが示唆された。
論文 参考訳(メタデータ) (2023-02-07T09:55:07Z) - Sentiment-Aware Word and Sentence Level Pre-training for Sentiment
Analysis [64.70116276295609]
SentiWSPは、WordレベルとSentenceレベルの事前トレーニングタスクを組み合わせた、Sentiment対応の事前トレーニング言語モデルである。
SentiWSPは、様々な文レベルおよびアスペクトレベルの感情分類ベンチマーク上で、最先端のパフォーマンスを新たに達成する。
論文 参考訳(メタデータ) (2022-10-18T12:25:29Z) - Always Keep your Target in Mind: Studying Semantics and Improving
Performance of Neural Lexical Substitution [124.99894592871385]
本稿では,従来の言語モデルと最近の言語モデルの両方を用いた語彙置換手法の大規模比較研究を行う。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによるすでに競合する結果がさらに大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-06-07T16:16:19Z) - Connect-the-Dots: Bridging Semantics between Words and Definitions via
Aligning Word Sense Inventories [47.03271152494389]
Word Sense Disambiguationは、そのコンテキストに応じて、ある単語の正確な意味を自動的に識別することを目的としている。
既存の教師付きモデルは、限られた訓練データのために稀な単語感覚の正確な予測に苦慮している。
我々は,定義文を異なる意味の在庫から同じ意味に整合させ,豊富な語彙知識を収集する光沢アライメントアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-27T00:04:33Z) - Semantic Distance: A New Metric for ASR Performance Analysis Towards
Spoken Language Understanding [26.958001571944678]
本稿では,asrシステムの代替評価指標として,新しい意味距離尺度(semdist)を提案する。
提案したメトリクスが,インテント認識,セマンティック解析,名前付きエンティティ認識など,さまざまな下流タスクに有効であることを実証する。
論文 参考訳(メタデータ) (2021-04-05T20:25:07Z) - ERICA: Improving Entity and Relation Understanding for Pre-trained
Language Models via Contrastive Learning [97.10875695679499]
そこで本研究では, ERICA という新たなコントラスト学習フレームワークを提案し, エンティティとその関係をテキストでより深く理解する。
実験の結果,提案する erica フレームワークは文書レベルの言語理解タスクにおいて一貫した改善を実現することがわかった。
論文 参考訳(メタデータ) (2020-12-30T03:35:22Z) - Moving Down the Long Tail of Word Sense Disambiguation with
Gloss-Informed Biencoders [79.38278330678965]
Word Sense Disambiguation (WSD)の主な障害は、単語感覚が均一に分散されないことである。
本稿では,(1)対象語とその周囲の文脈を独立に埋め込んだバイエンコーダモデルを提案する。
論文 参考訳(メタデータ) (2020-05-06T04:21:45Z) - Semantic Relatedness for Keyword Disambiguation: Exploiting Different
Embeddings [0.0]
本稿では,学習時に未知の外部インベントリ(オントロジー)によって提供される単語と感覚間の意味的関連性に基づくキーワードの曖昧さに対するアプローチを提案する。
実験の結果,特定のドメインをトレーニングすることなく,単語センスの曖昧さ (WSD) を適用した場合に,この手法が技術状況に匹敵する結果が得られることがわかった。
論文 参考訳(メタデータ) (2020-02-25T16:44:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。