論文の概要: Mapping Wordnets on the Fly with Permanent Sense Keys
- arxiv url: http://arxiv.org/abs/2303.01847v1
- Date: Fri, 3 Mar 2023 11:01:10 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-06 15:24:25.472431
- Title: Mapping Wordnets on the Fly with Permanent Sense Keys
- Title(参考訳): 永久的なセンスキーでフライでワードネットをマッピングする
- Authors: Eric Kafe
- Abstract要約: 我々はPWNセンスキーを使用するWordnetの任意のバージョン間のシンセットマッピングを自動的に導出するアルゴリズムを提案する。
これにより、古いWordNetリンクを更新でき、以前のマッピングがない新しい英語Wordnetバージョンとシームレスに相互運用できる。
提案手法は, それぞれシンセットオフセットを用いて, 協調型言語間指数(CILIバージョン1.0)をシンセット識別子として比較した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Most of the major databases on the semantic web have links to Princeton
WordNet (PWN) synonym set (synset) identifiers, which differ for each PWN
release, and are thus incompatible between versions. On the other hand, both
PWN and the more recent Open English Wordnet (OEWN) provide permanent word
sense identifiers (the sense keys), which can solve this interoperability
problem.
We present an algorithm that runs in linear time, to automatically derive a
synset mapping between any pair of Wordnet versions that use PWN sense keys.
This allows to update old WordNet links, and seamlessly interoperate with newer
English Wordnet versions for which no prior mapping exists.
By applying the proposed algorithm on the fly, at load time, we combine the
Open Multilingual Wordnet (OMW 1.4, which uses old PWN 3.0 identifiers) with
OEWN Edition 2021, and obtain almost perfect precision and recall. We compare
the results of our approach using respectively synset offsets, versus the
Collaborative InterLingual Index (CILI version 1.0) as synset identifiers, and
find that the synset offsets perform better than CILI 1.0 in all cases, except
a few ties.
- Abstract(参考訳): セマンティックウェブ上の主要なデータベースのほとんどはプリンストンワードネット(PWN)のシノニムセット(シンセット)へのリンクがあり、PWNリリース毎に異なるため、バージョン間で互換性がない。
一方、PWNとより最近のOpen English Wordnet(OEWN)は、この相互運用性問題を解決するために、恒久的な単語センス識別子(センスキー)を提供する。
pwn senseキーを使用するwordnetバージョン間のシンセクタマッピングを自動的に導出するために,線形時間で動作するアルゴリズムを提案する。
これにより、古いWordNetリンクを更新でき、以前のマッピングがない新しい英語Wordnetバージョンとシームレスに相互運用できる。
提案アルゴリズムをオンザフライで適用することにより,従来のPWN 3.0識別子を使用するOpen Multilingual Wordnet(OMW 1.4)をOEWN Edition 2021と組み合わせ,ほぼ完全な精度とリコールが得られる。
それぞれのシンセットオフセットを用いたアプローチの結果と,協調言語間インデックス(ciliバージョン1.0)をシンセット識別子として比較し,シンセットオフセットがcili 1.0よりも優れた性能を示すことを発見した。
関連論文リスト
- A General and Flexible Multi-concept Parsing Framework for Multilingual Semantic Matching [60.51839859852572]
我々は,テキストを多言語セマンティックマッチングのためのマルチコンセプトに分解し,NERモデルに依存するモデルからモデルを解放することを提案する。
英語データセットのQQPとMRPC、中国語データセットのMedical-SMについて包括的な実験を行った。
論文 参考訳(メタデータ) (2024-03-05T13:55:16Z) - Deep Emotions Across Languages: A Novel Approach for Sentiment
Propagation in Multilingual WordNets [4.532887563053358]
本稿では,感傷アノテーションを一部注釈付きWordNetからその全体へ,異なる言語でWordNetへ自動的に伝達する2つの新しい手法を紹介する。
言語間関係の大きい Princeton WordNet と Polish WordNet を用いて,提案した MSSE+CLDNS 法を広範囲に評価した。
以上の結果から,MSSE+CLDNS法は既存の伝搬法よりも優れており,複数の言語にまたがる感情的メタデータを用いたWordNetの強化の有効性が示唆された。
論文 参考訳(メタデータ) (2023-12-07T21:44:14Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - RWEN-TTS: Relation-aware Word Encoding Network for Natural
Text-to-Speech Synthesis [3.591224588041813]
膨大な数のTTSモデルが人間のような音声を生成する。
リレーショナル・アウェア・ワード・ネットワーク(RWEN)は,2つのモジュールをベースとした統語的・意味的情報を実現する。
実験結果から, 前作に比べて大幅な改善が見られた。
論文 参考訳(メタデータ) (2022-12-15T16:17:03Z) - Always Keep your Target in Mind: Studying Semantics and Improving
Performance of Neural Lexical Substitution [124.99894592871385]
本稿では,従来の言語モデルと最近の言語モデルの両方を用いた語彙置換手法の大規模比較研究を行う。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによるすでに競合する結果がさらに大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-06-07T16:16:19Z) - Towards Automatic Construction of Filipino WordNet: Word Sense Induction
and Synset Induction Using Sentence Embeddings [0.7214142393172727]
本研究では,2つの言語資源のみを用いた単語知覚誘導と合成誘導の手法を提案する。
結果として得られる感覚のインベントリとシノニムセットは、ワードネットを自動生成するのに使用することができる。
本研究は、誘導された単語感覚の30%が有効であり、誘導された合成セットの40%が新規な合成セットであることを示す。
論文 参考訳(メタデータ) (2022-04-07T06:50:37Z) - R$^2$-Net: Relation of Relation Learning Network for Sentence Semantic
Matching [58.72111690643359]
文意味マッチングのための関係学習ネットワーク(R2-Net)を提案する。
最初にBERTを使用して、グローバルな視点から入力文をエンコードします。
次に、cnnベースのエンコーダは、ローカルな視点からキーワードやフレーズ情報をキャプチャするように設計されている。
関係情報抽出にラベルを十分に活用するために,関係分類タスクの自己教師付き関係性を導入する。
論文 参考訳(メタデータ) (2020-12-16T13:11:30Z) - XL-WiC: A Multilingual Benchmark for Evaluating Semantic
Contextualization [98.61159823343036]
単語の意味を正確にモデル化する能力を評価するために,Word-in-Context データセット (WiC) を提案する。
我々は、XL-WiCという大規模なマルチ言語ベンチマークを提案し、12の新しい言語でゴールドスタンダードを特徴付けました。
実験結果から、ターゲット言語にタグ付けされたインスタンスが存在しない場合でも、英語データのみにトレーニングされたモデルは、競争力のあるパフォーマンスが得られることが示された。
論文 参考訳(メタデータ) (2020-10-13T15:32:00Z) - Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。
単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。
これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文 参考訳(メタデータ) (2020-10-05T17:19:10Z) - Dense Embeddings Preserving the Semantic Relationships in WordNet [2.9443230571766854]
WordNetにおける名詞と動詞の合成のための低次元ベクトル埋め込みを生成する新しい方法を提案する。
これをSense Spectrum(および埋め込みのためのSense Spectra)と呼ぶ。
感性スペクトルの学習に適したラベルを作成するために,WordNetにおける名詞と動詞の合成のための新しい類似度尺度を考案した。
論文 参考訳(メタデータ) (2020-04-22T21:09:47Z) - Multi-Fusion Chinese WordNet (MCW) : Compound of Machine Learning and
Manual Correction [7.471172518764192]
文法と意味論の問題を解決するために,中国語の5つのワーネットが開発された。
その中には、ノースイースタン大学 Chinese WordNet (NEW), Sinica Bilingual Ontological WordNet (BOW), Southeast University Chinese WordNet (SEW), Taiwan University Chinese WordNet (CWN), Chinese Open WordNet (COW)などが含まれる。
我々は、これらの欠点を補うために、Multi-Fusion Chinese Wordnet(MCW)と呼ばれる新しい中国語のワードネットを作ることに決めた。
論文 参考訳(メタデータ) (2020-02-05T12:44:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。