論文の概要: Automatic Construction of Sememe Knowledge Bases via Dictionaries
- arxiv url: http://arxiv.org/abs/2105.12585v1
- Date: Wed, 26 May 2021 14:41:01 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 13:41:56.449172
- Title: Automatic Construction of Sememe Knowledge Bases via Dictionaries
- Title(参考訳): 辞書によるセメム知識ベースの自動構築
- Authors: Fanchao Qi, Yangyi Chen, Fengyu Wang, Zhiyuan Liu, Xiao Chen, Maosong
Sun
- Abstract要約: セメム知識ベース(SKB)は、セメムを自然言語処理に適用することを可能にする。
ほとんどの言語はSKBを持っておらず、手作業によるSKBの構築は時間と労力がかかる。
本稿では,既存の辞書を用いてSKBを構築するための簡易かつ完全自動手法を提案する。
- 参考スコア(独自算出の注目度): 53.8700954466358
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: A sememe is defined as the minimum semantic unit in linguistics. Sememe
knowledge bases (SKBs), which comprise words annotated with sememes, enable
sememes to be applied to natural language processing. So far a large body of
research has showcased the unique advantages and effectiveness of SKBs in
various tasks. However, most languages have no SKBs, and manual construction of
SKBs is time-consuming and labor-intensive. To tackle this challenge, we
propose a simple and fully automatic method of building an SKB via an existing
dictionary. We use this method to build an English SKB and a French SKB, and
conduct comprehensive evaluations from both intrinsic and extrinsic
perspectives. Experimental results demonstrate that the automatically built
English SKB is even superior to HowNet, the most widely used SKB that takes
decades to build manually. And both the English and French SKBs can bring
obvious performance enhancement in multiple downstream tasks. All the code and
data of this paper (except the copyrighted dictionaries) can be obtained at
https://github.com/thunlp/DictSKB.
- Abstract(参考訳): セメムは言語学における最小意味単位として定義される。
セメム知識ベース(SKB)は、セメムを付加した単語で構成され、セメムを自然言語処理に適用することができる。
これまでのところ、多くの研究が様々なタスクにおけるskbのユニークな利点と効果を示してきた。
しかし、ほとんどの言語にはskbがなく、skbの手動構成は時間消費と労働集約である。
そこで本研究では,既存の辞書を用いた簡易かつ完全自動的なskb構築手法を提案する。
本手法を用いて英語skbとフランス語skbを構築し,本質的および極端的観点から総合的な評価を行う。
実験の結果、自動構築されたイングランドのskbは、手作業で構築するのに数十年かかる最も広く使われているskbであるhownetよりも優れていることが判明した。
また、英語とフランス語のSKBは、複数の下流タスクにおいて明らかにパフォーマンスの向上をもたらす。
この論文のコードとデータ(著作権付き辞書を除く)はhttps://github.com/thunlp/DictSKBで取得できる。
関連論文リスト
- Translate Meanings, Not Just Words: IdiomKB's Role in Optimizing
Idiomatic Translation with Language Models [57.60487455727155]
idiomsは非構成的な性質を持ち、Transformerベースのシステムに特別な課題を提起する。
既存の知識ベース(KB)を使ってイディオムを置き換える伝統的な手法は、しばしばスケールとコンテキストの認識を欠いている。
大規模なLMを用いて開発した多言語イディオムKB (IdiomKB) を提案する。
このKBはBLOOMZ (7.1B)、Alpaca (7B)、InstructGPT (6.7B)のようなより小さなモデルによるより良い翻訳を促進する
論文 参考訳(メタデータ) (2023-08-26T21:38:31Z) - Cross-Lingual Question Answering over Knowledge Base as Reading
Comprehension [61.079852289005025]
知識ベース(xKBQA)に対する言語間質問応答は、提供された知識ベースとは異なる言語での質問に答えることを目的としている。
xKBQAが直面する大きな課題の1つは、データアノテーションのコストが高いことである。
読解パラダイムにおけるxKBQAの新しいアプローチを提案する。
論文 参考訳(メタデータ) (2023-02-26T05:52:52Z) - mOKB6: A Multilingual Open Knowledge Base Completion Benchmark [38.91023041725193]
私たちは、ウィキペディアから6言語(英語を含む)の事実を含む、mOKB6と呼ばれる最初の多言語Open KBCデータセットを構築した。
我々は,タスクのためのいくつかのモデルを試行し,共有埋め込み空間と事実の翻訳の助けを借りて,言語を組み合わせるという一貫した利点を観察する。
論文 参考訳(メタデータ) (2022-11-13T17:10:49Z) - The Analysis about Building Cross-lingual Sememe Knowledge Base Based on
Deep Clustering Network [0.7310043452300736]
Sememe knowledge bases (KB) には、Sememeに注釈を付けた単語が含まれている。
本稿では,ディープクラスタリングネットワーク(DCN)に基づく教師なしの手法を提案する。
論文 参考訳(メタデータ) (2022-08-10T17:40:45Z) - Sememe Prediction for BabelNet Synsets using Multilingual and Multimodal
Information [89.24684041258747]
セメムナレッジベース(KB)は、手動でセメムでアノテートすることで構築される。
既存のSememe KBはいくつかの言語しかサポートしていないため、Sememeの利用を妨げている。
本稿では,多言語百科事典BabelNetをベースとした多言語セメムKBの構築を目的とする。
論文 参考訳(メタデータ) (2022-03-14T18:37:09Z) - Prix-LM: Pretraining for Multilingual Knowledge Base Construction [59.02868906044296]
複数言語による知識構築と完成のための統合フレームワークである Prix-LM を提案する。
既存の多言語KBから抽出したモノリンガルトリプルとクロスリンガルリンクの2種類の知識を利用する。
複数の言語におけるリンク予測、言語間リンク、バイリンガル語彙誘導など、標準的なエンティティ関連タスクの実験は、その効果を実証している。
論文 参考訳(メタデータ) (2021-10-16T02:08:46Z) - Reasoning Over Virtual Knowledge Bases With Open Predicate Relations [85.19305347984515]
Open Predicate Query Language (OPQL) を紹介します。
OPQLは、テキストから完全にトレーニングされた仮想知識ベース(VKB)を構築する方法である。
OPQLは2つの異なるKB推論タスクにおいて、以前のVKBメソッドよりも優れていることを示す。
論文 参考訳(メタデータ) (2021-02-14T01:29:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。