論文の概要: A Novel Word Sense Disambiguation Approach Using WordNet Knowledge Graph
- arxiv url: http://arxiv.org/abs/2101.02875v1
- Date: Fri, 8 Jan 2021 06:47:32 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-10 10:45:20.784988
- Title: A Novel Word Sense Disambiguation Approach Using WordNet Knowledge Graph
- Title(参考訳): WordNet知識グラフを用いた新しい単語センス曖昧化手法
- Authors: Mohannad AlMousa, Rachid Benlamri, Richard Khoury
- Abstract要約: 本稿では,SCSMM (Sequential Contextual Likeity Matrix multiplication) という知識に基づく単語感覚解読アルゴリズムを提案する。
SCSMMアルゴリズムは、セマンティックな類似性、知識、文書コンテキストを組み合わせて、それぞれローカルコンテキストのメリットを利用する。
提案されたアルゴリズムは、金の標準データセットの名詞を曖昧にするときに他のアルゴリズムよりも優れていた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Various applications in computational linguistics and artificial intelligence
rely on high-performing word sense disambiguation techniques to solve
challenging tasks such as information retrieval, machine translation, question
answering, and document clustering. While text comprehension is intuitive for
humans, machines face tremendous challenges in processing and interpreting a
human's natural language. This paper presents a novel knowledge-based word
sense disambiguation algorithm, namely Sequential Contextual Similarity Matrix
Multiplication (SCSMM). The SCSMM algorithm combines semantic similarity,
heuristic knowledge, and document context to respectively exploit the merits of
local context between consecutive terms, human knowledge about terms, and a
document's main topic in disambiguating terms. Unlike other algorithms, the
SCSMM algorithm guarantees the capture of the maximum sentence context while
maintaining the terms' order within the sentence. The proposed algorithm
outperformed all other algorithms when disambiguating nouns on the combined
gold standard datasets, while demonstrating comparable results to current
state-of-the-art word sense disambiguation systems when dealing with each
dataset separately. Furthermore, the paper discusses the impact of granularity
level, ambiguity rate, sentence size, and part of speech distribution on the
performance of the proposed algorithm.
- Abstract(参考訳): 計算言語学や人工知能の様々な応用は、情報検索、機械翻訳、質問応答、文書クラスタリングといった難題を解決するために、高性能な単語感覚の曖昧さのテクニックに依存している。
テキスト理解は人間にとって直感的だが、機械は人間の自然言語を処理し解釈する上で大きな困難に直面している。
本稿では,文脈類似度行列乗算(SCSMM)という,知識に基づく単語感覚曖昧化アルゴリズムを提案する。
SCSMMアルゴリズムは、意味的類似性、ヒューリスティックな知識、文書コンテキストを組み合わせて、連続した用語、用語に関する人間の知識、曖昧な用語における文書の主要なトピック間の局所的な文脈の利点をそれぞれ活用する。
他のアルゴリズムとは異なり、SCSMMアルゴリズムは文内の語順を維持しながら、最大文コンテキストのキャプチャを保証する。
提案アルゴリズムは, 金の標準データセット上で名詞を曖昧にする場合の他のアルゴリズムを上回り, それぞれのデータセットを別々に扱う場合の現在最先端の単語感覚曖昧化システムと同等の結果を示す。
さらに,提案アルゴリズムの性能に及ぼす粒度レベル,あいまいさ率,文サイズ,音声分布の影響について検討した。
関連論文リスト
- Lightweight Conceptual Dictionary Learning for Text Classification Using Information Compression [15.460141768587663]
データ圧縮と表現に基づくテキスト分類のための軽量な教師付き辞書学習フレームワークを提案する。
我々は,情報ボトルネックの原理を用いて情報理論性能を評価し,情報理論性能を定量化するための新しい指標として情報平面面積ランク(IPAR)を導入する。
論文 参考訳(メタデータ) (2024-04-28T10:11:52Z) - Dense X Retrieval: What Retrieval Granularity Should We Use? [59.359325855708974]
しばしば見過ごされる設計選択は、コーパスが索引付けされる検索単位である。
提案手法はテキスト内の原子式として定義され,それぞれが別個のファクトイドをカプセル化している。
その結果,命題に基づく検索は,従来の通訳法や文による検索方法よりも格段に優れていることがわかった。
論文 参考訳(メタデータ) (2023-12-11T18:57:35Z) - Textual Entailment Recognition with Semantic Features from Empirical
Text Representation [60.31047947815282]
テキストが仮説を包含するのは、仮説の真の価値がテキストに従う場合に限る。
本稿では,テキストと仮説のテキストの包含関係を同定する新しい手法を提案する。
本手法では,テキスト・ハイブリッド・ペア間の意味的含意関係を識別できる要素ワイド・マンハッタン距離ベクトルベースの特徴を用いる。
論文 参考訳(メタデータ) (2022-10-18T10:03:51Z) - DEIM: An effective deep encoding and interaction model for sentence
matching [0.0]
本稿では,ディープエンコーディングとインタラクションに基づく文マッチング手法を提案する。
エンコーダ層では、1つの文を符号化する過程で他の文の情報を参照し、その後、アルゴリズムを用いて情報を融合する。
インタラクション層では、双方向の注意機構と自己注意機構を用いて深い意味情報を得る。
論文 参考訳(メタデータ) (2022-03-20T07:59:42Z) - Contextualized Semantic Distance between Highly Overlapped Texts [85.1541170468617]
テキスト編集や意味的類似性評価といった自然言語処理タスクにおいて、ペア化されたテキストに重複が頻繁に発生する。
本稿では,マスク・アンド・予測戦略を用いてこの問題に対処することを目的とする。
本稿では,最も長い単語列の単語を隣接する単語とみなし,その位置の分布を予測するためにマスク付き言語モデリング(MLM)を用いる。
セマンティックテキスト類似性の実験では、NDDは様々な意味的差異、特に高い重なり合うペアテキストに対してより敏感であることが示されている。
論文 参考訳(メタデータ) (2021-10-04T03:59:15Z) - LexSubCon: Integrating Knowledge from Lexical Resources into Contextual
Embeddings for Lexical Substitution [76.615287796753]
本稿では,コンテキスト埋め込みモデルに基づくエンドツーエンドの語彙置換フレームワークであるLexSubConを紹介する。
これは文脈情報と構造化語彙資源からの知識を組み合わせることで達成される。
我々の実験によると、LexSubConはLS07とCoInCoベンチマークデータセットで従来の最先端の手法よりも優れていた。
論文 参考訳(メタデータ) (2021-07-11T21:25:56Z) - EDS-MEMBED: Multi-sense embeddings based on enhanced distributional
semantic structures via a graph walk over word senses [0.0]
WordNetの豊富なセマンティック構造を活用して、マルチセンス埋め込みの品質を高めます。
M-SEの新たな分布意味類似度測定法を先行して導出する。
WSDとWordの類似度タスクを含む11のベンチマークデータセットの評価結果を報告します。
論文 参考訳(メタデータ) (2021-02-27T14:36:55Z) - Accelerating Text Mining Using Domain-Specific Stop Word Lists [57.76576681191192]
本稿では,超平面的アプローチと呼ばれるドメイン固有語の自動抽出手法を提案する。
ハイパープレーンベースのアプローチは、無関係な特徴を排除することによって、テキストの寸法を著しく削減することができる。
その結果,超平面型アプローチはコーパスの寸法を90%削減し,相互情報より優れることがわかった。
論文 参考訳(メタデータ) (2020-11-18T17:42:32Z) - Using the Full-text Content of Academic Articles to Identify and
Evaluate Algorithm Entities in the Domain of Natural Language Processing [7.163189900803623]
本稿では、自然言語処理(NLP)の分野を例として取り上げ、この分野の学術論文からアルゴリズムを同定する。
論文内容を手動で注釈付けしてアルゴリズムの辞書を構築し、辞書にアルゴリズムを含む文を辞書ベースのマッチングにより抽出する。
アルゴリズムに言及する記事の数は、そのアルゴリズムの影響を分析する指標として使用される。
論文 参考訳(メタデータ) (2020-10-21T08:24:18Z) - Research on Annotation Rules and Recognition Algorithm Based on Phrase
Window [4.334276223622026]
フレーズウィンドウに基づくラベリングルールを提案し,それに対応するフレーズ認識アルゴリズムを設計する。
ラベル付けルールでは、フレーズを最小単位とし、文を7種類のネスト可能なフレーズタイプに分割し、フレーズ間の文法的依存関係を示す。
対応するアルゴリズムは、画像中の対象領域を識別するアイデアに基づいて、文中の様々なフレーズの開始位置と終了位置を見つけることができる。
論文 参考訳(メタデータ) (2020-07-07T00:19:47Z) - Towards Accurate Scene Text Recognition with Semantic Reasoning Networks [52.86058031919856]
本稿では,シーンテキスト認識のための意味推論ネットワーク(SRN)という,エンドツーエンドのトレーニング可能な新しいフレームワークを提案する。
GSRMはマルチウェイ並列伝送によってグローバルセマンティックコンテキストをキャプチャするために導入された。
正規テキスト,不規則テキスト,非ラテン語長文を含む7つの公開ベンチマークの結果,提案手法の有効性とロバスト性を検証した。
論文 参考訳(メタデータ) (2020-03-27T09:19:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。