論文の概要: Current Trends and Approaches in Synonyms Extraction: Potential
Adaptation to Arabic
- arxiv url: http://arxiv.org/abs/2205.10412v1
- Date: Fri, 20 May 2022 19:05:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-06-05 23:06:15.727324
- Title: Current Trends and Approaches in Synonyms Extraction: Potential
Adaptation to Arabic
- Title(参考訳): シンノニム抽出の最近の動向とアプローチ:アラビア語への潜在的適応
- Authors: Eman Naser-Karajah, Nabil Arman, Mustafa Jarrar
- Abstract要約: 本論文は,同義語の自動抽出に使用される様々なアプローチと傾向について調査する。
最初のアプローチは、翻訳グラフを使って同義語を見つけることである。
第二のアプローチは、(アラビア語-英語)、(英語-フランス語)、(アラビア語-フランス語)のような新しい遷移対を発見することである。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Extracting synonyms from dictionaries or corpora is gaining special attention
as synonyms play an important role in improving NLP application performance.
This paper presents a survey of the different approaches and trends used in
automatically extracting the synonyms. These approaches can be divided into
four main categories. The first approach is to find the Synonyms using a
translation graph. The second approach is to discover new transition pairs such
as (Arabic-English) (English-France) then (Arabic-France). The third approach
is to construct new WordNets by exploring synonymy graphs, and the fourth
approach is to find similar words from corpora using Deep Learning methods,
such as word embeddings and recently BERT models. The paper also presents a
comparative analysis between these approaches and highlights potential
adaptation to generate synonyms automatically in the Arabic language as future
work.
- Abstract(参考訳): 辞書やコーパスから同義語を抽出することは、NLPアプリケーションの性能向上に重要な役割を果たすため、特に注目されている。
本稿では,同義語の自動抽出に使用される様々なアプローチと傾向について調査する。
これらのアプローチは4つの主要なカテゴリに分類できる。
最初のアプローチは、翻訳グラフを使って同義語を見つけることである。
第二のアプローチは、(アラビア語と英語)、(アラビア語とフランス語)のような新しい遷移ペアを見つけることである。
第3のアプローチは、同義グラフを探索して新しいWordNetを構築することであり、第4のアプローチは、単語埋め込みや最近のBERTモデルのようなディープラーニング手法を用いて、コーパスから類似した単語を見つけることである。
また、これらのアプローチの比較分析を行い、将来的な研究としてアラビア語でシノニムを自動生成する可能性を強調した。
関連論文リスト
- Towards Open Vocabulary Learning: A Survey [146.90188069113213]
ディープニューラルネットワークは,セグメンテーションやトラッキング,検出といった,さまざまなコアタスクにおいて,目覚ましい進歩を遂げている。
近年、視覚言語事前学習の急速な進歩により、オープンな語彙設定が提案されている。
本稿では,その分野における最近の発展を要約し分析し,オープンな語彙学習の徹底的なレビューを行う。
論文 参考訳(メタデータ) (2023-06-28T02:33:06Z) - Syntax and Semantics Meet in the "Middle": Probing the Syntax-Semantics
Interface of LMs Through Agentivity [68.8204255655161]
このような相互作用を探索するためのケーススタディとして,作用性のセマンティックな概念を提示する。
これは、LMが言語アノテーション、理論テスト、発見のためのより有用なツールとして役立つ可能性を示唆している。
論文 参考訳(メタデータ) (2023-05-29T16:24:01Z) - Towards Unsupervised Recognition of Token-level Semantic Differences in
Related Documents [61.63208012250885]
意味的差異をトークンレベルの回帰タスクとして認識する。
マスク付き言語モデルに依存する3つの教師なしアプローチについて検討する。
その結果,単語アライメントと文レベルのコントラスト学習に基づくアプローチは,ゴールドラベルと強い相関関係があることが示唆された。
論文 参考訳(メタデータ) (2023-05-22T17:58:04Z) - Beyond Contrastive Learning: A Variational Generative Model for
Multilingual Retrieval [109.62363167257664]
本稿では,多言語テキスト埋め込み学習のための生成モデルを提案する。
我々のモデルは、$N$言語で並列データを操作する。
本手法は, 意味的類似性, ビットクストマイニング, 言語間質問検索などを含む一連のタスクに対して評価を行う。
論文 参考訳(メタデータ) (2022-12-21T02:41:40Z) - Always Keep your Target in Mind: Studying Semantics and Improving
Performance of Neural Lexical Substitution [124.99894592871385]
本稿では,従来の言語モデルと最近の言語モデルの両方を用いた語彙置換手法の大規模比較研究を行う。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによるすでに競合する結果がさらに大幅に改善できることを示す。
論文 参考訳(メタデータ) (2022-06-07T16:16:19Z) - Extracting Synonyms from Bilingual Dictionaries [1.1470070927586016]
本稿では,バイリンガル辞書から同義語を抽出する新しいアルゴリズムの開発について述べる。
この考え方は、翻訳対から翻訳グラフを構築し、次に巡回経路を抽出して統合し、同義語のバイリンガル集合を形成するというものである。
このアルゴリズムの最初の評価は、アラビア語と英語の両言語同義語を抽出する有望な結果を示している。
論文 参考訳(メタデータ) (2020-12-01T16:09:22Z) - UoB at SemEval-2020 Task 1: Automatic Identification of Novel Word
Senses [0.6980076213134383]
本稿では,新しい単語認識に適したベイズ単語認識に基づく語彙意味変化検出手法を提案する。
同じアプローチが15年間のTwitterデータから得られたコーパスにも適用され、結果がスラングのインスタンスである可能性のある単語の識別に使用される。
論文 参考訳(メタデータ) (2020-10-18T19:27:06Z) - A novel approach to sentiment analysis in Persian using discourse and
external semantic information [0.0]
自然言語で書かれた文書から個人の感情を抽出するための多くのアプローチが提案されている。
これらのアプローチの大半は英語に重点を置いているが、ペルシア語のような資源中心の言語は研究作業や言語資源の欠如に悩まされている。
ペルシア語におけるこのギャップのため、現在の研究はペルシア語に適用される感情分析の新しい手法を導入することを目的としている。
論文 参考訳(メタデータ) (2020-07-18T18:40:40Z) - A Comparative Study of Lexical Substitution Approaches based on Neural
Language Models [117.96628873753123]
本稿では,一般的なニューラル言語とマスキング言語モデルの大規模比較研究について述べる。
目的語に関する情報を適切に注入すれば,SOTA LMs/MLMsによって達成された既に競合する結果をさらに改善できることを示す。
論文 参考訳(メタデータ) (2020-05-29T18:43:22Z) - Analysing Lexical Semantic Change with Contextualised Word
Representations [7.071298726856781]
本稿では,BERTニューラルネットワークモデルを用いて単語使用率の表現を求める手法を提案する。
我々は新しい評価データセットを作成し、モデル表現と検出された意味変化が人間の判断と正に相関していることを示す。
論文 参考訳(メタデータ) (2020-04-29T12:18:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。