論文の概要: Extracting Synonyms from Bilingual Dictionaries
- arxiv url: http://arxiv.org/abs/2012.00600v1
- Date: Tue, 1 Dec 2020 16:09:22 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-30 20:05:22.358166
- Title: Extracting Synonyms from Bilingual Dictionaries
- Title(参考訳): バイリンガル辞書からの構文抽出
- Authors: Mustafa Jarrar, Eman Karajah, Muhammad Khalifa, Khaled Shaalan
- Abstract要約: 本稿では,バイリンガル辞書から同義語を抽出する新しいアルゴリズムの開発について述べる。
この考え方は、翻訳対から翻訳グラフを構築し、次に巡回経路を抽出して統合し、同義語のバイリンガル集合を形成するというものである。
このアルゴリズムの最初の評価は、アラビア語と英語の両言語同義語を抽出する有望な結果を示している。
- 参考スコア(独自算出の注目度): 1.1470070927586016
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We present our progress in developing a novel algorithm to extract synonyms
from bilingual dictionaries. Identification and usage of synonyms play a
significant role in improving the performance of information access
applications. The idea is to construct a translation graph from translation
pairs, then to extract and consolidate cyclic paths to form bilingual sets of
synonyms. The initial evaluation of this algorithm illustrates promising
results in extracting Arabic-English bilingual synonyms. In the evaluation, we
first converted the synsets in the Arabic WordNet into translation pairs (i.e.,
losing word-sense memberships). Next, we applied our algorithm to rebuild these
synsets. We compared the original and extracted synsets obtaining an F-Measure
of 82.3% and 82.1% for Arabic and English synsets extraction, respectively.
- Abstract(参考訳): 本稿では,バイリンガル辞書から同義語を抽出する新しいアルゴリズムの開発について述べる。
同義語の識別と使用は情報アクセスアプリケーションの性能向上に重要な役割を果たしている。
そのアイデアは、翻訳対から翻訳グラフを構築し、巡回経路を抽出・統合し、同義語のバイリンガル集合を形成することである。
このアルゴリズムの最初の評価は、アラビア語と英語の両言語同義語を抽出する有望な結果を示している。
評価では、アラビア語のWordNetのシンセセットを翻訳ペア(つまり、単語センスの会員を失う)に変換した。
次に、これらの合成集合を再構築するためにアルゴリズムを適用した。
アラビア語と英語のシンセットをそれぞれ82.3%と82.1%のf-測定値を得たオリジナルと抽出されたシンセットを比較した。
関連論文リスト
- ParaAMR: A Large-Scale Syntactically Diverse Paraphrase Dataset by AMR
Back-Translation [59.91139600152296]
ParaAMRは、抽象的な表現のバックトランスレーションによって生成される、大規模な構文的に多様なパラフレーズデータセットである。
そこで本研究では,ParaAMRを用いて文の埋め込み学習,構文的に制御されたパラフレーズ生成,数ショット学習のためのデータ拡張という,3つのNLPタスクを改善することができることを示す。
論文 参考訳(メタデータ) (2023-05-26T02:27:33Z) - CompoundPiece: Evaluating and Improving Decompounding Performance of
Language Models [77.45934004406283]
複合語を構成語に分割する作業である「分解」を体系的に研究する。
We introduced a dataset of 255k compound and non-compound words across 56 various languages obtained from Wiktionary。
分割のための専用モデルを訓練するための新しい手法を導入する。
論文 参考訳(メタデータ) (2023-05-23T16:32:27Z) - Biomedical Named Entity Recognition via Dictionary-based Synonym
Generalization [51.89486520806639]
本研究では,入力テキストに含まれる生物医学的概念をスパンベース予測を用いて認識する,新しいSynGenフレームワークを提案する。
提案手法を広範囲のベンチマークで広範囲に評価し,SynGenが従来の辞書ベースモデルよりも顕著なマージンで優れていることを確認した。
論文 参考訳(メタデータ) (2023-05-22T14:36:32Z) - A Benchmark and Scoring Algorithm for Enriching Arabic Synonyms [0.0]
モノ/マルチリンガルシンセットとしきい値(ファジィ値[0-1])が与えられた場合、我々のゴールは既存のレキシコンからこのしきい値の上に新しい同義語を抽出することである。
データセットは500シンセットの3K候補シノニムで構成されている。
評価の結果,アルゴリズムは言語学者のように振る舞うことができ,ファジィ値は言語学者が提案したものに近いことがわかった。
論文 参考訳(メタデータ) (2023-02-04T20:30:32Z) - Current Trends and Approaches in Synonyms Extraction: Potential
Adaptation to Arabic [0.0]
本論文は,同義語の自動抽出に使用される様々なアプローチと傾向について調査する。
最初のアプローチは、翻訳グラフを使って同義語を見つけることである。
第二のアプローチは、(アラビア語-英語)、(英語-フランス語)、(アラビア語-フランス語)のような新しい遷移対を発見することである。
論文 参考訳(メタデータ) (2022-05-20T19:05:10Z) - Extracting and filtering paraphrases by bridging natural language
inference and paraphrasing [0.0]
本研究では,NLIデータセットからパラフレージングデータセットを抽出し,既存のパラフレージングデータセットをクリーニングするための新しい手法を提案する。
その結果,既存の2つのパラフレージングデータセットにおいて,抽出したパラフレージングデータセットの品質と驚くほど高いノイズレベルが示された。
論文 参考訳(メタデータ) (2021-11-13T14:06:37Z) - Interval Probabilistic Fuzzy WordNet [8.396691008449704]
本稿では,任意の言語でIPF(Interval Probabilistic Fuzzy)シンセサイザーを構築するアルゴリズムを提案する。
我々は、英語のためのWordNetのIPFシンセセットを構築し、公開した。
論文 参考訳(メタデータ) (2021-04-04T17:28:37Z) - Enhanced word embeddings using multi-semantic representation through
lexical chains [1.8199326045904998]
フレキシブル・レキシカル・チェーンIIと固定レキシカル・チェーンIIという2つの新しいアルゴリズムを提案する。
これらのアルゴリズムは、語彙連鎖から派生した意味関係、語彙データベースからの以前の知識、および単一のシステムを形成するビルディングブロックとしての単語埋め込みにおける分布仮説の堅牢性を組み合わせている。
その結果、語彙チェーンと単語埋め込み表現の統合は、より複雑なシステムに対しても、最先端の結果を維持します。
論文 参考訳(メタデータ) (2021-01-22T09:43:33Z) - Syntactic representation learning for neural network based TTS with
syntactic parse tree traversal [49.05471750563229]
本稿では,構文解析木に基づく構文表現学習手法を提案し,構文構造情報を自動的に活用する。
実験の結果,提案手法の有効性が示された。
複数の構文解析木を持つ文では、合成音声から韻律的差異が明確に認識される。
論文 参考訳(メタデータ) (2020-12-13T05:52:07Z) - Syntactic Structure Distillation Pretraining For Bidirectional Encoders [49.483357228441434]
本稿では,BERTプレトレーニングに構文バイアスを注入するための知識蒸留手法を提案する。
我々は,構文的 LM から単語の周辺分布を抽出する。
本研究は,大量のデータを利用する表現学習者においても,構文バイアスの利点を示すものである。
論文 参考訳(メタデータ) (2020-05-27T16:44:01Z) - Learning Coupled Policies for Simultaneous Machine Translation using
Imitation Learning [85.70547744787]
本稿では,プログラマ-解釈ポリシーを併用した同時翻訳モデルを効率よく学習する手法を提案する。
6つの言語対の実験により,翻訳品質の点で,本手法は高いベースラインを達成できた。
論文 参考訳(メタデータ) (2020-02-11T10:56:42Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。