論文の概要: SAT Based Analogy Evaluation Framework for Persian Word Embeddings
- arxiv url: http://arxiv.org/abs/2106.15674v1
- Date: Tue, 29 Jun 2021 18:43:06 GMT
- ステータス: 処理完了
- システム内更新日: 2021-07-02 02:04:28.257556
- Title: SAT Based Analogy Evaluation Framework for Persian Word Embeddings
- Title(参考訳): SATを用いたペルシャ語埋め込みのためのアナロジー評価フレームワーク
- Authors: Seyyed Ehsan Mahmoudi and Mehrnoush Shamsfard
- Abstract要約: 近年,単語をベクトルに変換する新たなアプローチとして,単語埋め込みが注目されている。
使用される埋め込みモデルの品質を特定するために、エンドツーエンドのアプリケーションを評価するのはコストがかかるでしょう。
本稿では,ペルシャのSATをベースとしたアナロジーデータセットを手作りした評価フレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years there has been a special interest in word embeddings as a new
approach to convert words to vectors. It has been a focal point to understand
how much of the semantics of the the words has been transferred into embedding
vectors. This is important as the embedding is going to be used as the basis
for downstream NLP applications and it will be costly to evaluate the
application end-to-end in order to identify quality of the used embedding
model. Generally the word embeddings are evaluated through a number of tests,
including analogy test. In this paper we propose a test framework for Persian
embedding models. Persian is a low resource language and there is no rich
semantic benchmark to evaluate word embedding models for this language. In this
paper we introduce an evaluation framework including a hand crafted Persian SAT
based analogy dataset, a colliquial test set (specific to Persian) and a
benchmark to study the impact of various parameters on the semantic evaluation
task.
- Abstract(参考訳): 近年、単語をベクトルに変換する新しいアプローチとして、単語埋め込みに特別な関心が寄せられている。
単語の意味論のどの程度が埋め込みベクトルに変換されたかを理解するための焦点であった。
これは、埋め込みが下流のNLPアプリケーションの基盤として使われるためであり、使用される埋め込みモデルの品質を特定するために、アプリケーションのエンドツーエンドを評価するのにコストがかかります。
一般に、単語の埋め込みはアナログテストを含む多くのテストによって評価される。
本稿では,ペルシャ組込みモデルのためのテストフレームワークを提案する。
ペルシャ語は低リソース言語であり、この言語の単語埋め込みモデルを評価するためのリッチなセマンティックベンチマークはない。
本稿では,ペルシャ語 SAT を用いたアナロジーデータセット,(ペルシャ語特有の)口語テストセット,およびセマンティック評価タスクにおける種々のパラメータの影響を調査するためのベンチマークを含む評価フレームワークを提案する。
関連論文リスト
- HJ-Ky-0.1: an Evaluation Dataset for Kyrgyz Word Embeddings [1.1920184024241331]
本研究はキルギス語で単語ベクトル表現を構築するための最初の「銀標準」データセットを紹介する。
対応するモデルをトレーニングし、品質評価指標を通じてデータセットの適合性を検証します。
論文 参考訳(メタデータ) (2024-11-16T07:14:32Z) - FarSSiBERT: A Novel Transformer-based Model for Semantic Similarity Measurement of Persian Social Networks Informal Texts [0.0]
本稿では,ソーシャルメディアからペルシャの非公式短文間の意味的類似性を測定するための,トランスフォーマーに基づく新しいモデルを提案する。
これは、約9900万のペルシア語の非公式な短文をソーシャルネットワークから事前訓練しており、ペルシア語の一種である。
提案手法はPearsonとSpearmanの係数基準でParsBERT, laBSE, multilingual BERTより優れていた。
論文 参考訳(メタデータ) (2024-07-27T05:04:49Z) - A Comprehensive Analysis of Static Word Embeddings for Turkish [0.058520770038704165]
基本的には、非文脈的(静的)モデルと文脈的モデルである2種類の単語埋め込みモデルが存在する。
トルコ語における内在的・外在的評価設定における文脈的・非文脈的モデルの性能の比較と評価を行った。
分析の結果は、異なるタイプのNLPタスクにおける異なる埋め込みモデルの適合性に関する洞察を与える。
論文 参考訳(メタデータ) (2024-05-13T14:23:37Z) - Disco-Bench: A Discourse-Aware Evaluation Benchmark for Language
Modelling [70.23876429382969]
本研究では,多種多様なNLPタスクに対して,文内談話特性を評価できるベンチマークを提案する。
ディスコ・ベンチは文学領域における9つの文書レベルのテストセットから構成されており、豊富な談話現象を含んでいる。
また,言語分析のために,対象モデルが談話知識を学習するかどうかを検証できる診断テストスイートを設計する。
論文 参考訳(メタデータ) (2023-07-16T15:18:25Z) - Language Model Classifier Aligns Better with Physician Word Sensitivity
than XGBoost on Readmission Prediction [86.15787587540132]
語彙レベルでモデルの振る舞いを精査する尺度である感度スコアを導入する。
本実験は,感度スコアのランク相関に基づいて,臨床医と分類医の意思決定論理を比較した。
論文 参考訳(メタデータ) (2022-11-13T23:59:11Z) - Just Rank: Rethinking Evaluation with Word and Sentence Similarities [105.5541653811528]
埋め込みの本質的な評価は かなり遅れています そして過去10年間 重要な更新は行われていません
本稿ではまず,単語と文の埋め込み評価におけるゴールドスタンダードとして意味的類似性を用いた問題点を指摘する。
本稿では,下流タスクとより強い相関関係を示すEvalRankという本質的な評価手法を提案する。
論文 参考訳(メタデータ) (2022-03-05T08:40:05Z) - Sentiment analysis in tweets: an assessment study from classical to
modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。
非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。
本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文 参考訳(メタデータ) (2021-05-29T21:05:28Z) - XL-WiC: A Multilingual Benchmark for Evaluating Semantic
Contextualization [98.61159823343036]
単語の意味を正確にモデル化する能力を評価するために,Word-in-Context データセット (WiC) を提案する。
我々は、XL-WiCという大規模なマルチ言語ベンチマークを提案し、12の新しい言語でゴールドスタンダードを特徴付けました。
実験結果から、ターゲット言語にタグ付けされたインスタンスが存在しない場合でも、英語データのみにトレーニングされたモデルは、競争力のあるパフォーマンスが得られることが示された。
論文 参考訳(メタデータ) (2020-10-13T15:32:00Z) - Grounded Compositional Outputs for Adaptive Language Modeling [59.02706635250856]
言語モデルの語彙$-$典型的にはトレーニング前に選択され、後で永久に固定される$-$は、そのサイズに影響します。
言語モデルのための完全合成出力埋め込み層を提案する。
我々の知る限り、この結果はトレーニング語彙に依存しないサイズを持つ最初の単語レベル言語モデルである。
論文 参考訳(メタデータ) (2020-09-24T07:21:14Z) - A novel approach to sentiment analysis in Persian using discourse and
external semantic information [0.0]
自然言語で書かれた文書から個人の感情を抽出するための多くのアプローチが提案されている。
これらのアプローチの大半は英語に重点を置いているが、ペルシア語のような資源中心の言語は研究作業や言語資源の欠如に悩まされている。
ペルシア語におけるこのギャップのため、現在の研究はペルシア語に適用される感情分析の新しい手法を導入することを目的としている。
論文 参考訳(メタデータ) (2020-07-18T18:40:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。