Fugu-MT 論文翻訳(概要): HJ-Ky-0.1: an Evaluation Dataset for Kyrgyz Word Embeddings

論文の概要: HJ-Ky-0.1: an Evaluation Dataset for Kyrgyz Word Embeddings

arxiv url: http://arxiv.org/abs/2411.10724v1
Date: Sat, 16 Nov 2024 07:14:32 GMT
ステータス: 翻訳完了
システム内更新日: 2024-11-28 17:07:48.322505
Title: HJ-Ky-0.1: an Evaluation Dataset for Kyrgyz Word Embeddings
Title（参考訳）: HJ-Ky-0.1:キルギス語埋め込みの評価データセット
Authors: Anton Alekseev, Gulnara Kabaeva,
Abstract要約: 本研究はキルギス語で単語ベクトル表現を構築するための最初の「銀標準」データセットを紹介する。対応するモデルをトレーニングし、品質評価指標を通じてデータセットの適合性を検証します。
参考スコア（独自算出の注目度）: 1.1920184024241331
License: http://creativecommons.org/licenses/by/4.0/
Abstract: One of the key tasks in modern applied computational linguistics is constructing word vector representations (word embeddings), which are widely used to address natural language processing tasks such as sentiment analysis, information extraction, and more. To choose an appropriate method for generating these word embeddings, quality assessment techniques are often necessary. A standard approach involves calculating distances between vectors for words with expert-assessed 'similarity'. This work introduces the first 'silver standard' dataset for such tasks in the Kyrgyz language, alongside training corresponding models and validating the dataset's suitability through quality evaluation metrics.
Abstract（参考訳）: 現代の計算言語学における重要な課題の1つは、感情分析や情報抽出といった自然言語処理タスクに広く使用される単語ベクトル表現(単語埋め込み)の構築である。これらの単語の埋め込みを生成する適切な方法を選択するには、品質評価技術が必要であることが多い。標準的なアプローチでは、専門家による「類似性」を持つ単語のベクトル間の距離を計算する。この作業では、Kyrgyz言語でこのようなタスクのための最初の"銀の標準"データセットを導入し、対応するモデルをトレーニングし、品質評価メトリクスを通じてデータセットの適合性を検証する。

関連論文リスト

CALMA: A Process for Deriving Context-aligned Axes for Language Model Alignment [4.732046558763803]
評価とアライメントのための文脈関連軸を抽出するための基礎的,参加的手法であるCALMAを紹介する。その結果,オープンエンドおよびユースケース駆動プロセスに基づく評価実践の価値が示された。
論文参考訳（メタデータ） (2025-07-11T22:33:11Z)
Automated Collection of Evaluation Dataset for Semantic Search in Low-Resource Domain Language [4.5224851085910585]
多くの特定の用語を使用するドメイン固有言語は、しばしば低リソース言語に分類される。本研究では,低リソースなドメイン固有ドイツ語のセマンティック検索を評価するために,テストデータセットの自動収集という課題に対処する。
論文参考訳（メタデータ） (2024-12-13T09:47:26Z)
ImpScore: A Learnable Metric For Quantifying The Implicitness Level of Language [40.4052848203136]
インプシット言語は, 自然言語処理システムにおいて, 正確なテキスト理解を実現し, ユーザとの自然な対話を促進するために不可欠である。本稿では,外部参照に頼ることなく,言語の暗黙度を定量化するスカラー計量を開発した。 ImpScoreは、12,580$(単純文、明示文)のペアからなる特別なキュレートされたデータセットに対して、ペアのコントラスト学習を使用してトレーニングされる。
論文参考訳（メタデータ） (2024-11-07T20:23:29Z)
Rethinking Evaluation Metrics of Open-Vocabulary Segmentaion [78.76867266561537]
評価プロセスは、予測された真理のカテゴリと基底的真理のカテゴリの類似性を考慮せずに、クローズドセットのメトリクスに大きく依存している。この問題に対処するため、まず2つのカテゴリー語間の11の類似度の測定を行った。我々は,3つのオープン語彙セグメンテーションタスクに適した,オープンmIoU,オープンAP,オープンPQという新しい評価指標を設計した。
論文参考訳（メタデータ） (2023-11-06T18:59:01Z)
Assessing Word Importance Using Models Trained for Semantic Tasks [0.0]
我々は、自然言語推論とパラフレーズ同定という、意味的課題を解決するために訓練されたモデルから単語の意義を導き出す。我々は、いわゆるクロスタスク評価を用いて、それらの妥当性を評価する。本手法は, 文章中の重要な単語を, 学習における単語のラベル付けを伴わずに識別することができる。
論文参考訳（メタデータ） (2023-05-31T09:34:26Z)
CompoundPiece: Evaluating and Improving Decompounding Performance of Language Models [77.45934004406283]
複合語を構成語に分割する作業である「分解」を体系的に研究する。 We introduced a dataset of 255k compound and non-compound words across 56 various languages obtained from Wiktionary。分割のための専用モデルを訓練するための新しい手法を導入する。
論文参考訳（メタデータ） (2023-05-23T16:32:27Z)
A Comprehensive Empirical Evaluation of Existing Word Embedding Approaches [5.065947993017158]
既存の単語埋め込み手法の特徴を概説し,多くの分類タスクについて解析する。伝統的なアプローチでは、主に単語表現を生成するために行列分解を使い、言語の意味的および構文的規則性をうまく捉えることができない。一方、ニューラルネットワークに基づくアプローチは、言語の洗練された規則性を捕捉し、生成した単語表現における単語関係を保存することができる。
論文参考訳（メタデータ） (2023-03-13T15:34:19Z)
Benchmarking Generalization via In-Context Instructions on 1,600+ Language Tasks [95.06087720086133]
Natural-Instructions v2 は 1,600 以上の多種多様な言語タスクとその専門家による命令のコレクションである。ベンチマークでは、タグ付け、インフィル、書き換えなど、70以上の異なるタスクタイプがカバーされている。このベンチマークにより、モデルのクロスタスク一般化の大規模評価が可能になる。
論文参考訳（メタデータ） (2022-04-16T03:12:30Z)
SLUE: New Benchmark Tasks for Spoken Language Understanding Evaluation on Natural Speech [44.68649535280397]
音声言語理解評価(SLUE)のための一連のベンチマークタスクを提案する。 SLUEは限定的なラベル付きトレーニングセットとそれに対応する評価セットで構成されている。本稿では,SLUEベンチマークスイートの第1フェーズについて述べる。本稿では,VoxCelebデータセットとVoxPopuliデータセットのサブセットに対する新たな書き起こしとアノテーション,ベースラインモデルの評価指標と結果,ベースラインを再現し,新しいモデルを評価するためのオープンソースツールキットを提供する。
論文参考訳（メタデータ） (2021-11-19T18:59:23Z)
SAT Based Analogy Evaluation Framework for Persian Word Embeddings [0.0]
近年,単語をベクトルに変換する新たなアプローチとして,単語埋め込みが注目されている。使用される埋め込みモデルの品質を特定するために、エンドツーエンドのアプリケーションを評価するのはコストがかかるでしょう。本稿では,ペルシャのSATをベースとしたアナロジーデータセットを手作りした評価フレームワークを提案する。
論文参考訳（メタデータ） (2021-06-29T18:43:06Z)
Sentiment analysis in tweets: an assessment study from classical to modern text representation models [59.107260266206445]
Twitterで公開された短いテキストは、豊富な情報源として大きな注目を集めている。非公式な言語スタイルや騒々しい言語スタイルといったそれらの固有の特徴は、多くの自然言語処理(NLP)タスクに挑戦し続けている。本研究では,22データセットの豊富なコレクションを用いて,ツイートに表される感情を識別する既存言語モデルの評価を行った。
論文参考訳（メタデータ） (2021-05-29T21:05:28Z)
XL-WiC: A Multilingual Benchmark for Evaluating Semantic Contextualization [98.61159823343036]
単語の意味を正確にモデル化する能力を評価するために,Word-in-Context データセット (WiC) を提案する。我々は、XL-WiCという大規模なマルチ言語ベンチマークを提案し、12の新しい言語でゴールドスタンダードを特徴付けました。実験結果から、ターゲット言語にタグ付けされたインスタンスが存在しない場合でも、英語データのみにトレーニングされたモデルは、競争力のあるパフォーマンスが得られることが示された。
論文参考訳（メタデータ） (2020-10-13T15:32:00Z)
Grounded Compositional Outputs for Adaptive Language Modeling [59.02706635250856]
言語モデルの語彙$-$典型的にはトレーニング前に選択され、後で永久に固定される$-$は、そのサイズに影響します。言語モデルのための完全合成出力埋め込み層を提案する。我々の知る限り、この結果はトレーニング語彙に依存しないサイズを持つ最初の単語レベル言語モデルである。
論文参考訳（メタデータ） (2020-09-24T07:21:14Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。