Fugu-MT 論文翻訳(概要): Detecting Unseen Multiword Expressions in American Sign Language

論文の概要: Detecting Unseen Multiword Expressions in American Sign Language

arxiv url: http://arxiv.org/abs/2310.00207v1
Date: Sat, 30 Sep 2023 00:54:59 GMT
ステータス: 翻訳完了
システム内更新日: 2023-10-05 05:51:54.188999
Title: Detecting Unseen Multiword Expressions in American Sign Language
Title（参考訳）: アメリカ手話における見当たらない多語表現の検出
Authors: Lee Kezar, Aryan Shukla
Abstract要約: 我々はGloVeから単語埋め込みを適用した2つのシステムを用いて、これらのレキシムが複数単語表現を構成するか否かを予測した。単語の埋め込みは、正確な精度で非合成性を検出するデータを持っていることが明らかとなった。
参考スコア（独自算出の注目度）: 1.2691047660244332
License: http://creativecommons.org/licenses/by-nc-sa/4.0/
Abstract: Multiword expressions present unique challenges in many translation tasks. In an attempt to ultimately apply a multiword expression detection system to the translation of American Sign Language, we built and tested two systems that apply word embeddings from GloVe to determine whether or not the word embeddings of lexemes can be used to predict whether or not those lexemes compose a multiword expression. It became apparent that word embeddings carry data that can detect non-compositionality with decent accuracy.
Abstract（参考訳）: マルチワード表現は多くの翻訳タスクにおいて固有の課題を示す。アメリカの手話翻訳に最終的に多語表現検出システムを適用する試みとして,lexemeの単語埋め込みが多語表現を合成するか否かを判断するためにglobから単語埋め込みを適用する2つのシステムを構築し,テストを行った。単語埋め込みは、適切な精度で非結合性を検出できるデータを持っていることが明らかとなった。

関連論文リスト

Evaluating Large Language Models on Multiword Expressions in Multilingual and Code-Switched Contexts [2.519319150166215]
本研究では,現在最先端の言語モデルが,潜在的に慣用的なマルチワード表現のあいまいさをどのように処理するかを評価する。大きな言語モデルは、その強みにも拘わらず、ニュアンスド言語に苦戦している。
論文参考訳（メタデータ） (2025-04-10T16:39:28Z)
Tomato, Tomahto, Tomate: Measuring the Role of Shared Semantics among Subwords in Multilingual Language Models [88.07940818022468]
エンコーダのみの多言語言語モデル(mLM)におけるサブワード間の共有セマンティクスの役割を測る第一歩を踏み出した。意味的に類似したサブワードとその埋め込みをマージして「意味トークン」を形成する。グループ化されたサブワードの検査では様々な意味的類似性を示します
論文参考訳（メタデータ） (2024-11-07T08:38:32Z)
HIT at SemEval-2022 Task 2: Pre-trained Language Model for Idioms Detection [23.576133853110324]
同じマルチワード表現は、異なる文で異なる意味を持つことがある。これらは、文字通りの意味と慣用的な意味の2つのカテゴリに分けられる。我々は事前訓練された言語モデルを使用し、文脈対応の文埋め込みを提供する。
論文参考訳（メタデータ） (2022-04-13T02:45:04Z)
Subword Mapping and Anchoring across Languages [1.9352552677009318]
SMALA (Subword Mapping and Anchoring across Languages) は、バイリンガルなサブワード語彙を構築する方法である。 SMALAは教師なしの最先端マッピング技術を用いてサブワードアライメントを抽出する。 SMALAで獲得した単語語彙は,多くの偽陽性と偽陰性を含む文のBLEUスコアが高くなることを示す。
論文参考訳（メタデータ） (2021-09-09T20:46:27Z)
A Simple and Efficient Probabilistic Language model for Code-Mixed Text [0.0]
コード混合テキストに対する効率的な単語埋め込みを構築するための単純な確率的アプローチを提案する。双方向LSTMとSVMを用いた分類作業の有効性を検討した。
論文参考訳（メタデータ） (2021-06-29T05:37:57Z)
Revisiting Language Encoding in Learning Multilingual Representations [70.01772581545103]
言語埋め込みを置き換えるクロスリンガル言語投影(Cross-lingual Language Projection, XLP)と呼ばれる新しいアプローチを提案する。 XLPは単語埋め込みを言語固有の意味空間に投影し、投影された埋め込みはTransformerモデルに供給される。実験により、xlpは広範囲の多言語ベンチマークデータセットのモデル性能を自由かつ著しく向上できることが示された。
論文参考訳（メタデータ） (2021-02-16T18:47:10Z)
Fake it Till You Make it: Self-Supervised Semantic Shifts for Monolingual Word Embedding Tasks [58.87961226278285]
語彙意味変化をモデル化するための自己教師付きアプローチを提案する。本手法は,任意のアライメント法を用いて意味変化の検出に利用できることを示す。 3つの異なるデータセットに対する実験結果を用いて,本手法の有用性について述べる。
論文参考訳（メタデータ） (2021-01-30T18:59:43Z)
Speakers Fill Lexical Semantic Gaps with Context [65.08205006886591]
我々は単語の語彙的あいまいさを意味のエントロピーとして運用する。単語のあいまいさの推定値と,WordNetにおける単語の同義語数との間には,有意な相関関係が認められた。これは、あいまいさの存在下では、話者が文脈をより情報的にすることで補うことを示唆している。
論文参考訳（メタデータ） (2020-10-05T17:19:10Z)
Discovering Bilingual Lexicons in Polyglot Word Embeddings [32.53342453685406]
本研究では,多言語単語の埋め込みを生成する多言語コーパスで訓練された1つのスキップグラムモデルを利用する。本稿では, 比較的単純な近傍サンプリング手法により, バイリンガル辞書を検索できることを示す。 3つのヨーロッパ語対にまたがって、多言語単語の埋め込みは、確かに単語のリッチな意味表現を学習する。
論文参考訳（メタデータ） (2020-08-31T03:57:50Z)
MICE: Mining Idioms with Contextual Embeddings [0.0]
MICEatic式は自然言語処理アプリケーションでは問題となることがある。我々は,その目的のためにコンテキスト埋め込みを利用するアプローチを提案する。両埋め込みを用いたディープニューラルネットワークは,既存のアプローチよりも優れた性能を示す。
論文参考訳（メタデータ） (2020-08-13T08:56:40Z)
Techniques for Vocabulary Expansion in Hybrid Speech Recognition Systems [54.49880724137688]
語彙外単語(OOV)の問題は、音声認識システムにおいて典型的である。 OOVをカバーするための一般的なアプローチの1つは、単語ではなくサブワード単位を使用することである。本稿では,グラフ構築法と探索法の両方のレベルで,この解の既存手法について検討する。
論文参考訳（メタデータ） (2020-03-19T21:24:45Z)
On the Importance of Word Order Information in Cross-lingual Sequence Labeling [80.65425412067464]
ソース言語の単語順に適合する言語間モデルでは、ターゲット言語を処理できない可能性がある。本研究では,ソース言語の単語順序に敏感なモデルを作成することで,対象言語の適応性能が向上するかどうかを検討する。
論文参考訳（メタデータ） (2020-01-30T03:35:44Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。