論文の概要: Arabic Diacritic Recovery Using a Feature-Rich biLSTM Model
- arxiv url: http://arxiv.org/abs/2002.01207v1
- Date: Tue, 4 Feb 2020 10:09:42 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-04 02:34:05.320081
- Title: Arabic Diacritic Recovery Using a Feature-Rich biLSTM Model
- Title(参考訳): Feature-Rich biLSTMモデルによるアラビア語の発音回復
- Authors: Kareem Darwish, Ahmed Abdelali, Hamdy Mubarak, Mohamed Eldesouki
- Abstract要約: 方言(短母音)は通常アラビア文字を書く際に省略され、読み手はそれらを正しく発音するために再導入する必要がある。
機能豊富なリカレントニューラルネットワークモデルを用いて,様々な言語的特徴と表面的特徴を用いて,コアワードダイアクリティカルとケースエンドの両方を復元する。
我々のモデルは、CWエラーレート2.86%、CEエラーレート3.7%、CWER2.2%、CEER2.5%の古典アラビア語2.5%を超越している。
- 参考スコア(独自算出の注目度): 9.249906540881627
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diacritics (short vowels) are typically omitted when writing Arabic text, and
readers have to reintroduce them to correctly pronounce words. There are two
types of Arabic diacritics: the first are core-word diacritics (CW), which
specify the lexical selection, and the second are case endings (CE), which
typically appear at the end of the word stem and generally specify their
syntactic roles. Recovering CEs is relatively harder than recovering core-word
diacritics due to inter-word dependencies, which are often distant. In this
paper, we use a feature-rich recurrent neural network model that uses a variety
of linguistic and surface-level features to recover both core word diacritics
and case endings. Our model surpasses all previous state-of-the-art systems
with a CW error rate (CWER) of 2.86\% and a CE error rate (CEER) of 3.7% for
Modern Standard Arabic (MSA) and CWER of 2.2% and CEER of 2.5% for Classical
Arabic (CA). When combining diacritized word cores with case endings, the
resultant word error rate is 6.0% and 4.3% for MSA and CA respectively. This
highlights the effectiveness of feature engineering for such deep neural
models.
- Abstract(参考訳): 方言(短母音)は通常アラビア文字を書く際に省略され、読み手はそれらを正しく発音するために再導入する必要がある。
アラビア語のダイアクリティカルは2種類あり、第1は語彙選択を規定するコアワードダイアクリティカル(CW)、第2はケースエンディング(CE)であり、通常は語幹の端に現れ、一般的にそれらの構文的役割を規定する。
CEのリカバリは、単語間の依存関係のため、コアワードのダイアクリティカルティクスを回復するよりも比較的難しい。
本稿では,言語的特徴と表面的特徴を多用した機能豊富なリカレントニューラルネットワークモデルを用いて,コアワードのダイアクリティカルティクスとケースエンディングの両方を復元する。
本モデルでは,従来の2.86\%のcwエラー率と3.7%のceエラー率 (ceer) と2.2%のcwerと2.5%の古典アラビア語 (ca) のceをそれぞれ上回っている。
ダイアクリッド化した単語コアとケースエンディングとを組み合わせると、それぞれMSAとCAそれぞれ6.0%と4.3%となる。
これは、そのような深層神経モデルに対する機能工学の有効性を強調している。
関連論文リスト
- One Language, Many Gaps: Evaluating Dialect Fairness and Robustness of Large Language Models in Reasoning Tasks [55.35278531907263]
本稿では,大言語モデルの公平性と頑健性に関する最初の研究を標準的推論タスクにおける方言に提示する。
我々は、HumanEvalやGSM8Kといった7つの人気のあるベンチマークを書き換えるために、AAVEスピーカーを採用。
標準英語と比較して、これらの広く使われているモデルのほとんどは、AAVEのクエリに対して重大な脆さと不公平さを示している。
論文 参考訳(メタデータ) (2024-10-14T18:44:23Z) - LM-assisted keyword biasing with Aho-Corasick algorithm for Transducer-based ASR [3.841280537264271]
そこで本研究では,音声認識性能向上のためのライトオンザフライ方式を提案する。
我々は、名前付きエンティティのバイアスリストと単語レベルのn-gram言語モデルと、Aho-Corasick文字列マッチングアルゴリズムに基づく浅い融合アプローチを組み合わせる。
逆実時間係数の実用的差のない一般単語誤り率の21.6%の相対的な改善を実現した。
論文 参考訳(メタデータ) (2024-09-20T13:53:37Z) - Chinese Spelling Correction as Rephrasing Language Model [63.65217759957206]
文中のスペル誤りを検知し,訂正することを目的とした中国語スペル補正(CSC)について検討する。
現在の最先端の手法は、CSCをシーケンスタギングタスクと文対上の細いBERTベースのモデルとみなしている。
本稿では,文字から文字へのタグ付けではなく,追加のスロットを埋め込むことで文全体を言い換える言語モデル(ReLM)を提案する。
論文 参考訳(メタデータ) (2023-08-17T06:04:28Z) - Take the Hint: Improving Arabic Diacritization with
Partially-Diacritized Text [4.863310073296471]
本稿では,任意のダイアクリティカルティクスを効果的にサポートするマルチソースモデルである2SDiacを提案する。
また、ランダムマスキングのレベルが異なる入力において、与えられたダイアクリティカルを活用できるトレーニングスキームであるガイドドラーニングを導入する。
論文 参考訳(メタデータ) (2023-06-06T10:18:17Z) - SpellMapper: A non-autoregressive neural spellchecker for ASR
customization with candidate retrieval based on n-gram mappings [76.87664008338317]
文脈スペル補正モデルは、音声認識を改善するために浅い融合に代わるものである。
ミススペルn-gramマッピングに基づく候補探索のための新しいアルゴリズムを提案する。
Spoken Wikipediaの実験では、ベースラインのASRシステムに比べて21.4%のワードエラー率の改善が見られた。
論文 参考訳(メタデータ) (2023-06-04T10:00:12Z) - CTC-based Non-autoregressive Speech Translation [51.37920141751813]
非自己回帰音声翻訳における接続性時間分類の可能性について検討する。
我々は、CTCによって誘導される2つのエンコーダからなるモデルを構築し、ソースおよびターゲットテキストを予測する。
MuST-Cベンチマークの実験では、我々のNASTモデルは平均BLEUスコアが29.5であり、スピードアップは5.67$times$である。
論文 参考訳(メタデータ) (2023-05-27T03:54:09Z) - Is Word Error Rate a good evaluation metric for Speech Recognition in
Indic Languages? [0.0]
自動音声認識(ASR)における誤り率計算のための新しい手法を提案する。
この新しいメートル法は、半分の文字を持ち、同じ文字を異なる形式で書くことができる言語のためのものである。
私たちは、インディ・コンテクストの主要な言語の一つであるヒンディー語で方法論を実装しています。
論文 参考訳(メタデータ) (2022-03-30T18:32:08Z) - End-to-end contextual asr based on posterior distribution adaptation for
hybrid ctc/attention system [61.148549738631814]
エンドツーエンド(E2E)音声認識アーキテクチャは、従来の音声認識システムのすべてのコンポーネントを単一のモデルに組み立てる。
これはASRシステムを単純化するが、文脈的ASRの欠点を導入している: E2Eモデルは、頻繁な固有名詞を含む発話に対して、より悪い性能を持つ。
本稿では,文脈的単語認識能力を向上させるために,文脈バイアスアテンション(CBA)モジュールをアテンションベースエンコーダデコーダ(AED)モデルに追加することを提案する。
論文 参考訳(メタデータ) (2022-02-18T03:26:02Z) - NLP-CIC @ DIACR-Ita: POS and Neighbor Based Distributional Models for
Lexical Semantic Change in Diachronic Italian Corpora [62.997667081978825]
本稿では,イタリア語に対する教師なし語彙意味変化のシステムと知見について述べる。
その課題は、対象の単語が時間とともにその意味を進化させたかどうかを判断することであり、それは2つの時間固有のデータセットからの原文のみに依存する。
本研究では,各期間に対象単語を表す2つのモデルを提案し,しきい値と投票方式を用いて変化単語を予測する。
論文 参考訳(メタデータ) (2020-11-07T11:27:18Z) - Deep Diacritization: Efficient Hierarchical Recurrence for Improved
Arabic Diacritization [0.0]
本稿では,Tashkeela Arabic diacritizationベンチマークにおいて,文字列のラベル付けのための新しいアーキテクチャを提案する。
コアは2段階の繰り返し階層であり、単語レベルと文字レベルを別々に操作する。
クロスレベルアテンションモジュールは、さらにこの2つを接続し、ネットワーク解釈性のための扉を開く。
論文 参考訳(メタデータ) (2020-11-01T15:33:43Z) - A Multitask Learning Approach for Diacritic Restoration [21.288912928687186]
アラビア語のような多くの言語では、発音と意味を区別するためにダイアクリティカルが用いられる。
このようなダイアクリティカル語はテキストで省略されることが多く、単語の発音や意味の数が増加する。
我々は、共同モデリングにおいて考慮すべきタスクに十分なデータ資源があるため、ケーススタディとしてアラビア語を使用します。
論文 参考訳(メタデータ) (2020-06-07T01:20:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。