論文の概要: English to Bangla Machine Translation Using Recurrent Neural Network
- arxiv url: http://arxiv.org/abs/2106.07225v1
- Date: Mon, 14 Jun 2021 08:26:50 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-16 03:05:49.926304
- Title: English to Bangla Machine Translation Using Recurrent Neural Network
- Title(参考訳): リカレントニューラルネットワークを用いた英語からバングラ語への機械翻訳
- Authors: Shaykh Siddique, Tahmid Ahmed, Md. Rifayet Azam Talukder, and Md.
Mohsin Uddin
- Abstract要約: 本稿では,バングラ語機械翻訳システムに対する英語のアーキテクチャについて述べる。
このモデルは、英語とバングラ語のマッピングに知識ベースのコンテキストベクトルを使用する。
モデルによるアプローチは、クロスエントロピー損失指標の観点から、従来の最先端システムよりも優れている。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The applications of recurrent neural networks in machine translation are
increasing in natural language processing. Besides other languages, Bangla
language contains a large amount of vocabulary. Improvement of English to
Bangla machine translation would be a significant contribution to Bangla
Language processing. This paper describes an architecture of English to Bangla
machine translation system. The system has been implemented with the
encoder-decoder recurrent neural network. The model uses a knowledge-based
context vector for the mapping of English and Bangla words. Performances of the
model based on activation functions are measured here. The best performance is
achieved for the linear activation function in encoder layer and the tanh
activation function in decoder layer. From the execution of GRU and LSTM layer,
GRU performed better than LSTM. The attention layers are enacted with softmax
and sigmoid activation function. The approach of the model outperforms the
previous state-of-the-art systems in terms of cross-entropy loss metrics. The
reader can easily find out the structure of the machine translation of English
to Bangla and the efficient activation functions from the paper.
- Abstract(参考訳): 機械翻訳におけるリカレントニューラルネットワークの応用は自然言語処理で増加している。
他の言語に加えて、バングラ語は多くの語彙を含んでいる。
英語からバングラ語への機械翻訳の改善は、バングラ語処理に重要な貢献となる。
本稿では,バングラ語機械翻訳システムに対する英語のアーキテクチャについて述べる。
このシステムは、エンコーダ-デコーダリカレントニューラルネットワークで実装されている。
このモデルは英語とバングラ語をマッピングするために知識に基づく文脈ベクトルを用いる。
ここでは、アクティベーション関数に基づくモデルの性能を測定する。
エンコーダ層における線形活性化関数とデコーダ層におけるタンハ活性化関数に対して最高の性能が得られる。
GRUおよびLSTM層の実行から、GRUはLSTMよりも優れた性能を示した。
注意層はソフトマックスとシグモイド活性化関数で実現される。
モデルによるアプローチは、クロスエントロピー損失指標の観点から、従来の最先端システムよりも優れている。
読み手は、英語からバングラ語への機械翻訳の構造と、論文から効率的なアクティベーション機能を容易に見つけることができる。
関連論文リスト
- Training Neural Networks as Recognizers of Formal Languages [87.06906286950438]
形式言語理論は、特に認識者に関するものである。
代わりに、非公式な意味でのみ類似したプロキシタスクを使用するのが一般的である。
ニューラルネットワークを文字列のバイナリ分類器として直接訓練し評価することで、このミスマッチを補正する。
論文 参考訳(メタデータ) (2024-11-11T16:33:25Z) - Interpretable Language Modeling via Induction-head Ngram Models [74.26720927767398]
誘導ヘッドngramモデル(Induction-Gram)を提案する。
この誘導ヘッドは、カスタムのニューラル類似度メトリックを使用して、モデルの入力コンテキストを効率的に検索し、潜在的に次の単語補完を行う。
実験により,本手法はベースラインの解釈可能なモデルよりも,単語の次単語予測を大幅に改善することが示された。
論文 参考訳(メタデータ) (2024-10-31T12:33:26Z) - Hindi to English: Transformer-Based Neural Machine Translation [0.0]
我々は,インド語ヒンディー語から英語への翻訳のためにトランスフォーマーモデルを訓練し,機械翻訳(NMT)システムを開発した。
トレーニングデータを増強し、語彙を作成するために、バックトランスレーションを実装した。
これにより、IIT Bombay English-Hindi Corpusのテストセットで、最先端のBLEUスコア24.53を達成することができました。
論文 参考訳(メタデータ) (2023-09-23T00:00:09Z) - LAMASSU: Streaming Language-Agnostic Multilingual Speech Recognition and
Translation Using Neural Transducers [71.76680102779765]
自動音声認識(ASR)と音声翻訳(ST)はどちらもモデル構造としてニューラルトランスデューサを使用することができる。
ニューラルトランスデューサを用いた多言語音声認識および翻訳モデルであるLAMASSUを提案する。
論文 参考訳(メタデータ) (2022-11-05T04:03:55Z) - Summarize and Generate to Back-translate: Unsupervised Translation of
Programming Languages [86.08359401867577]
バックトランスレーションは、並列データがほとんど、あるいは全く利用できない場合のニューラルマシン翻訳の有効性で広く知られている。
コード要約と生成による逆翻訳を提案する。
提案手法は最先端の手法と競合することを示す。
論文 参考訳(メタデータ) (2022-05-23T08:20:41Z) - Improving English to Sinhala Neural Machine Translation using
Part-of-Speech Tag [1.1470070927586016]
スリランカのほとんどの人は英語を正しく読めない。
現地の人々間で情報を共有するために、英語コンテンツを現地語に翻訳する、という大きな要件がある。
論文 参考訳(メタデータ) (2022-02-17T19:45:50Z) - Cross-lingual Transferring of Pre-trained Contextualized Language Models [73.97131976850424]
本稿では,PRLMのための新しい言語間モデル転送フレームワークTreLMを提案する。
シンボルの順序と言語間のシーケンス長の差に対処するため,中間的なTRILayer構造を提案する。
提案手法は,スクラッチから学習した言語モデルに対して,性能と効率の両面で,限られたデータで著しく優れることを示す。
論文 参考訳(メタデータ) (2021-07-27T06:51:13Z) - End-to-End Natural Language Understanding Pipeline for Bangla
Conversational Agents [0.43012765978447565]
本稿では,バングラ語とバングラ語でコミュニケーション可能なビジネスアシスタントを構築するための新しい手法を提案する。
Rasa Open Source Framework、fastText組み込み、Polyglot組み込み、Fraskなどのシステムをビルディングブロックとして使用しています。
本稿では,意図分類と実体抽出のためのパイプラインを提案する。
論文 参考訳(メタデータ) (2021-07-12T16:09:22Z) - Paraphrastic Representations at Scale [134.41025103489224]
私たちは、英語、アラビア語、ドイツ語、フランス語、スペイン語、ロシア語、トルコ語、中国語の訓練されたモデルをリリースします。
我々はこれらのモデルを大量のデータでトレーニングし、元の論文から大幅に性能を向上した。
論文 参考訳(メタデータ) (2021-04-30T16:55:28Z) - Neural Machine Translation model for University Email Application [1.4731169524644787]
ML-> EN, EN-> ML翻訳のための最先端のシーケンス・ツー・シーケンスニューラルネットワークをGoogle Translateと比較した。
Google TranslationのBLEUスコアが低いことは、アプリケーションベースの地域モデルの方が優れていることを示している。
論文 参考訳(メタデータ) (2020-07-20T15:05:16Z) - HausaMT v1.0: Towards English-Hausa Neural Machine Translation [0.012691047660244334]
英語・ハウサ語機械翻訳のベースラインモデルを構築した。
ハーサ語は、アラビア語に次いで世界で2番目に大きいアフロ・アジア語である。
論文 参考訳(メタデータ) (2020-06-09T02:08:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。