論文の概要: Neural Machine Translation model for University Email Application
- arxiv url: http://arxiv.org/abs/2007.16011v1
- Date: Mon, 20 Jul 2020 15:05:16 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-08 10:12:00.129770
- Title: Neural Machine Translation model for University Email Application
- Title(参考訳): 大学メールアプリケーションのためのニューラルマシン翻訳モデル
- Authors: Sandhya Aneja and Siti Nur Afikah Bte Abdul Mazid and Nagender Aneja
- Abstract要約: ML-> EN, EN-> ML翻訳のための最先端のシーケンス・ツー・シーケンスニューラルネットワークをGoogle Translateと比較した。
Google TranslationのBLEUスコアが低いことは、アプリケーションベースの地域モデルの方が優れていることを示している。
- 参考スコア(独自算出の注目度): 1.4731169524644787
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Machine translation has many applications such as news translation, email
translation, official letter translation etc. Commercial translators, e.g.
Google Translation lags in regional vocabulary and are unable to learn the
bilingual text in the source and target languages within the input. In this
paper, a regional vocabulary-based application-oriented Neural Machine
Translation (NMT) model is proposed over the data set of emails used at the
University for communication over a period of three years. A state-of-the-art
Sequence-to-Sequence Neural Network for ML -> EN and EN -> ML translations is
compared with Google Translate using Gated Recurrent Unit Recurrent Neural
Network machine translation model with attention decoder. The low BLEU score of
Google Translation in comparison to our model indicates that the application
based regional models are better. The low BLEU score of EN -> ML of our model
and Google Translation indicates that the Malay Language has complex language
features corresponding to English.
- Abstract(参考訳): 機械翻訳にはニュース翻訳、電子メール翻訳、公式文字翻訳など多くの応用がある。
例えば、Google翻訳のような商業翻訳者は、地域語彙のラグがあり、ソースのバイリンガルテキストと入力内のターゲット言語を学習できない。
本稿では,大学における3年間のコミュニケーションに使用する電子メールのデータセットに対して,地域語彙に基づくアプリケーション指向ニューラルマシン翻訳(nmt)モデルを提案する。
ml -> en と en -> ml 翻訳のための最先端のシーケンシャル・ツー・シーケンスニューラルネットワークを,アテンションデコーダを用いたゲート型リカレントユニットリカレントニューラルネットワーク機械翻訳モデルを用いてgoogle translateと比較した。
Google Translationの低いBLEUスコアは、我々のモデルと比較すると、アプリケーションベースの地域モデルの方が優れていることを示している。
我々のモデルとGoogle翻訳の低BLEUスコアは、マレー語が英語に対応する複雑な言語特徴を持っていることを示している。
関連論文リスト
- The Effect of Normalization for Bi-directional Amharic-English Neural
Machine Translation [53.907805815477126]
本稿では,比較的大規模なアムハラ語-英語並列文データセットを提案する。
我々は、既存のFacebook M2M100事前学習モデルを微調整することで、双方向のアムハラ語翻訳モデルを構築する。
その結果, 両方向のアンハラ語・英語機械翻訳の性能は, アンハラ語ホモホン文字の正規化により向上することが示唆された。
論文 参考訳(メタデータ) (2022-10-27T07:18:53Z) - Improving Multilingual Neural Machine Translation System for Indic
Languages [0.0]
低リソース言語翻訳に関わる問題に対処する多言語ニューラルマシン翻訳(MNMT)システムを提案する。
提案モデルの実現には最先端のトランスフォーマーアーキテクチャを用いる。
大量のデータに対する試行は、従来のモデルよりもその優位性を明らかにしている。
論文 参考訳(メタデータ) (2022-09-27T09:51:56Z) - The first neural machine translation system for the Erzya language [0.0951828574518325]
絶滅危惧言語エルジーア語とロシア語を翻訳するための最初のニューラルマシン翻訳システムを提案する。
BLEUのスコアはエルジーア語とロシア語への翻訳で17と19であり、翻訳の半数以上が母語話者によって受け入れられていると評価されている。
収集したテキストコーパス、新しい言語識別モデル、Erzya言語に適応した多言語文エンコーダとともに、翻訳モデルをリリースする。
論文 参考訳(メタデータ) (2022-09-19T22:21:37Z) - Improving English to Sinhala Neural Machine Translation using
Part-of-Speech Tag [1.1470070927586016]
スリランカのほとんどの人は英語を正しく読めない。
現地の人々間で情報を共有するために、英語コンテンツを現地語に翻訳する、という大きな要件がある。
論文 参考訳(メタデータ) (2022-02-17T19:45:50Z) - Improving Multilingual Translation by Representation and Gradient
Regularization [82.42760103045083]
表現レベルと勾配レベルの両方でNMTモデルを正規化するための共同手法を提案する。
提案手法は,オフターゲット翻訳の発生率の低減とゼロショット翻訳性能の向上に有効であることを示す。
論文 参考訳(メタデータ) (2021-09-10T10:52:21Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z) - Unsupervised Transfer Learning in Multilingual Neural Machine
Translation with Cross-Lingual Word Embeddings [72.69253034282035]
我々は、言語独立多言語文表現を活用し、新しい言語に容易に一般化する。
複数のロマンス言語を含むベースシステムを用いてポルトガル語から盲目的に復号し、ポルトガル語では36.4 BLEU、ロシア語では12.8 BLEUのスコアを得た。
非反復的逆翻訳によるより実用的な適応アプローチを探求し、高品質の翻訳を生産するモデルの能力を活用します。
論文 参考訳(メタデータ) (2021-03-11T14:22:08Z) - Reusing a Pretrained Language Model on Languages with Limited Corpora
for Unsupervised NMT [129.99918589405675]
本稿では,オープンソース言語上でのみ事前訓練されたLMを再利用する効果的な手法を提案する。
モノリンガルLMは両言語で微調整され、UNMTモデルの初期化に使用される。
我々のアプローチであるRE-LMは、英語・マケドニア語(En-Mk)と英語・アルバニア語(En-Sq)の競合言語間事前学習モデル(XLM)より優れています。
論文 参考訳(メタデータ) (2020-09-16T11:37:10Z) - HausaMT v1.0: Towards English-Hausa Neural Machine Translation [0.012691047660244334]
英語・ハウサ語機械翻訳のベースラインモデルを構築した。
ハーサ語は、アラビア語に次いで世界で2番目に大きいアフロ・アジア語である。
論文 参考訳(メタデータ) (2020-06-09T02:08:03Z) - It's Easier to Translate out of English than into it: Measuring Neural
Translation Difficulty by Cross-Mutual Information [90.35685796083563]
クロスミューチュアル情報(英: Cross-mutual information、XMI)は、機械翻訳の難易度に関する非対称情報理論の指標である。
XMIは、ほとんどのニューラルマシン翻訳モデルの確率的性質を利用する。
本稿では,現代ニューラル翻訳システムを用いた言語間翻訳の難易度に関する最初の体系的および制御的な研究について述べる。
論文 参考訳(メタデータ) (2020-05-05T17:38:48Z) - Neural Machine Translation for Low-Resourced Indian Languages [4.726777092009554]
機械翻訳は、人間の関与なしにテキストを別の言語に変換する効果的な手法である。
本稿では,NMTを英語・タミル語・英語・マラヤラム語という,最も形態学的に豊かな2つの言語に適用した。
我々は,BPE(Byte-Pair-Encoded)とMultiBPE(MultiBPE)を併用したマルチヘッド自己アテンション(Multihead self-attention)を用いた新しいNMTモデルを提案し,効率的な翻訳システムを開発した。
論文 参考訳(メタデータ) (2020-04-19T17:29:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。