Fugu-MT 論文翻訳(概要): Towards a general purpose machine translation system for Sranantongo

論文の概要: Towards a general purpose machine translation system for Sranantongo

arxiv url: http://arxiv.org/abs/2212.06383v1
Date: Tue, 13 Dec 2022 05:36:18 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-14 14:29:22.433588
Title: Towards a general purpose machine translation system for Sranantongo
Title（参考訳）: Sranantongoの汎用機械翻訳システムに向けて
Authors: Just Zwennicker, David Stap
Abstract要約: スラナントンゴ語(Sranantongo, Sranan, srn)は、スリナムで主に話される低資源クレオール語である。本研究では,スンのための汎用機械翻訳システムを構築する。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Machine translation for Sranantongo (Sranan, srn), a low-resource Creole language spoken predominantly in Surinam, is virgin territory. In this study we create a general purpose machine translation system for srn. In order to facilitate this research, we introduce the SRNcorpus, a collection of parallel Dutch (nl) to srn and monolingual srn data. We experiment with a wide range of proven machine translation methods. Our results demonstrate a strong baseline machine translation system for srn.
Abstract（参考訳）: スラナントンゴ語(Sranantongo, Sranan, srn)は、スリナムで主に話される低資源クレオール語である。本研究では,srnのための汎用機械翻訳システムを提案する。そこで本研究では,srnデータおよび単言語srnデータに対する並列オランダ語(nl)のコレクションであるsrncorpusを紹介する。我々は、幅広い証明された機械翻訳法を実験する。本研究は,srnのための強力なベースライン機械翻訳システムを示す。

関連論文リスト

Evaluating Automatic Metrics with Incremental Machine Translation Systems [55.78547133890403]
商業機械翻訳からなるデータセットを導入し,12の翻訳方向から6年間にわたって収集した。商業システムは時間とともに改善され、より最近の翻訳の好みに基づいて機械翻訳(MT)メトリクスを評価することができると仮定する。
論文参考訳（メタデータ） (2024-07-03T17:04:17Z)
LexMatcher: Dictionary-centric Data Collection for LLM-based Machine Translation [67.24113079928668]
本稿では、バイリンガル辞書に見られる感覚のカバレッジによって駆動されるデータキュレーション手法であるLexMatcherを提案する。我々の手法は、WMT2022テストセットの確立されたベースラインよりも優れています。
論文参考訳（メタデータ） (2024-06-03T15:30:36Z)
A Tulu Resource for Machine Translation [3.038642416291856]
英語・トゥルー語翻訳のための最初の並列データセットを提案する。トゥル語はインド南西部で約250万人が話されている。パラレル・イングリッシュ・トゥルデータを使わずにトレーニングした我々のイングリッシュ・トゥルシステムは、Google Translateを19のBLEUポイントで上回っている。
論文参考訳（メタデータ） (2024-03-28T04:30:07Z)
Bilingual Corpus Mining and Multistage Fine-Tuning for Improving Machine Translation of Lecture Transcripts [50.00305136008848]
本研究では,並列コーパスマイニングのためのフレームワークを提案し,Coursera の公開講義から並列コーパスを迅速かつ効果的にマイニングする方法を提案する。日英両国の講義翻訳において,約5万行の並列コーパスを抽出し,開発・テストセットを作成した。また,コーパスの収集とクリーニング,並列文のマイニング,マイニングデータのクリーニング,高品質な評価スプリットの作成に関するガイドラインも提案した。
論文参考訳（メタデータ） (2023-11-07T03:50:25Z)
Decomposed Prompting for Machine Translation Between Related Languages using Large Language Models [55.35106713257871]
DecoMTは、単語チャンク翻訳のシーケンスに翻訳プロセスを分解する、数発のプロンプトの新しいアプローチである。 DecoMTはBLOOMモデルよりも優れていることを示す。
論文参考訳（メタデータ） (2023-05-22T14:52:47Z)
Central Kurdish machine translation: First large scale parallel corpus and experiments [2.099922236065961]
229,222対の手作業による翻訳を含む、中央クルド語英語のAwtaの最初の大規模並列コーパスを提示する。ベストパフォーマンスシステムは,それぞれ,Ku$rightarrow$ENとEn$rightarrow$KuのBLEUスコアで22.72と16.81を達成する。
論文参考訳（メタデータ） (2021-06-17T08:41:53Z)
Extremely low-resource machine translation for closely related languages [0.0]
この研究は、エストニア語とフィンランド語というウラル語族の近縁言語に焦点を当てている。多言語学習と合成コーパスにより,各言語対の翻訳品質が向上することがわかった。転送学習と微調整は低リソースの機械翻訳に非常に効果的であり、最良の結果が得られることを示す。
論文参考訳（メタデータ） (2021-05-27T11:27:06Z)
Extended Parallel Corpus for Amharic-English Machine Translation [0.0]
リソース不足の言語であるamharicの機械翻訳に有用である。コーパスを用いて,ニューラルマシン翻訳とフレーズベース統計機械翻訳モデルを訓練した。
論文参考訳（メタデータ） (2021-04-08T06:51:08Z)
Exploiting Neural Query Translation into Cross Lingual Information Retrieval [49.167049709403166]
既存のCLIRシステムは、高度ニューラルネットワーク翻訳(NMT)ではなく、統計ベースの機械翻訳(SMT)を主に活用している本稿では,ユーザクリックスルーデータに基づいてクエリ変換ペアを抽出する新しいデータ拡張手法を提案する。実験結果から,提案手法は強いベースラインよりも高い検索精度が得られることがわかった。
論文参考訳（メタデータ） (2020-10-26T15:28:19Z)
SJTU-NICT's Supervised and Unsupervised Neural Machine Translation Systems for the WMT20 News Translation Task [111.91077204077817]
我々は英語・中国語・英語・ポーランド語・ドイツ語・アッパー・ソルビアンという3つの言語対の4つの翻訳指導に参加した。言語ペアの異なる条件に基づいて、我々は多様なニューラルネットワーク翻訳(NMT)技術の実験を行った。私たちの提出書では、主要なシステムは英語、中国語、ポーランド語、英語、ドイツ語から上セルビア語への翻訳の道順で第一位を獲得しました。
論文参考訳（メタデータ） (2020-10-11T00:40:05Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。