論文の概要: CUNI Systems for the WMT22 Czech-Ukrainian Translation Task
- arxiv url: http://arxiv.org/abs/2212.00486v1
- Date: Thu, 1 Dec 2022 13:25:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-02 15:56:20.116256
- Title: CUNI Systems for the WMT22 Czech-Ukrainian Translation Task
- Title(参考訳): WMT22チェコ・ウクライナ翻訳タスクのためのCUNIシステム
- Authors: Martin Popel, Jind\v{r}ich Libovick\'y, Jind\v{r}ich Helcl
- Abstract要約: チェコ・ウクライナ語・ウクライナ語・チェコ語機械翻訳に関するWMT22総合翻訳共有タスクをチャールズ大学に提出する。
ブロックのバックトランスレーションとタグ付きバックトランスレーションに基づく制約付き2つの提案と,ルールに基づくウクライナのロマン化の実験を行った。
以上の結果から,ロマナイゼーションが翻訳品質にわずかに影響を及ぼすことが示唆された。
- 参考スコア(独自算出の注目度): 3.086665716017867
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We present Charles University submissions to the WMT22 General Translation
Shared Task on Czech-Ukrainian and Ukrainian-Czech machine translation. We
present two constrained submissions based on block back-translation and tagged
back-translation and experiment with rule-based romanization of Ukrainian. Our
results show that the romanization only has a minor effect on the translation
quality. Further, we describe Charles Translator, a system that was developed
in March 2022 as a response to the migration from Ukraine to the Czech
Republic. Compared to our constrained systems, it did not use the romanization
and used some proprietary data sources.
- Abstract(参考訳): チェコ・ウクライナ語・ウクライナ語・チェコ語機械翻訳に関するWMT22総合翻訳共有タスクをチャールズ大学に提出する。
ブロックのバックトランスレーションとタグ付きバックトランスレーションに基づく制約付き2つの提案と,ルールに基づくウクライナのロマン化の実験を行った。
その結果,ローマ字化は翻訳品質にわずかな影響しか及ぼさないことがわかった。
さらに、2022年3月にウクライナからチェコへの移民に対応するために開発されたチャールズ・トランスレーターについて述べる。
制約のあるシステムと比較して、ローマ化は使用せず、プロプライエタリなデータソースも使用しました。
関連論文リスト
- HW-TSC's Submission to the CCMT 2024 Machine Translation Tasks [12.841065384808733]
我々はバイリンガル機械翻訳タスクとマルチドメイン機械翻訳タスクに参加する。
これら2つの翻訳タスクでは,正規化ドロップアウト,双方向トレーニング,データ多様化,前方翻訳,後方翻訳,交互学習,カリキュラム学習,トランスダクティブアンサンブル学習などの学習戦略を用いる。
論文 参考訳(メタデータ) (2024-09-23T09:20:19Z) - Charles Translator: A Machine Translation System between Ukrainian and Czech [0.5334687622080666]
シャルル・トランスレーターは、ロシアとウクライナの戦争が個人や社会に与える影響を緩和する社会全体の取り組みの一部として開発された。
このシステムは2022年春に多くの言語データ提供者の助けを借りて開発された。
このトランスレータは後にオンラインのウェブインターフェースとして実装され、Cyrillic-Latinスクリプトの書き起こしを特徴とする音声入力を備えたAndroidアプリとして実装された。
論文 参考訳(メタデータ) (2024-04-10T12:22:32Z) - Enhancing Translation for Indigenous Languages: Experiments with
Multilingual Models [57.10972566048735]
本稿では,3つの方法のシステム記述について述べる。
M2M-100とmBART50という2つの多言語モデルと1つのバイリンガル(1対1)-ヘルシンキNLPスペイン語翻訳モデルを使いました。
アメリカから11の言語を実験し、使用したセットアップと、達成した成果を報告しました。
論文 参考訳(メタデータ) (2023-05-27T08:10:40Z) - A Bilingual Parallel Corpus with Discourse Annotations [82.07304301996562]
本稿では,Jiang et al. (2022)で最初に導入された大きな並列コーパスであるBWBと,注釈付きテストセットについて述べる。
BWBコーパスは、専門家によって英語に翻訳された中国の小説で構成されており、注釈付きテストセットは、様々な談話現象をモデル化する機械翻訳システムの能力を調査するために設計されている。
論文 参考訳(メタデータ) (2022-10-26T12:33:53Z) - Gui at MixMT 2022 : English-Hinglish: An MT approach for translation of
code mixed data [13.187116325089951]
私たちは英語+ヒンディー語、ヒングリッシュ語、ヒングリッシュ語の両方で同じことを試みています。
我々の知る限り、私たちはモノリンガルからコードミクシング機械翻訳の最初のタスクにおいて、ROUGE-LとWERの上位スコアの1つを達成しました。
論文 参考訳(メタデータ) (2022-10-21T19:48:18Z) - Tencent AI Lab - Shanghai Jiao Tong University Low-Resource Translation
System for the WMT22 Translation Task [49.916963624249355]
本稿では, Tencent AI Lab - Shanghai Jiao Tong University (TAL-SJTU) Low-Resource Translation system for the WMT22 shared taskについて述べる。
我々は、英語$Leftrightarrow$Livonianの一般的な翻訳作業に参加する。
本システムは,M2M100を対象言語に適応させる新しい手法を用いて構築した。
論文 参考訳(メタデータ) (2022-10-17T04:34:09Z) - From Zero to Production: Baltic-Ukrainian Machine Translation Systems to
Aid Refugees [3.9215337270154986]
ウクライナ語とバルト諸国の公用語を翻訳する6つの低リソース機械翻訳システムの開発と利用について検討する。
ラトビア・ウクライナ系とリトアニア・ウクライナ系がバルト諸国の公共サービスに統合されていることを示す。
我々は、ウクライナの地名翻訳の改善によりMTシステムをさらに強化し、リトアニア・ウクライナシステムの改良版を公表する。
論文 参考訳(メタデータ) (2022-09-28T14:46:01Z) - CUNI systems for WMT21: Multilingual Low-Resource Translation for
Indo-European Languages Shared Task [0.0]
複数の類似言語ペアに対してジョイントモデルを使用することで,各ペアの翻訳品質が向上することを示す。
また,チャララクタレベルのバイリンガルモデルと非常に類似した言語対が競合することを示す。
論文 参考訳(メタデータ) (2021-09-20T08:10:39Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z) - The LMU Munich System for the WMT 2020 Unsupervised Machine Translation
Shared Task [125.06737861979299]
本稿では,LMUミュンヘンのWMT 2020における非教師なし共有タスクへの2つの言語方向の提出について述べる。
我々のunsupervised neural machine translation (UNMT) システムは Chronopoulou et al の戦略に従っている。
我々は、最高の性能のシステムを集め、ドイツ語で32.4点、上セルビアで35.2点、ドイツで35.2点に達した。
論文 参考訳(メタデータ) (2020-10-25T19:04:03Z) - SJTU-NICT's Supervised and Unsupervised Neural Machine Translation
Systems for the WMT20 News Translation Task [111.91077204077817]
我々は英語・中国語・英語・ポーランド語・ドイツ語・アッパー・ソルビアンという3つの言語対の4つの翻訳指導に参加した。
言語ペアの異なる条件に基づいて、我々は多様なニューラルネットワーク翻訳(NMT)技術の実験を行った。
私たちの提出書では、主要なシステムは英語、中国語、ポーランド語、英語、ドイツ語から上セルビア語への翻訳の道順で第一位を獲得しました。
論文 参考訳(メタデータ) (2020-10-11T00:40:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。