論文の概要: From Zero to Production: Baltic-Ukrainian Machine Translation Systems to
Aid Refugees
- arxiv url: http://arxiv.org/abs/2209.14142v1
- Date: Wed, 28 Sep 2022 14:46:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 16:56:14.882104
- Title: From Zero to Production: Baltic-Ukrainian Machine Translation Systems to
Aid Refugees
- Title(参考訳): ゼロから生産へ:バルト・ウクライナの機械翻訳システムから難民へ
- Authors: Toms Bergmanis and M\=arcis Pinnis
- Abstract要約: ウクライナ語とバルト諸国の公用語を翻訳する6つの低リソース機械翻訳システムの開発と利用について検討する。
ラトビア・ウクライナ系とリトアニア・ウクライナ系がバルト諸国の公共サービスに統合されていることを示す。
我々は、ウクライナの地名翻訳の改善によりMTシステムをさらに強化し、リトアニア・ウクライナシステムの改良版を公表する。
- 参考スコア(独自算出の注目度): 3.9215337270154986
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we examine the development and usage of six low-resource
machine translation systems translating between the Ukrainian language and each
of the official languages of the Baltic states. We developed these systems in
reaction to the escalating Ukrainian refugee crisis caused by the Russian
military aggression in Ukraine in the hope that they might be helpful for
refugees and public administrations. Now, two months after MT systems were made
public, we analyze their usage patterns and statistics. Our findings show that
the Latvian-Ukrainian and Lithuanian-Ukrainian systems are integrated into the
public services of Baltic states, leading to more than 127 million translated
sentences for the Lithuanian-Ukrainian system. Motivated by these findings, we
further enhance our MT systems by better Ukrainian toponym translation and
publish an improved version of the Lithuanian-Ukrainian system.
- Abstract(参考訳): 本稿では,ウクライナ語とバルト諸国の公用語を翻訳する6つの低リソース機械翻訳システムの開発と利用について検討する。
我々は、ウクライナにおけるロシア軍の侵略によるウクライナ難民危機のエスカレートに反応して、難民や行政に役立てられるよう、これらのシステムを開発した。
MTシステムが公開されてから2ヶ月が経ち、それらの利用パターンと統計を分析した。
以上の結果から,ラトビア・ウクライナ系とリトアニア・ウクライナ系はバルト諸国の公共サービスに統合され,リトアニア・ウクライナ系の翻訳文は1億1700万件を超えることがわかった。
これらの知見に触発され、ウクライナの地名翻訳の改善によりMTシステムをさらに強化し、リトアニア・ウクライナシステムの改良版を公表した。
関連論文リスト
- Neural machine translation system for Lezgian, Russian and Azerbaijani languages [0.0]
我々は、ロシア語、アゼルバイジャン語および絶滅危惧言語間の翻訳のための最初のニューラルマシン翻訳システムをリリースした。
複数の実験により、トレーニング言語ペアとデータドメインの異なるセットが、結果の翻訳品質にどのように影響するかを特定する。
論文 参考訳(メタデータ) (2024-10-07T20:08:10Z) - Decoupled Vocabulary Learning Enables Zero-Shot Translation from Unseen Languages [55.157295899188476]
ニューラルマシン翻訳システムは、異なる言語の文を共通の表現空間にマッピングすることを学ぶ。
本研究では、この仮説を未知の言語からのゼロショット翻訳により検証する。
この設定により、全く見えない言語からのゼロショット翻訳が可能になることを実証する。
論文 参考訳(メタデータ) (2024-08-05T07:58:58Z) - A Computational Analysis of the Dehumanisation of Migrants from Syria and Ukraine in Slovene News Media [8.35176751141867]
我々は、スロベニアの新聞に掲載されている移民に対する態度を研究するために、最近提案された英語のアプローチに適応する。
我々は、シリア戦争後の2015-16年の移民危機と、ウクライナ戦争後の2022-23年の移民状況の変化について検討する。
この議論は、時間とともにより否定的になり、強烈なものになったが、ウクライナからの移民に他と比べて対処する場合には、非人道的でないことが判明した。
論文 参考訳(メタデータ) (2024-04-10T14:28:09Z) - Charles Translator: A Machine Translation System between Ukrainian and Czech [0.5334687622080666]
シャルル・トランスレーターは、ロシアとウクライナの戦争が個人や社会に与える影響を緩和する社会全体の取り組みの一部として開発された。
このシステムは2022年春に多くの言語データ提供者の助けを借りて開発された。
このトランスレータは後にオンラインのウェブインターフェースとして実装され、Cyrillic-Latinスクリプトの書き起こしを特徴とする音声入力を備えたAndroidアプリとして実装された。
論文 参考訳(メタデータ) (2024-04-10T12:22:32Z) - Zero-Shot Cross-Lingual Reranking with Large Language Models for
Low-Resource Languages [51.301942056881146]
アフリカ語における言語間情報検索システムにおいて,大規模言語モデル (LLM) がリランカーとしてどのように機能するかを検討する。
私たちの実装は、英語と4つのアフリカの言語(ハウサ語、ソマリ語、スワヒリ語、ヨルバ語)を対象としています。
我々は、英語のクェリとアフリカの言葉の文節による言語横断的な格付けについて検討する。
論文 参考訳(メタデータ) (2023-12-26T18:38:54Z) - SeamlessM4T: Massively Multilingual & Multimodal Machine Translation [90.71078166159295]
音声から音声への翻訳,音声からテキストへの翻訳,テキストからテキストへの翻訳,最大100言語の自動音声認識をサポートする単一モデルSeamlessM4Tを紹介する。
我々は、音声とテキストの両方に英語を翻訳できる最初の多言語システムを開発した。
FLEURSでは、SeamlessM4Tが複数のターゲット言語への翻訳の新しい標準を設定し、音声からテキストへの直接翻訳において、以前のSOTAよりも20%BLEUの改善を実現している。
論文 参考訳(メタデータ) (2023-08-22T17:44:18Z) - Enhancing Translation for Indigenous Languages: Experiments with
Multilingual Models [57.10972566048735]
本稿では,3つの方法のシステム記述について述べる。
M2M-100とmBART50という2つの多言語モデルと1つのバイリンガル(1対1)-ヘルシンキNLPスペイン語翻訳モデルを使いました。
アメリカから11の言語を実験し、使用したセットアップと、達成した成果を報告しました。
論文 参考訳(メタデータ) (2023-05-27T08:10:40Z) - Improving Cascaded Unsupervised Speech Translation with Denoising
Back-translation [70.33052952571884]
我々は,任意のペアデータを活用することなく,カスケード音声翻訳システムを構築することを提案する。
教師なしのシステムをトレーニングし、CoVoST 2 と CVSS で結果を評価するために、完全にペア化されたデータを使用します。
論文 参考訳(メタデータ) (2023-05-12T13:07:51Z) - CUNI Systems for the WMT22 Czech-Ukrainian Translation Task [3.086665716017867]
チェコ・ウクライナ語・ウクライナ語・チェコ語機械翻訳に関するWMT22総合翻訳共有タスクをチャールズ大学に提出する。
ブロックのバックトランスレーションとタグ付きバックトランスレーションに基づく制約付き2つの提案と,ルールに基づくウクライナのロマン化の実験を行った。
以上の結果から,ロマナイゼーションが翻訳品質にわずかに影響を及ぼすことが示唆された。
論文 参考訳(メタデータ) (2022-12-01T13:25:10Z) - Tencent AI Lab - Shanghai Jiao Tong University Low-Resource Translation
System for the WMT22 Translation Task [49.916963624249355]
本稿では, Tencent AI Lab - Shanghai Jiao Tong University (TAL-SJTU) Low-Resource Translation system for the WMT22 shared taskについて述べる。
我々は、英語$Leftrightarrow$Livonianの一般的な翻訳作業に参加する。
本システムは,M2M100を対象言語に適応させる新しい手法を用いて構築した。
論文 参考訳(メタデータ) (2022-10-17T04:34:09Z) - Learning Policies for Multilingual Training of Neural Machine
Translation Systems [36.292020779233056]
低リソースのMNMT(Multilingual Neural Machine Translation)は通常、1つ以上の言語ペアの翻訳性能を改善する。
本稿では,2つの簡単な検索ベースのカリキュラムを提案し,微調整などの既存手法と併用して翻訳性能を向上させる。
論文 参考訳(メタデータ) (2021-03-11T21:38:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。