論文の概要: From Zero to Production: Baltic-Ukrainian Machine Translation Systems to
Aid Refugees
- arxiv url: http://arxiv.org/abs/2209.14142v1
- Date: Wed, 28 Sep 2022 14:46:01 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-29 16:56:14.882104
- Title: From Zero to Production: Baltic-Ukrainian Machine Translation Systems to
Aid Refugees
- Title(参考訳): ゼロから生産へ:バルト・ウクライナの機械翻訳システムから難民へ
- Authors: Toms Bergmanis and M\=arcis Pinnis
- Abstract要約: ウクライナ語とバルト諸国の公用語を翻訳する6つの低リソース機械翻訳システムの開発と利用について検討する。
ラトビア・ウクライナ系とリトアニア・ウクライナ系がバルト諸国の公共サービスに統合されていることを示す。
我々は、ウクライナの地名翻訳の改善によりMTシステムをさらに強化し、リトアニア・ウクライナシステムの改良版を公表する。
- 参考スコア(独自算出の注目度): 3.9215337270154986
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: In this paper, we examine the development and usage of six low-resource
machine translation systems translating between the Ukrainian language and each
of the official languages of the Baltic states. We developed these systems in
reaction to the escalating Ukrainian refugee crisis caused by the Russian
military aggression in Ukraine in the hope that they might be helpful for
refugees and public administrations. Now, two months after MT systems were made
public, we analyze their usage patterns and statistics. Our findings show that
the Latvian-Ukrainian and Lithuanian-Ukrainian systems are integrated into the
public services of Baltic states, leading to more than 127 million translated
sentences for the Lithuanian-Ukrainian system. Motivated by these findings, we
further enhance our MT systems by better Ukrainian toponym translation and
publish an improved version of the Lithuanian-Ukrainian system.
- Abstract(参考訳): 本稿では,ウクライナ語とバルト諸国の公用語を翻訳する6つの低リソース機械翻訳システムの開発と利用について検討する。
我々は、ウクライナにおけるロシア軍の侵略によるウクライナ難民危機のエスカレートに反応して、難民や行政に役立てられるよう、これらのシステムを開発した。
MTシステムが公開されてから2ヶ月が経ち、それらの利用パターンと統計を分析した。
以上の結果から,ラトビア・ウクライナ系とリトアニア・ウクライナ系はバルト諸国の公共サービスに統合され,リトアニア・ウクライナ系の翻訳文は1億1700万件を超えることがわかった。
これらの知見に触発され、ウクライナの地名翻訳の改善によりMTシステムをさらに強化し、リトアニア・ウクライナシステムの改良版を公表した。
関連論文リスト
- Zero-Shot Cross-Lingual Reranking with Large Language Models for
Low-Resource Languages [51.301942056881146]
アフリカ語における言語間情報検索システムにおいて,大規模言語モデル (LLM) がリランカーとしてどのように機能するかを検討する。
私たちの実装は、英語と4つのアフリカの言語(ハウサ語、ソマリ語、スワヒリ語、ヨルバ語)を対象としています。
我々は、英語のクェリとアフリカの言葉の文節による言語横断的な格付けについて検討する。
論文 参考訳(メタデータ) (2023-12-26T18:38:54Z) - SeamlessM4T: Massively Multilingual & Multimodal Machine Translation [90.71078166159295]
音声から音声への翻訳,音声からテキストへの翻訳,テキストからテキストへの翻訳,最大100言語の自動音声認識をサポートする単一モデルSeamlessM4Tを紹介する。
我々は、音声とテキストの両方に英語を翻訳できる最初の多言語システムを開発した。
FLEURSでは、SeamlessM4Tが複数のターゲット言語への翻訳の新しい標準を設定し、音声からテキストへの直接翻訳において、以前のSOTAよりも20%BLEUの改善を実現している。
論文 参考訳(メタデータ) (2023-08-22T17:44:18Z) - From Ukraine to the World: Using LinkedIn Data to Monitor Professional
Migration from Ukraine [3.5493798890908104]
熟練したプロのウクライナからの強制移住は、2014年のウクライナ紛争と2022年のロシア侵攻によって引き起こされた。
我々は、主にポーランドとドイツに惹かれる、教育を受けた個人の継続的な、そしてエスカレートするエクソドスを特定します。
主な発見は、高度に教育されたウクライナ人転職者のLinkedInの推定と国連難民統計との強い相関関係である。
論文 参考訳(メタデータ) (2023-07-19T13:38:44Z) - Enhancing Translation for Indigenous Languages: Experiments with
Multilingual Models [57.10972566048735]
本稿では,3つの方法のシステム記述について述べる。
M2M-100とmBART50という2つの多言語モデルと1つのバイリンガル(1対1)-ヘルシンキNLPスペイン語翻訳モデルを使いました。
アメリカから11の言語を実験し、使用したセットアップと、達成した成果を報告しました。
論文 参考訳(メタデータ) (2023-05-27T08:10:40Z) - Improving Cascaded Unsupervised Speech Translation with Denoising
Back-translation [70.33052952571884]
我々は,任意のペアデータを活用することなく,カスケード音声翻訳システムを構築することを提案する。
教師なしのシステムをトレーニングし、CoVoST 2 と CVSS で結果を評価するために、完全にペア化されたデータを使用します。
論文 参考訳(メタデータ) (2023-05-12T13:07:51Z) - Migration Reframed? A multilingual analysis on the stance shift in
Europe during the Ukrainian crisis [0.0]
我々は、ヨーロッパと選択されたヨーロッパ諸国における移住関連メディアの報道と関連するソーシャルメディアの相互作用を分析した。
分析されたすべてのケースは、ウクライナでの戦争開始前後に顕著な時間的スタンスの変化を示している。
それでも、このシフトの規模と安定性には、明らかに全国的な違いがある。
論文 参考訳(メタデータ) (2023-02-06T14:36:33Z) - CUNI Systems for the WMT22 Czech-Ukrainian Translation Task [3.086665716017867]
チェコ・ウクライナ語・ウクライナ語・チェコ語機械翻訳に関するWMT22総合翻訳共有タスクをチャールズ大学に提出する。
ブロックのバックトランスレーションとタグ付きバックトランスレーションに基づく制約付き2つの提案と,ルールに基づくウクライナのロマン化の実験を行った。
以上の結果から,ロマナイゼーションが翻訳品質にわずかに影響を及ぼすことが示唆された。
論文 参考訳(メタデータ) (2022-12-01T13:25:10Z) - Tencent AI Lab - Shanghai Jiao Tong University Low-Resource Translation
System for the WMT22 Translation Task [49.916963624249355]
本稿では, Tencent AI Lab - Shanghai Jiao Tong University (TAL-SJTU) Low-Resource Translation system for the WMT22 shared taskについて述べる。
我々は、英語$Leftrightarrow$Livonianの一般的な翻訳作業に参加する。
本システムは,M2M100を対象言語に適応させる新しい手法を用いて構築した。
論文 参考訳(メタデータ) (2022-10-17T04:34:09Z) - Building Machine Translation Systems for the Next Thousand Languages [102.24310122155073]
1500以上の言語を対象としたクリーンでWebマイニングされたデータセットの構築、低サービス言語のための実践的なMTモデルの開発、これらの言語に対する評価指標の限界の検証という3つの研究領域における結果について述べる。
我々の研究は、現在調査中の言語のためのMTシステムの構築に取り組んでいる実践者にとって有用な洞察を提供し、データスパース設定における多言語モデルの弱点を補完する研究の方向性を強調したいと考えています。
論文 参考訳(メタデータ) (2022-05-09T00:24:13Z) - The Volctrans Neural Speech Translation System for IWSLT 2021 [26.058205594318405]
本稿では,Volctrans チームが IWSLT 2021 に提出したシステムについて述べる。
オフライン音声翻訳では,ベンチマークよりも8.1 BLEUの改善を実現している。
テキスト間同時翻訳では,wait-kモデルを最適化する最善の方法を検討する。
論文 参考訳(メタデータ) (2021-05-16T00:11:59Z) - Learning Policies for Multilingual Training of Neural Machine
Translation Systems [36.292020779233056]
低リソースのMNMT(Multilingual Neural Machine Translation)は通常、1つ以上の言語ペアの翻訳性能を改善する。
本稿では,2つの簡単な検索ベースのカリキュラムを提案し,微調整などの既存手法と併用して翻訳性能を向上させる。
論文 参考訳(メタデータ) (2021-03-11T21:38:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。