Fugu-MT 論文翻訳(概要): From Zero to Production: Baltic-Ukrainian Machine Translation Systems to Aid Refugees

論文の概要: From Zero to Production: Baltic-Ukrainian Machine Translation Systems to Aid Refugees

arxiv url: http://arxiv.org/abs/2209.14142v1
Date: Wed, 28 Sep 2022 14:46:01 GMT
ステータス: 翻訳完了
システム内更新日: 2022-09-29 16:56:14.882104
Title: From Zero to Production: Baltic-Ukrainian Machine Translation Systems to Aid Refugees
Title（参考訳）: ゼロから生産へ:バルト・ウクライナの機械翻訳システムから難民へ
Authors: Toms Bergmanis and M\=arcis Pinnis
Abstract要約: ウクライナ語とバルト諸国の公用語を翻訳する6つの低リソース機械翻訳システムの開発と利用について検討する。ラトビア・ウクライナ系とリトアニア・ウクライナ系がバルト諸国の公共サービスに統合されていることを示す。我々は、ウクライナの地名翻訳の改善によりMTシステムをさらに強化し、リトアニア・ウクライナシステムの改良版を公表する。
参考スコア（独自算出の注目度）: 3.9215337270154986
License: http://creativecommons.org/licenses/by-sa/4.0/
Abstract: In this paper, we examine the development and usage of six low-resource machine translation systems translating between the Ukrainian language and each of the official languages of the Baltic states. We developed these systems in reaction to the escalating Ukrainian refugee crisis caused by the Russian military aggression in Ukraine in the hope that they might be helpful for refugees and public administrations. Now, two months after MT systems were made public, we analyze their usage patterns and statistics. Our findings show that the Latvian-Ukrainian and Lithuanian-Ukrainian systems are integrated into the public services of Baltic states, leading to more than 127 million translated sentences for the Lithuanian-Ukrainian system. Motivated by these findings, we further enhance our MT systems by better Ukrainian toponym translation and publish an improved version of the Lithuanian-Ukrainian system.
Abstract（参考訳）: 本稿では,ウクライナ語とバルト諸国の公用語を翻訳する6つの低リソース機械翻訳システムの開発と利用について検討する。我々は、ウクライナにおけるロシア軍の侵略によるウクライナ難民危機のエスカレートに反応して、難民や行政に役立てられるよう、これらのシステムを開発した。 MTシステムが公開されてから2ヶ月が経ち、それらの利用パターンと統計を分析した。以上の結果から,ラトビア・ウクライナ系とリトアニア・ウクライナ系はバルト諸国の公共サービスに統合され,リトアニア・ウクライナ系の翻訳文は1億1700万件を超えることがわかった。これらの知見に触発され、ウクライナの地名翻訳の改善によりMTシステムをさらに強化し、リトアニア・ウクライナシステムの改良版を公表した。

関連論文リスト

Simultaneous Translation with Offline Speech and LLM Models in CUNI Submission to IWSLT 2025 [0.0]
本稿では,チャールズ大学におけるIWSLT 2025の同時音声翻訳課題について述べる。直接またはカスケードアプローチで、4つの言語ペアをすべてカバーしています。私たちのシステムのバックボーンはオフラインのWhisper音声モデルで、最先端のAlignAttと同時処理モードで翻訳と転写の両方に使用しています。
論文参考訳（メタデータ） (2025-06-20T15:27:44Z)
EmoBench-UA: A Benchmark Dataset for Emotion Detection in Ukrainian [60.61343989805093]
EmoBench-UAはウクライナのテキストで感情を検出するための最初の注釈付きデータセットである。その結果,ウクライナ語のような非主流言語における感情分類の課題が浮き彫りになった。
論文参考訳（メタデータ） (2025-05-29T09:49:57Z)
Lost in Literalism: How Supervised Training Shapes Translationese in LLMs [51.04435855143767]
大規模言語モデル(LLM)は機械翻訳において顕著な成功を収めた。しかし、過度にリテラルと不自然な翻訳を特徴とする翻訳は、依然として永続的な課題である。我々は、黄金の基準を磨き、不自然なトレーニングインスタンスをフィルタリングするなど、これらのバイアスを軽減する方法を導入する。
論文参考訳（メタデータ） (2025-03-06T12:14:45Z)
Exploring Large Language Models for Translating Romanian Computational Problems into English [0.0]
本研究では,ロバストな大規模言語モデル(LLM)が,十分に構造化されたプロンプトを与えられた場合,あまり一般的でない言語を翻訳する際に,その性能を維持あるいは向上できることを示す。 OpenRoLLM, Llama 3.1 8B, Llama 3.2 3B, GPT-4o など, 複数の LLM の翻訳手法について検討した。
論文参考訳（メタデータ） (2025-01-09T22:17:44Z)
Neural machine translation system for Lezgian, Russian and Azerbaijani languages [0.0]
我々は、ロシア語、アゼルバイジャン語および絶滅危惧言語間の翻訳のための最初のニューラルマシン翻訳システムをリリースした。複数の実験により、トレーニング言語ペアとデータドメインの異なるセットが、結果の翻訳品質にどのように影響するかを特定する。
論文参考訳（メタデータ） (2024-10-07T20:08:10Z)
Decoupled Vocabulary Learning Enables Zero-Shot Translation from Unseen Languages [55.157295899188476]
ニューラルマシン翻訳システムは、異なる言語の文を共通の表現空間にマッピングすることを学ぶ。本研究では、この仮説を未知の言語からのゼロショット翻訳により検証する。この設定により、全く見えない言語からのゼロショット翻訳が可能になることを実証する。
論文参考訳（メタデータ） (2024-08-05T07:58:58Z)
A Computational Analysis of the Dehumanisation of Migrants from Syria and Ukraine in Slovene News Media [8.35176751141867]
我々は、スロベニアの新聞に掲載されている移民に対する態度を研究するために、最近提案された英語のアプローチに適応する。我々は、シリア戦争後の2015-16年の移民危機と、ウクライナ戦争後の2022-23年の移民状況の変化について検討する。この議論は、時間とともにより否定的になり、強烈なものになったが、ウクライナからの移民に他と比べて対処する場合には、非人道的でないことが判明した。
論文参考訳（メタデータ） (2024-04-10T14:28:09Z)
Charles Translator: A Machine Translation System between Ukrainian and Czech [0.5334687622080666]
シャルル・トランスレーターは、ロシアとウクライナの戦争が個人や社会に与える影響を緩和する社会全体の取り組みの一部として開発された。このシステムは2022年春に多くの言語データ提供者の助けを借りて開発された。このトランスレータは後にオンラインのウェブインターフェースとして実装され、Cyrillic-Latinスクリプトの書き起こしを特徴とする音声入力を備えたAndroidアプリとして実装された。
論文参考訳（メタデータ） (2024-04-10T12:22:32Z)
Zero-Shot Cross-Lingual Reranking with Large Language Models for Low-Resource Languages [51.301942056881146]
アフリカ語における言語間情報検索システムにおいて,大規模言語モデル (LLM) がリランカーとしてどのように機能するかを検討する。私たちの実装は、英語と4つのアフリカの言語(ハウサ語、ソマリ語、スワヒリ語、ヨルバ語)を対象としています。我々は、英語のクェリとアフリカの言葉の文節による言語横断的な格付けについて検討する。
論文参考訳（メタデータ） (2023-12-26T18:38:54Z)
SeamlessM4T: Massively Multilingual & Multimodal Machine Translation [90.71078166159295]
音声から音声への翻訳,音声からテキストへの翻訳,テキストからテキストへの翻訳,最大100言語の自動音声認識をサポートする単一モデルSeamlessM4Tを紹介する。我々は、音声とテキストの両方に英語を翻訳できる最初の多言語システムを開発した。 FLEURSでは、SeamlessM4Tが複数のターゲット言語への翻訳の新しい標準を設定し、音声からテキストへの直接翻訳において、以前のSOTAよりも20%BLEUの改善を実現している。
論文参考訳（メタデータ） (2023-08-22T17:44:18Z)
Enhancing Translation for Indigenous Languages: Experiments with Multilingual Models [57.10972566048735]
本稿では,3つの方法のシステム記述について述べる。 M2M-100とmBART50という2つの多言語モデルと1つのバイリンガル(1対1)-ヘルシンキNLPスペイン語翻訳モデルを使いました。アメリカから11の言語を実験し、使用したセットアップと、達成した成果を報告しました。
論文参考訳（メタデータ） (2023-05-27T08:10:40Z)
Improving Cascaded Unsupervised Speech Translation with Denoising Back-translation [70.33052952571884]
我々は,任意のペアデータを活用することなく,カスケード音声翻訳システムを構築することを提案する。教師なしのシステムをトレーニングし、CoVoST 2 と CVSS で結果を評価するために、完全にペア化されたデータを使用します。
論文参考訳（メタデータ） (2023-05-12T13:07:51Z)
CUNI Systems for the WMT22 Czech-Ukrainian Translation Task [3.086665716017867]
チェコ・ウクライナ語・ウクライナ語・チェコ語機械翻訳に関するWMT22総合翻訳共有タスクをチャールズ大学に提出する。ブロックのバックトランスレーションとタグ付きバックトランスレーションに基づく制約付き2つの提案と,ルールに基づくウクライナのロマン化の実験を行った。以上の結果から,ロマナイゼーションが翻訳品質にわずかに影響を及ぼすことが示唆された。
論文参考訳（メタデータ） (2022-12-01T13:25:10Z)
Tencent AI Lab - Shanghai Jiao Tong University Low-Resource Translation System for the WMT22 Translation Task [49.916963624249355]
本稿では, Tencent AI Lab - Shanghai Jiao Tong University (TAL-SJTU) Low-Resource Translation system for the WMT22 shared taskについて述べる。我々は、英語$Leftrightarrow$Livonianの一般的な翻訳作業に参加する。本システムは,M2M100を対象言語に適応させる新しい手法を用いて構築した。
論文参考訳（メタデータ） (2022-10-17T04:34:09Z)
Learning Policies for Multilingual Training of Neural Machine Translation Systems [36.292020779233056]
低リソースのMNMT(Multilingual Neural Machine Translation)は通常、1つ以上の言語ペアの翻訳性能を改善する。本稿では,2つの簡単な検索ベースのカリキュラムを提案し,微調整などの既存手法と併用して翻訳性能を向上させる。
論文参考訳（メタデータ） (2021-03-11T21:38:04Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。