論文の概要: The Analysis of Lexical Errors in Machine Translation from English into Romanian
- arxiv url: http://arxiv.org/abs/2511.02587v1
- Date: Tue, 04 Nov 2025 14:07:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-05 18:47:06.063155
- Title: The Analysis of Lexical Errors in Machine Translation from English into Romanian
- Title(参考訳): 英語からルーマニア語への機械翻訳における語彙誤りの分析
- Authors: Angela Stamatie,
- Abstract要約: 本研究は,機械翻訳による英語からルーマニア語への翻訳における誤り解析について検討した。
この調査には、英語からルーマニア語に翻訳された230のテキストの包括的な分析が含まれる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: The research explores error analysis in the performance of translating by Machine Translation from English into Romanian, and it focuses on lexical errors found in texts which include official information, provided by the World Health Organization (WHO), the Gavi Organization, by the patient information leaflet (the information about the active ingredients of the vaccines or the medication, the indications, the dosage instructions, the storage instructions, the side effects and warning, etc.). All of these texts are related to Covid-19 and have been translated by Google Translate, a multilingual Machine Translation that was created by Google. In the last decades, Google has actively worked to develop a more accurate and fluent automatic translation system. This research, specifically focused on improving Google Translate, aims to enhance the overall quality of Machine Translation by achieving better lexical selection and by reducing errors. The investigation involves a comprehensive analysis of 230 texts that have been translated from English into Romanian.
- Abstract(参考訳): 本研究は、英語からルーマニア語への機械翻訳による翻訳のパフォーマンスにおける誤り分析を探求し、患者情報リーフレット(ワクチンや医薬品の有効成分、表示、投与指示、保管指示、副作用、警告など)によって、世界保健機関(WHO)、Gavi Organizationが提供した公式情報を含むテキスト中の語彙エラーに焦点を当てている。
これらのテキストはすべてCovid-19と関連しており、Googleが作成した多言語機械翻訳であるGoogle Translateによって翻訳されている。
過去数十年間、Googleはより正確で流動的な自動翻訳システムの開発に積極的に取り組んできた。
この研究は、特にGoogle Translateの改善に焦点を当てており、語彙選択の改善とエラーの低減により、機械翻訳の全体的な品質を向上させることを目的としている。
この調査には、英語からルーマニア語に翻訳された230のテキストの包括的な分析が含まれる。
関連論文リスト
- Evaluation of Google Translate for Mandarin Chinese translation using sentiment and semantic analysis [1.3999481573773074]
大規模言語モデル(LLM)を用いた機械翻訳は,世界規模で大きな影響を与えている。
中国語は、中国の政府やメディアによる通信に用いられる公用語である。
本研究では、感情分析と意味分析を用いて、人間の専門家によるGoogle翻訳の翻訳品質の自動評価を行う。
論文 参考訳(メタデータ) (2024-09-08T04:03:55Z) - xTower: A Multilingual LLM for Explaining and Correcting Translation Errors [22.376508000237042]
xTower は TowerBase 上に構築されたオープンな大規模言語モデル (LLM) である。
翻訳品質の大幅な向上を示すために, 様々な実験装置を用いてxTowerを検証した。
論文 参考訳(メタデータ) (2024-06-27T18:51:46Z) - Google Translate Error Analysis for Mental Healthcare Information:
Evaluating Accuracy, Comprehensibility, and Implications for Multilingual
Healthcare Communication [8.178490288773013]
本研究は, 英語からペルシア語, アラビア語, トルコ語, ルーマニア語, スペイン語への翻訳におけるGoogle Translateの利用について検討した。
対象言語の母語話者はGT翻訳を手動で評価し、医学用語の正確性、理解性、重要な構文・意味的誤りに焦点を当てた。
GT出力分析は、特にアラビア語、ルーマニア語、ペルシア語の医学用語を正確に翻訳する際の課題を明らかにした。
論文 参考訳(メタデータ) (2024-02-06T14:16:32Z) - Machine Translation Models are Zero-Shot Detectors of Translation Direction [46.41883195574249]
平行テキストの翻訳方向を検出することは、機械翻訳訓練や評価に応用できるが、盗作や偽造の主張を解消するといった法医学的応用もある。
本研究では,翻訳文や機械翻訳文でよく知られた単純化効果によって動機付けられた,$p(texttranslation|text Origin)>p(textgenic|texttranslation)$という単純な仮説に基づいて,翻訳方向検出のための教師なしアプローチを検討する。
論文 参考訳(メタデータ) (2024-01-12T18:59:02Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - Hallucinations in Large Multilingual Translation Models [70.10455226752015]
大規模多言語機械翻訳システムでは、多数の言語間で直接翻訳できることが顕著に示されている。
野生に配備されると、これらのモデルが幻覚翻訳を生成し、ユーザーの信頼を著しく損なう可能性があり、安全性の懸念が高まる。
幻覚に関する既存の研究は、主に高ソース言語で訓練された小さなバイリンガルモデルに焦点を当てている。
論文 参考訳(メタデータ) (2023-03-28T16:17:59Z) - The Effect of Normalization for Bi-directional Amharic-English Neural
Machine Translation [53.907805815477126]
本稿では,比較的大規模なアムハラ語-英語並列文データセットを提案する。
我々は、既存のFacebook M2M100事前学習モデルを微調整することで、双方向のアムハラ語翻訳モデルを構築する。
その結果, 両方向のアンハラ語・英語機械翻訳の性能は, アンハラ語ホモホン文字の正規化により向上することが示唆された。
論文 参考訳(メタデータ) (2022-10-27T07:18:53Z) - A Multilingual Neural Machine Translation Model for Biomedical Data [84.17747489525794]
生物医学領域におけるテキストの翻訳に使用できる多言語ニューラルマシン翻訳モデルをリリースする。
このモデルは5つの言語(フランス語、ドイツ語、イタリア語、韓国語、スペイン語)から英語に翻訳できる。
ドメインタグを使用して、大量のジェネリックおよびバイオメディカルデータをトレーニングする。
論文 参考訳(メタデータ) (2020-08-06T21:26:43Z) - A Survey of Orthographic Information in Machine Translation [1.2124289787900182]
我々は, アンダーリソース言語における機械翻訳を改善するために, 正書法情報をどのように利用できるかを示す。
本稿では,機械翻訳のさまざまなタイプについて論じるとともに,正書法と機械翻訳手法の整合性を示す最近の傾向を示す。
論文 参考訳(メタデータ) (2020-08-04T07:59:02Z) - It's Easier to Translate out of English than into it: Measuring Neural
Translation Difficulty by Cross-Mutual Information [90.35685796083563]
クロスミューチュアル情報(英: Cross-mutual information、XMI)は、機械翻訳の難易度に関する非対称情報理論の指標である。
XMIは、ほとんどのニューラルマシン翻訳モデルの確率的性質を利用する。
本稿では,現代ニューラル翻訳システムを用いた言語間翻訳の難易度に関する最初の体系的および制御的な研究について述べる。
論文 参考訳(メタデータ) (2020-05-05T17:38:48Z) - Testing Machine Translation via Referential Transparency [28.931196266344926]
本稿では,機械翻訳ソフトウェアの検証方法として,RTI(Referenceentially transparent inputs)を提案する。
私たちの実践的実装であるPurityは、このプロパティが翻訳によって壊れていることを検知します。
RTIを評価するために、Google TranslateとBing Microsoft Translatorを200のラベルのない文でテストするためにPurityを使用します。
論文 参考訳(メタデータ) (2020-04-22T01:37:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。