論文の概要: Evaluating Machine Translation Models for English-Hindi Language Pairs: A Comparative Analysis
- arxiv url: http://arxiv.org/abs/2505.19604v1
- Date: Mon, 26 May 2025 07:15:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-27 16:58:43.23692
- Title: Evaluating Machine Translation Models for English-Hindi Language Pairs: A Comparative Analysis
- Title(参考訳): 英語・ヒンディー語対に対する機械翻訳モデルの評価:比較分析
- Authors: Ahan Prasannakumar Shetty,
- Abstract要約: 本研究の目的は、汎用言語ドメインと専門言語ドメインの両方を扱う際に、異なる機械翻訳アプローチの有効性についての洞察を提供することである。
結果は、様々なメトリクスのパフォーマンスレベルを示し、現在の翻訳システムを改善するための強みと領域を強調している。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Machine translation has become a critical tool in bridging linguistic gaps, especially between languages as diverse as English and Hindi. This paper comprehensively evaluates various machine translation models for translating between English and Hindi. We assess the performance of these models using a diverse set of automatic evaluation metrics, both lexical and machine learning-based metrics. Our evaluation leverages an 18000+ corpus of English Hindi parallel dataset and a custom FAQ dataset comprising questions from government websites. The study aims to provide insights into the effectiveness of different machine translation approaches in handling both general and specialized language domains. Results indicate varying performance levels across different metrics, highlighting strengths and areas for improvement in current translation systems.
- Abstract(参考訳): 機械翻訳は言語的ギャップ、特に英語やヒンディー語のような多種多様な言語の間の橋渡しにおいて重要な道具となっている。
本稿では、英語とヒンディー語を翻訳する各種機械翻訳モデルについて包括的に評価する。
我々は、語彙と機械学習に基づくメトリクスの両方を用いて、様々な自動評価指標を用いて、これらのモデルの性能を評価する。
本評価では,英語Hindi並列データセットの18000以上のコーパスと,政府Webサイトからの質問を構成するカスタムFAQデータセットを活用する。
本研究の目的は、汎用言語ドメインと専門言語ドメインの両方を扱う際に、異なる機械翻訳アプローチの有効性についての洞察を提供することである。
結果は、様々なメトリクスのパフォーマンスレベルを示し、現在の翻訳システムを改善するための強みと領域を強調している。
関連論文リスト
- Sentiment Analysis Across Languages: Evaluation Before and After Machine Translation to English [0.0]
本稿では,機械翻訳を行った多言語データセットおよびテキストを対象とした感性分析タスクにおけるトランスフォーマーモデルの性能について検討する。
異なる言語文脈におけるこれらのモデルの有効性を比較することで、それらの性能変化と様々な言語における感情分析の潜在的な影響について洞察を得ることができる。
論文 参考訳(メタデータ) (2024-05-05T10:52:09Z) - Understanding Cross-Lingual Alignment -- A Survey [52.572071017877704]
言語間アライメントは多言語言語モデルにおける言語間の表現の有意義な類似性である。
本研究は,言語間アライメントの向上,手法の分類,分野全体からの洞察の要約といった手法の文献を調査する。
論文 参考訳(メタデータ) (2024-04-09T11:39:53Z) - Decomposed Prompting for Machine Translation Between Related Languages
using Large Language Models [55.35106713257871]
DecoMTは、単語チャンク翻訳のシーケンスに翻訳プロセスを分解する、数発のプロンプトの新しいアプローチである。
DecoMTはBLOOMモデルよりも優れていることを示す。
論文 参考訳(メタデータ) (2023-05-22T14:52:47Z) - An Evaluation of Persian-English Machine Translation Datasets with
Transformers [1.0742675209112622]
この研究はペルシア語と英語の翻訳に使われた最もポピュラーで価値のある平行コーパスを収集し分析した。
我々は、各データセット上で2つの最新アテンションベースセq2seqモデルを微調整し、評価した。
論文 参考訳(メタデータ) (2023-02-01T08:55:08Z) - FRMT: A Benchmark for Few-Shot Region-Aware Machine Translation [64.9546787488337]
本稿では、Few-shot Region-aware Machine Translationのための新しいデータセットと評価ベンチマークFRMTを提案する。
このデータセットは、英語からポルトガル語と中国語の2つの地域変種へのプロの翻訳で構成されている。
論文 参考訳(メタデータ) (2022-10-01T05:02:04Z) - DivEMT: Neural Machine Translation Post-Editing Effort Across
Typologically Diverse Languages [5.367993194110256]
DivEMTは、ニューラルネットワーク翻訳(NMT)に関する、タイプ的かつ多様なターゲット言語に対する初めての公開後研究である。
我々は、Google Translateとオープンソースの多言語モデルmBART50の2つの最先端NTTシステムの翻訳生産性への影響を評価する。
論文 参考訳(メタデータ) (2022-05-24T17:22:52Z) - Does Summary Evaluation Survive Translation to Other Languages? [0.0]
既存の英語要約データセット SummEval を4言語に翻訳する。
本研究は,翻訳言語における自動評価指標のスコアと,ソース言語における人間のアノテーションとの相関から分析する。
論文 参考訳(メタデータ) (2021-09-16T17:35:01Z) - Curious Case of Language Generation Evaluation Metrics: A Cautionary
Tale [52.663117551150954]
イメージキャプションや機械翻訳などのタスクを評価するデファクトメトリクスとして、いくつかの一般的な指標が残っている。
これは、使いやすさが原因でもあり、また、研究者がそれらを見て解釈する方法を知りたがっているためでもある。
本稿では,モデルの自動評価方法について,コミュニティにより慎重に検討するよう促す。
論文 参考訳(メタデータ) (2020-10-26T13:57:20Z) - Bridging Linguistic Typology and Multilingual Machine Translation with
Multi-View Language Representations [83.27475281544868]
特異ベクトル標準相関解析を用いて、各情報源からどのような情報が誘導されるかを調べる。
我々の表現は類型学を組み込み、言語関係と相関関係を強化する。
次に、多言語機械翻訳のための多視点言語ベクトル空間を利用して、競合する全体的な翻訳精度を実現する。
論文 参考訳(メタデータ) (2020-04-30T16:25:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。