論文の概要: Benchmarking Machine Translation with Cultural Awareness
- arxiv url: http://arxiv.org/abs/2305.14328v3
- Date: Sat, 19 Oct 2024 05:01:46 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-22 13:13:52.430456
- Title: Benchmarking Machine Translation with Cultural Awareness
- Title(参考訳): 文化認識による機械翻訳のベンチマーク
- Authors: Binwei Yao, Ming Jiang, Tara Bobinac, Diyi Yang, Junjie Hu,
- Abstract要約: 文化関連コンテンツの翻訳は、効果的な異文化間コミュニケーションに不可欠である。
多くの文化特化項目(CSI)は言語間の翻訳を欠いていることが多い。
この難しさは機械翻訳システムの文化的意識の分析を妨げる。
- 参考スコア(独自算出の注目度): 50.183458829028226
- License:
- Abstract: Translating culture-related content is vital for effective cross-cultural communication. However, many culture-specific items (CSIs) often lack viable translations across languages, making it challenging to collect high-quality, diverse parallel corpora with CSI annotations. This difficulty hinders the analysis of cultural awareness of machine translation (MT) systems, including traditional neural MT and the emerging MT paradigm using large language models (LLM). To address this gap, we introduce a novel parallel corpus, enriched with CSI annotations in 6 language pairs for investigating Culturally-Aware Machine Translation--CAMT. Furthermore, we design two evaluation metrics to assess CSI translations, focusing on their pragmatic translation quality. Our findings show the superior ability of LLMs over neural MTs in leveraging external cultural knowledge for translating CSIs, especially those lacking translations in the target culture.
- Abstract(参考訳): 文化関連コンテンツの翻訳は、効果的な異文化間コミュニケーションに不可欠である。
しかし、多くの文化特化項目(CSI)は言語間で実行可能な翻訳を欠いていることが多く、高品質で多様な並列コーパスをCSIアノテーションで収集することは困難である。
この難しさは、従来のニューラルMTや、大型言語モデル(LLM)を用いた新しいMTパラダイムを含む、機械翻訳(MT)システムの文化的意識の分析を妨げる。
そこで我々は,CSIアノテーションを付加した新しい並列コーパスを6つの言語対に導入し,文化機械翻訳-CAMTについて検討する。
さらに,CSI翻訳の評価のための2つの評価指標を設計し,その実用的翻訳品質に着目した。
以上の結果から,CSIの翻訳に外的文化知識を活かし,特に翻訳能力の欠如が示唆された。
関連論文リスト
- Methodology of Adapting Large English Language Models for Specific Cultural Contexts [10.151487049108626]
本稿では,特定の文化的文脈における大規模モデルの迅速な適応手法を提案する。
適応LLMは、ドメイン固有の知識と安全性値への適応性において、その能力を著しく向上させる。
論文 参考訳(メタデータ) (2024-06-26T09:16:08Z) - Translating Across Cultures: LLMs for Intralingual Cultural Adaptation [12.5954253354303]
文化適応の課題を定義し,この課題に対する様々なモデルをベンチマークする評価フレームワークを作成する。
文化的バイアスやステレオタイプを含む自動適応の可能性について分析する。
論文 参考訳(メタデータ) (2024-06-20T17:06:58Z) - The Echoes of Multilinguality: Tracing Cultural Value Shifts during LM Fine-tuning [23.418656688405605]
本研究では, 異なるテスト言語で符号化された文化的価値に言語がどのように影響するかを, 微調整時にどのように修正されるかを検討する。
最後に、トレーニングデータ属性法を用いて、微調整の例やそれらが生み出す言語にパターンを見つける。
論文 参考訳(メタデータ) (2024-05-21T12:55:15Z) - Understanding the Capabilities and Limitations of Large Language Models for Cultural Commonsense [98.09670425244462]
大規模言語モデル(LLM)は、かなりの常識的理解を示している。
本稿では,文化的コモンセンスタスクの文脈におけるいくつかの最先端LCMの能力と限界について検討する。
論文 参考訳(メタデータ) (2024-05-07T20:28:34Z) - MT-PATCHER: Selective and Extendable Knowledge Distillation from Large Language Models for Machine Translation [61.65537912700187]
機械翻訳(MT)分野における言語モデル(LLM)の強みを実証した。
我々は,LLMから既存のMTモデルに選択的かつ包括的かつ積極的に知識を伝達するMT-Patcherというフレームワークを提案する。
論文 参考訳(メタデータ) (2024-03-14T16:07:39Z) - Massively Multi-Cultural Knowledge Acquisition & LM Benchmarking [48.21982147529661]
本稿では,多文化知識獲得のための新しいアプローチを提案する。
本手法は,文化トピックに関するウィキペディア文書からリンクページの広範囲なネットワークへ戦略的にナビゲートする。
私たちの仕事は、AIにおける文化的格差のギャップを深く理解し、橋渡しするための重要なステップです。
論文 参考訳(メタデータ) (2024-02-14T18:16:54Z) - Aligning Translation-Specific Understanding to General Understanding in
Large Language Models [33.617194314112645]
大きな言語モデル(LLM)は驚くべき言語理解と生成能力を示している。
難解な単語のCross-Lingual Interpretation(Cross-Lingual Interpretation)を提案する。
xIoDは、翻訳が難しい単語の言語間解釈を実行し、生成された解釈で翻訳を強化する。
論文 参考訳(メタデータ) (2024-01-10T11:03:53Z) - Towards Effective Disambiguation for Machine Translation with Large
Language Models [65.80775710657672]
我々は「あいまいな文」を翻訳する大規模言語モデルの能力について研究する。
実験の結果,提案手法はDeepLやNLLBといった最先端システムと5つの言語方向のうち4つで一致し,性能を向上できることがわかった。
論文 参考訳(メタデータ) (2023-09-20T22:22:52Z) - Multilingual Word Sense Disambiguation with Unified Sense Representation [55.3061179361177]
本稿では,知識と教師付き多言語単語センス曖昧化(MWSD)システムを提案する。
我々は複数の言語に統一されたセンス表現を構築し、リッチソース言語から貧しい言語へアノテーションを転送することでMWSDのアノテーション不足問題に対処する。
SemEval-13およびSemEval-15データセットの評価により,提案手法の有効性が示された。
論文 参考訳(メタデータ) (2022-10-14T01:24:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。