論文の概要: Creative and Context-Aware Translation of East Asian Idioms with GPT-4
- arxiv url: http://arxiv.org/abs/2410.00988v1
- Date: Tue, 1 Oct 2024 18:24:43 GMT
- ステータス: 処理完了
- システム内更新日: 2024-11-04 23:49:57.052729
- Title: Creative and Context-Aware Translation of East Asian Idioms with GPT-4
- Title(参考訳): GPT-4を用いた東アジアイディオムの創造的・文脈的翻訳
- Authors: Kenan Tang, Peiyang Song, Yao Qin, Xifeng Yan,
- Abstract要約: GPT-4は東アジアのイディオムの高品質な翻訳を生成できる。
低コストで、我々のコンテキスト対応翻訳は、人間のベースラインよりも、イディオム当たりの高品質な翻訳を実現することができる。
- 参考スコア(独自算出の注目度): 20.834802250633686
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: As a type of figurative language, an East Asian idiom condenses rich cultural background into only a few characters. Translating such idioms is challenging for human translators, who often resort to choosing a context-aware translation from an existing list of candidates. However, compiling a dictionary of candidate translations demands much time and creativity even for expert translators. To alleviate such burden, we evaluate if GPT-4 can help generate high-quality translations. Based on automatic evaluations of faithfulness and creativity, we first identify Pareto-optimal prompting strategies that can outperform translation engines from Google and DeepL. Then, at a low cost, our context-aware translations can achieve far more high-quality translations per idiom than the human baseline. We open-source all code and data to facilitate further research.
- Abstract(参考訳): 図形言語の一種として、東アジアのイディオムは豊かな文化的背景をわずかの文字に凝縮している。
このような慣用句の翻訳は、既存の候補者リストから文脈対応の翻訳を選択することを好む人間の翻訳者にとって難しい。
しかし、候補翻訳の辞書を編纂するには、専門家翻訳者にとっても多くの時間と創造性が必要である。
このような負担を軽減するため、GPT-4が高品質な翻訳を生成できるかどうかを評価する。
忠実さと創造性の自動評価に基づいて、GoogleとDeepLの翻訳エンジンよりも優れたパレート最適化戦略を最初に特定する。
そして、低コストで、私たちのコンテキスト対応翻訳は、人間のベースラインよりも、イディオム当たりの高品質な翻訳を達成できます。
さらなる研究を促進するために、すべてのコードとデータをオープンソースにしています。
関連論文リスト
- Benchmarking GPT-4 against Human Translators: A Comprehensive Evaluation Across Languages, Domains, and Expertise Levels [20.05501751993599]
GPT-4は、全エラーの点において、中級のトランスレータに匹敵する性能を達成する。
従来のニューラル機械翻訳システムとは異なり、GPT-4は全ての評価された言語対に対して一貫した翻訳品質を維持している。
論文 参考訳(メタデータ) (2024-11-21T01:12:46Z) - GPT-4 vs. Human Translators: A Comprehensive Evaluation of Translation Quality Across Languages, Domains, and Expertise Levels [18.835573312027265]
本研究では,人間の翻訳者に対するLarge Language Models(LLMs)の翻訳品質を包括的に評価する。
また, GPT-4は, 中高の翻訳者よりも遅れが小さいため, 中高の翻訳者に対して同等に機能することがわかった。
論文 参考訳(メタデータ) (2024-07-04T05:58:04Z) - (Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts [52.18246881218829]
本稿では,大言語モデル(LLM)をベースとした多エージェントフレームワークを,TransAgentsという企業として実装した。
本システムの有効性を評価するため,モノリンガル・ヒューマン・プライス(MHP)とバイリンガル・LLM・プライス(BLP)の2つの革新的な評価戦略を提案する。
論文 参考訳(メタデータ) (2024-05-20T05:55:08Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - Large language models effectively leverage document-level context for
literary translation, but critical errors persist [32.54546652197316]
大規模言語モデル(LLM)は、幅広い文レベルの翻訳データセット上での最先端技術と競合する。
我々は,Gpt-3.5 (text-davinci-003) LLM) を用いて文節全体を翻訳し,高品質な翻訳を行うという厳密な評価を通して示す。
論文 参考訳(メタデータ) (2023-04-06T17:27:45Z) - Is ChatGPT A Good Translator? Yes With GPT-4 As The Engine [97.8609714773255]
機械翻訳におけるChatGPTの評価には,翻訳プロンプト,多言語翻訳,翻訳堅牢性などが含まれる。
ChatGPTは商用翻訳製品と競合するが、低リソースや遠方の言語では遅れている。
GPT-4エンジンの打ち上げにより、ChatGPTの翻訳性能は大幅に向上した。
論文 参考訳(メタデータ) (2023-01-20T08:51:36Z) - PETCI: A Parallel English Translation Dataset of Chinese Idioms [0.0]
現在の機械翻訳モデルは、イディオム翻訳が不十分であるのに対して、多くの翻訳データセットではイディオムはスパースである。
中国語のイディオムの並列翻訳データセットについて,人間と機械の双方による翻訳を改善することを目的とした。
論文 参考訳(メタデータ) (2022-02-19T03:16:20Z) - BitextEdit: Automatic Bitext Editing for Improved Low-Resource Machine
Translation [53.55009917938002]
自動編集によりマイニングしたビットクストを改良することを提案する。
提案手法は,5つの低リソース言語ペアと10の翻訳方向に対して,最大8個のBLEUポイントでCCMatrixマイニングビットクストの品質を向上することを示す。
論文 参考訳(メタデータ) (2021-11-12T16:00:39Z) - ChrEnTranslate: Cherokee-English Machine Translation Demo with Quality
Estimation and Corrective Feedback [70.5469946314539]
ChrEnTranslateは、英語と絶滅危惧言語チェロキーとの翻訳のためのオンライン機械翻訳デモシステムである。
統計モデルとニューラルネットワークモデルの両方をサポートし、信頼性をユーザに通知するための品質評価を提供する。
論文 参考訳(メタデータ) (2021-07-30T17:58:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。