論文の概要: Translationese as a Rational Response to Translation Task Difficulty
- arxiv url: http://arxiv.org/abs/2603.12050v1
- Date: Thu, 12 Mar 2026 15:24:00 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-13 14:46:26.177872
- Title: Translationese as a Rational Response to Translation Task Difficulty
- Title(参考訳): 翻訳作業困難に対する合理的対応としての翻訳文
- Authors: Maria Kunilovskaya,
- Abstract要約: 我々は,翻訳課題の難易度を定量的に評価することにより,観測可能な翻訳文を予測できるかどうかを検証した。
我々は、英語とドイツ語の双方向コーパスを用いて、文章と音声のサブコーパスを合成する。
結果から,英語からドイツ語への翻訳は,翻訳作業の難しさによって部分的に説明できることが示唆された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Translations systematically diverge from texts originally produced in the target language, a phenomenon widely referred to as translationese. Translationese has been attributed to production tendencies (e.g. interference, simplification), socio-cultural variables, and language-pair effects, yet a unified explanatory account is still lacking. We propose that translationese reflects cognitive load inherent in the translation task itself. We test whether observable translationese can be predicted from quantifiable measures of translation task difficulty. Translationese is operationalised as a segment-level translatedness score produced by an automatic classifier. Translation task difficulty is conceptualised as comprising source-text and cross-lingual transfer components, operationalised mainly through information-theoretic metrics based on LLM surprisal, complemented by established syntactic and semantic alternatives. We use a bidirectional English-German corpus comprising written and spoken subcorpora. Results indicate that translationese can be partly explained by translation task difficulty, especially in English-to-German. For most experiments, cross-lingual transfer difficulty contributes more than source-text complexity. Information-theoretic indicators match or outperform traditional features in written mode, but offer no advantage in spoken mode. Source-text syntactic complexity and translation-solution entropy emerged as the strongest predictors of translationese across language pairs and modes.
- Abstract(参考訳): 翻訳は、本来は対象言語で作られたテキストから体系的に分岐し、この現象は広く翻訳と呼ばれる。
翻訳は生産傾向(例えば、干渉、単純化、社会文化的変数、言語対効果)によるものとされているが、統一的な説明的説明はいまだに欠けている。
本稿では,翻訳作業自体に固有の認知負荷を反映した翻訳文を提案する。
我々は,翻訳課題の難易度を定量的に評価することにより,観測可能な翻訳文を予測できるかどうかを検証した。
翻訳文は、自動分類器によって生成されるセグメントレベルの翻訳度スコアとして操作される。
翻訳課題の難易度は,LLMに基づく情報理論的指標を主目的とし,構文的および意味的代替手段によって補完される,ソーステキストと言語間移動成分から構成される,という概念化されている。
我々は、英語とドイツ語の双方向コーパスを用いて、文章と音声のサブコーパスを合成する。
結果から,英語からドイツ語への翻訳は,翻訳作業の難しさによって部分的に説明できることが示唆された。
ほとんどの実験では、言語間転送の難しさは、ソース・テキストの複雑さ以上に寄与する。
情報理論インジケータは、筆記モードで従来の特徴にマッチまたは優れるが、音声モードでは利点がない。
ソース・テキストの構文的複雑さと翻訳・解決エントロピーは、言語対とモードをまたいだ翻訳の最も強い予測因子として現れた。
関連論文リスト
- Liaozhai through the Looking-Glass: On Paratextual Explicitation of Culture-Bound Terms in Machine Translation [70.43884512651668]
我々は、文学・翻訳研究からジェネットのパラテキスト論(1987年)を定式化し、機械翻訳におけるパラテキスト明示の課題を紹介した。
古典中国語の短編集集Liaozhaiの4つの英訳から560の専門家対応パラテキストのデータセットを構築した。
本研究は,言語的等価性を超えた機械翻訳におけるパラテクスト的明示の可能性を示すものである。
論文 参考訳(メタデータ) (2025-09-27T16:27:36Z) - Lost in Literalism: How Supervised Training Shapes Translationese in LLMs [51.04435855143767]
大規模言語モデル(LLM)は機械翻訳において顕著な成功を収めた。
しかし、過度にリテラルと不自然な翻訳を特徴とする翻訳は、依然として永続的な課題である。
我々は、黄金の基準を磨き、不自然なトレーニングインスタンスをフィルタリングするなど、これらのバイアスを軽減する方法を導入する。
論文 参考訳(メタデータ) (2025-03-06T12:14:45Z) - LLM-based Translation Inference with Iterative Bilingual Understanding [52.46978502902928]
大規模言語モデル(LLM)の言語間機能に基づいた,新しい反復的バイリンガル理解翻訳法を提案する。
LLMの言語横断的能力により、ソース言語とターゲット言語を別々にコンテキスト理解することが可能になる。
提案したIBUTは、いくつかの強力な比較法より優れている。
論文 参考訳(メタデータ) (2024-10-16T13:21:46Z) - Aligning Translation-Specific Understanding to General Understanding in Large Language Models [32.0119328710383]
大規模言語モデル(LLM)は、複雑なテキストを理解する際、顕著な能力を示した。
本研究は,LLMにおける翻訳固有の理解と一般理解の相違を明らかにする。
本稿では, 難解な翻訳過程である DUAT (Difficult words Understanding Aligned Translation) を提案する。
論文 参考訳(メタデータ) (2024-01-10T11:03:53Z) - Crossing the Threshold: Idiomatic Machine Translation through Retrieval
Augmentation and Loss Weighting [66.02718577386426]
慣用的な翻訳と関連する問題を簡易に評価する。
我々は,変圧器をベースとした機械翻訳モデルが慣用的な翻訳に対して正しくデフォルトとなる点を明らかにするための合成実験を行った。
自然慣用句の翻訳を改善するために, 単純かつ効果的な2つの手法を導入する。
論文 参考訳(メタデータ) (2023-10-10T23:47:25Z) - Lost In Translation: Generating Adversarial Examples Robust to
Round-Trip Translation [66.33340583035374]
本研究は, ラウンドトリップ翻訳における現在のテキスト対逆攻撃の堅牢性に関する包括的研究である。
筆者らは,現在最先端のテキストベースの6つの敵攻撃が,ラウンドトリップ翻訳後の有効性を維持していないことを実証した。
本稿では,機械翻訳を逆例生成のプロセスに組み込むことにより,この問題に対する介入に基づく解決策を提案する。
論文 参考訳(メタデータ) (2023-07-24T04:29:43Z) - Rethinking Round-Trip Translation for Machine Translation Evaluation [44.83568796515321]
ラウンドトリップ翻訳が参照なしで自動評価に利用できるという驚くべき発見を報告する。
ラウンドトリップ翻訳が複数の機械翻訳評価タスクに有用であることを示す。
論文 参考訳(メタデータ) (2022-09-15T15:06:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。