論文の概要: Characterizing the Effects of Translation on Intertextuality using Multilingual Embedding Spaces
- arxiv url: http://arxiv.org/abs/2501.10731v1
- Date: Sat, 18 Jan 2025 11:36:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-22 14:23:23.157284
- Title: Characterizing the Effects of Translation on Intertextuality using Multilingual Embedding Spaces
- Title(参考訳): 多言語埋め込み空間を用いた翻訳のテクスト間性への影響評価
- Authors: Hope McGovern, Hale Sirin, Tom Lippincott,
- Abstract要約: 修辞装置は翻訳が難しいが、文学文書の翻訳には不可欠である。
本研究は,多言語埋め込み空間を用いて,人間と機械の翻訳におけるテクスチュアリティの保存を特徴付けるものである。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Rhetorical devices are difficult to translate, but they are crucial to the translation of literary documents. We investigate the use of multilingual embedding spaces to characterize the preservation of intertextuality, one common rhetorical device, across human and machine translation. To do so, we use Biblical texts, which are both full of intertextual references and are highly translated works. We provide a metric to characterize intertextuality at the corpus level and provide a quantitative analysis of the preservation of this rhetorical device across extant human translations and machine-generated counterparts. We go on to provide qualitative analysis of cases wherein human translations over- or underemphasize the intertextuality present in the text, whereas machine translations provide a neutral baseline. This provides support for established scholarship proposing that human translators have a propensity to amplify certain literary characteristics of the original manuscripts.
- Abstract(参考訳): 修辞装置は翻訳が難しいが、文学文書の翻訳には不可欠である。
本研究は,多言語埋め込み空間を用いて,人間と機械の翻訳を横断する1つの一般的な修辞的装置であるテクスチュアリティの保存を特徴付けるものである。
そのため、聖書のテキストはテキスト間の参照に満ちており、高度に翻訳された作品である。
コーパスレベルでのテクスチュアリティを特徴づける指標を提供し、このレトリック装置の保存を、現時点の人間翻訳と機械生成装置間で定量的に分析する。
機械翻訳は中性ベースラインを提供するのに対し、人間の翻訳がテキストに存在するテクスト間性を過度に強調または過度に強調するケースの質的分析を行う。
これは、人間の翻訳者が原典の文学的特徴を増幅する正当性を持つことを提唱する、確立された奨学金の支持を提供する。
関連論文リスト
- Multi-perspective Alignment for Increasing Naturalness in Neural Machine Translation [11.875491080062233]
ニューラルマシン翻訳(NMT)システムは、トレーニングデータに存在する語彙バイアスを増幅し、出力翻訳において人工的に不十分な言語を生み出す。
自然とコンテンツ保存の両方に報いる新しい方法を提案する。
本手法は英蘭文翻訳において評価され,翻訳精度を損なうことなく,語彙的に豊かで,人文言語の性質が向上する翻訳モデルが得られた。
論文 参考訳(メタデータ) (2024-12-11T15:42:22Z) - Towards Tailored Recovery of Lexical Diversity in Literary Machine Translation [11.875491080062233]
機械翻訳は人間翻訳よりも語彙的に劣っている。
本稿では,原文と翻訳文を区別する分類器を用いて,翻訳候補を再ランク付けする手法を提案する。
我々は,31の英蘭本翻訳に対するアプローチを評価し,ある書籍について,人間の翻訳に近い語彙的多様性のスコアを抽出することを発見した。
論文 参考訳(メタデータ) (2024-08-30T14:12:04Z) - (Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts [52.18246881218829]
本稿では,大言語モデル(LLM)をベースとした多エージェントフレームワークを,TransAgentsという企業として実装した。
本システムの有効性を評価するため,モノリンガル・ヒューマン・プライス(MHP)とバイリンガル・LLM・プライス(BLP)の2つの革新的な評価戦略を提案する。
論文 参考訳(メタデータ) (2024-05-20T05:55:08Z) - Lost In Translation: Generating Adversarial Examples Robust to
Round-Trip Translation [66.33340583035374]
本研究は, ラウンドトリップ翻訳における現在のテキスト対逆攻撃の堅牢性に関する包括的研究である。
筆者らは,現在最先端のテキストベースの6つの敵攻撃が,ラウンドトリップ翻訳後の有効性を維持していないことを実証した。
本稿では,機械翻訳を逆例生成のプロセスに組み込むことにより,この問題に対する介入に基づく解決策を提案する。
論文 参考訳(メタデータ) (2023-07-24T04:29:43Z) - The Best of Both Worlds: Combining Human and Machine Translations for
Multilingual Semantic Parsing with Active Learning [50.320178219081484]
人文翻訳と機械翻訳の両方の長所を生かした能動的学習手法を提案する。
理想的な発話選択は、翻訳されたデータの誤りとバイアスを著しく低減することができる。
論文 参考訳(メタデータ) (2023-05-22T05:57:47Z) - Discourse Centric Evaluation of Machine Translation with a Densely
Annotated Parallel Corpus [82.07304301996562]
本稿では,江らが導入した大規模並列コーパスBWBに基づいて,リッチな談話アノテーションを用いた新しいデータセットを提案する。
ソース言語とターゲット言語の談話構造と類似点と相違点について検討する。
我々はMT出力が人間の翻訳と基本的に異なることを発見した。
論文 参考訳(メタデータ) (2023-05-18T17:36:41Z) - Lost in Translationese? Reducing Translation Effect Using Abstract
Meaning Representation [11.358350306918027]
抽象的意味表現(AMR)は、翻訳文中の翻訳文の量を減らし、インターリンガとして使用できると論じる。
英語の翻訳をAMRに解析し、そのAMRからテキストを生成することで、その結果は元々の英語のテキストとよりよく似ている。
この研究は、テキストの翻訳を減らし、言語間言語としてのAMRの有用性を強調している。
論文 参考訳(メタデータ) (2023-04-23T00:04:14Z) - A Bilingual Parallel Corpus with Discourse Annotations [82.07304301996562]
本稿では,Jiang et al. (2022)で最初に導入された大きな並列コーパスであるBWBと,注釈付きテストセットについて述べる。
BWBコーパスは、専門家によって英語に翻訳された中国の小説で構成されており、注釈付きテストセットは、様々な談話現象をモデル化する機械翻訳システムの能力を調査するために設計されている。
論文 参考訳(メタデータ) (2022-10-26T12:33:53Z) - Time-Aware Ancient Chinese Text Translation and Inference [6.787414471399024]
我々は、古代漢文の翻訳をめぐる課題に対処することを目指している。
時代の違いによる言語的なギャップは、質の悪い翻訳をもたらす。
ほとんどの翻訳は、しばしばテキストを理解するのに非常に重要な文脈情報を欠いている。
論文 参考訳(メタデータ) (2021-07-07T12:23:52Z) - Translation Artifacts in Cross-lingual Transfer Learning [51.66536640084888]
機械翻訳は、既存の言語間モデルに顕著な影響を与える微妙なアーティファクトを導入することができることを示す。
自然言語の推論では、前提と仮説を独立に翻訳することで、それらの間の語彙的重複を減らすことができる。
また、XNLIでは、それぞれ4.3点と2.8点の翻訳とゼロショットのアプローチを改善している。
論文 参考訳(メタデータ) (2020-04-09T17:54:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。