論文の概要: Worlds Within Words: Translating Culture in Ancient Chinese Texts with Multi-Agent Coordination
- arxiv url: http://arxiv.org/abs/2606.01276v1
- Date: Sun, 31 May 2026 14:58:03 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-02 21:34:29.490763
- Title: Worlds Within Words: Translating Culture in Ancient Chinese Texts with Multi-Agent Coordination
- Title(参考訳): 言葉の中の世界:多言語コーディネーションによる古漢文の文化の翻訳
- Authors: Xiaoqi He, Kaixin Lan, Mu You, Tao Fang, Lidia S. Chao, Derek F. Wong,
- Abstract要約: 大規模言語モデル(LLM)に基づく機械翻訳は、異文化間のコミュニケーションが進んでいるが、古代中国語のテキストでは、文化に負荷をかけた単語(CLW)に苦慮している。
文化的に健全なフレーズを識別し,必要に応じて簡潔な説明的知識を注入するフレームワークである textbfMACAT を提案する。
MACATは100 TCM文書のバックボーンモデルと汎用MTベースラインの両方を一貫して上回っている。
- 参考スコア(独自算出の注目度): 42.36051310803725
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Large language model (LLM)-based machine translation has advanced cross-cultural communication, yet it still struggles with culture-loaded words (CLWs) in ancient Chinese texts. The challenge extends beyond lexical alignment to deciding when and how culture-dependent knowledge should be explicated for readers lacking relevant background. Literal translation often preserves surface forms while missing underlying concepts, whereas over-explicitation harms conciseness and readability. To address this problem, we formulate CLW translation as a selective explicitation task and propose \textbf{MACAT}, a \textbf{M}ulti-\textbf{A}gent \textbf{C}ulture-\textbf{A}ware \textbf{T}ranslation framework that dynamically identifies culturally salient phrases and injects concise explanatory knowledge when necessary. MACAT further incorporates a quality-aware reranking module for candidate selection and a multi-round evaluation agent that assesses translations across terminological precision, readability, fidelity, cultural preservation, and cultural explicitation. Experiments on traditional Chinese medicine (TCM) classics and the \textit{Analects} show that, under a unified GPT-5.4 evaluation setting, MACAT consistently outperforms both the backbone model and general-purpose MT baselines on 100 TCM documents and a 20-chapter subset of the \textit{Analects}.
- Abstract(参考訳): 大規模言語モデル(LLM)に基づく機械翻訳は、異文化間のコミュニケーションが進んでいるが、古代中国語のテキストでは、文化に負荷をかけた単語(CLW)に苦慮している。
この課題は、語彙的アライメントを超えて、関連する背景を欠いた読者のために、いつ、どのように文化に依存した知識が説明されるべきかを決定する。
リテラル翻訳はしばしば表面の形状を保ちながら基本的な概念を欠いているが、過剰な説明は簡潔さと可読性を損なう。
この問題を解決するために、CLW翻訳を選択的明示的タスクとして定式化し、必要に応じて文化的に有意なフレーズを動的に識別し、簡潔な説明的知識を注入する、 \textbf{MACAT}, a \textbf{M}ulti-\textbf{A}gent \textbf{C}ulture-\textbf{A}ware \textbf{T}ranslation frameworkを提案する。
MACATはさらに、候補選択のための品質に配慮したリグレードモジュールと、用語的精度、可読性、忠実性、文化的保存、文化的明示にわたる翻訳を評価するマルチラウンド評価エージェントを組み込んでいる。
従来の中国医学(TCM)古典と『textit{Analects} 』の実験では、統一された GPT-5.4 評価設定の下で、MACAT は100 TCM 文書のバックボーンモデルと汎用MT ベースライン、および \textit{Analects の 20-chapter サブセットを一貫して上回っている。
関連論文リスト
- Mitigating Cross-Lingual Cultural Inconsistencies in LLMs via Consensus-Driven Preference Optimisation [58.01855677487771]
本研究では,多言語大言語モデル (MLLM) が,プロンプトの言語変化に伴う不整合性を示すことを示す。
コンセンサス駆動型アライメントフレームワークであるC-3POを提案する。
C-3POは、非整合モデルよりも0.10ポイントの$_S$を絶対的に増加させ、強力なプロンプトと表現のステアリングベースラインを上回る。
論文 参考訳(メタデータ) (2026-04-02T14:04:06Z) - From Words to Worlds: Benchmarking Cross-Cultural Cultural Understanding in Machine Translation [16.809989616664605]
CulT-Evalは、モデルが異なるタイプの文化的基盤表現をどのように扱うかを評価するために設計されたベンチマークである。
CulT-Evalは、複数の文化的な接地された表現にまたがる、7,959以上の慎重にキュレートされたインスタンスから構成されている。
文化的な意味の逸脱を対象とする相補的評価尺度を提案する。
論文 参考訳(メタデータ) (2026-03-18T02:59:44Z) - Liaozhai through the Looking-Glass: On Paratextual Explicitation of Culture-Bound Terms in Machine Translation [70.43884512651668]
我々は、文学・翻訳研究からジェネットのパラテキスト論(1987年)を定式化し、機械翻訳におけるパラテキスト明示の課題を紹介した。
古典中国語の短編集集Liaozhaiの4つの英訳から560の専門家対応パラテキストのデータセットを構築した。
本研究は,言語的等価性を超えた機械翻訳におけるパラテクスト的明示の可能性を示すものである。
論文 参考訳(メタデータ) (2025-09-27T16:27:36Z) - TCC-Bench: Benchmarking the Traditional Chinese Culture Understanding Capabilities of MLLMs [13.069833806549914]
中国伝統文化理解ベンチマーク(TCC-Bench)を提案する。
TCC-Benchは、文化的に豊かで視覚的に多様なデータで構成されており、博物館の工芸品、日常の生活シーン、漫画、その他の文化的に重要な文脈の画像が組み込まれている。
テキストのみのモードでGPT-4oを利用する半自動パイプラインを採用し、候補問題を生成し、続いて人間によるキュレーションを行い、データ品質を保証し、潜在的なデータ漏洩を回避する。
論文 参考訳(メタデータ) (2025-05-16T14:10:41Z) - Benchmarking Machine Translation with Cultural Awareness [50.183458829028226]
文化関連コンテンツの翻訳は、効果的な異文化間コミュニケーションに不可欠である。
多くの文化特化項目(CSI)は言語間の翻訳を欠いていることが多い。
この難しさは機械翻訳システムの文化的意識の分析を妨げる。
論文 参考訳(メタデータ) (2023-05-23T17:56:33Z) - Discourse Centric Evaluation of Machine Translation with a Densely
Annotated Parallel Corpus [82.07304301996562]
本稿では,江らが導入した大規模並列コーパスBWBに基づいて,リッチな談話アノテーションを用いた新しいデータセットを提案する。
ソース言語とターゲット言語の談話構造と類似点と相違点について検討する。
我々はMT出力が人間の翻訳と基本的に異なることを発見した。
論文 参考訳(メタデータ) (2023-05-18T17:36:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。