論文の概要: AI-assisted cultural heritage dissemination: Comparing NMT and glossary-augmented LLM translation in rock art documents
- arxiv url: http://arxiv.org/abs/2605.14679v1
- Date: Thu, 14 May 2026 10:48:48 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-15 21:45:34.781055
- Title: AI-assisted cultural heritage dissemination: Comparing NMT and glossary-augmented LLM translation in rock art documents
- Title(参考訳): AIによる文化遺産の普及: 岩石アート文書におけるNMTと用語集LLM翻訳の比較
- Authors: Vicent Briva-Iglesias, María Ferre-Fernández,
- Abstract要約: ロックアートのような専門用語の領域では、翻訳の質は正確で一貫した専門用語に依存している。
スペインのアカデミック・ロックアートのテキストに対する3つの英語のMTセットアップを比較し、単純で操作可能な介入に焦点を当てた。
Gemini-RAGは、Gemini-Simple (69.1%) とDeepL (64.4%) に対して、正確なマッチング項の精度が最も高い(81.4%)。
以上の結果から, グローサリー増進プロンプトは, 文化遺産翻訳における用語制御を改善するための低オーバーヘッドな方法であることが示唆された。
- 参考スコア(独自算出の注目度): 0.42970700836450487
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Cultural heritage institutions increasingly disseminate research and interpretive materials globally, but multilingual dissemination is constrained by limited budgets and staffing. In terminology-dense domains such as rock art, translation quality depends on accurate, consistent specialised terms, and small lexical errors can mislead non-specialists and reduce reuse. We compare three English MT setups for a Spanish academic rock art text, focusing on simple, operationally feasible interventions rather than complex model-side modifications: (1) DeepL as a strong NMT baseline, (2) Gemini-Simple (LLM with a basic prompt), and (3) Gemini-RAG (the same LLM with glossary-augmented prompting via term-pair retrieval). Using PEARMUT, we conduct a human evaluation via (i) multi-way Direct Assessment (0--100) and (ii) targeted terminology auditing with a restricted MQM taxonomy. Gemini-RAG yields the highest exact-match terminology accuracy (81.4\%), versus Gemini-Simple (69.1\%) and DeepL (64.4\%), while preserving overall quality (mean DA 85.3 Gemini-RAG vs. 85.2 Gemini-Simple), outperforming DeepL (80.3). These results show that glossary-augmented prompting is a low-overhead way to improve terminology control in cultural-heritage translation if institutions maintain minimal terminology resources and lightweight evaluation procedures.
- Abstract(参考訳): 文化遺産機関は、研究や解釈資料を世界中に広める傾向にあるが、多言語的な普及は予算や人員の制限によって制限されている。
ロックアートのような専門用語の領域では、翻訳の質は正確で一貫した専門用語に依存し、小さな語彙エラーは非特殊主義者を誤解させ、再利用を減らすことができる。
NMTベースラインとしてのDeepL,(2)基本的なプロンプトを持つLLM) Gemini-Simple,(3) Gemini-RAG(用語的拡張された用語的プロンプトを持つLLM)である。
PEARMUTを用いて人間による評価を行う。
(i)マルチウェイダイレクトアセスメント(0-100)及び
(II)限定MQM分類による対象用語監査。
Gemini-RAGは81.4\%、Gemini-Simple (69.1\%) とDeepL (64.4\%)に対して、全体的な品質(平均 DA 85.3 Gemini-RAG vs. 85.2 Gemini-Simple)はDeepL (80.3) を上回っている。
これらの結果から,機関が最小限の用語資源と軽量な評価手順を維持している場合,グローサリー強化プロンプトは,文化遺産翻訳における用語制御を改善するための低オーバーヘッドな方法であることが示唆された。
関連論文リスト
- Terminology Rarity Predicts Catastrophic Failure in LLM Translation of Low-Resource Ancient Languages: Evidence from Ancient Greek [0.0]
本研究では,大規模言語モデル(LLM)機械翻訳(MT)の最初の体系的,参照不要な人的評価について述べる。
ギリシャの医師ガレン・デ・ペルガムム(Galen de Pergamum, CE)による2つの著作から20段の文章からなる商業用 LLM による翻訳を評価した。
標準的な自動評価指標(BLEU, chrF++, METEOR, ROUGE-L, BERTScore, COME)を用いて翻訳品質を評価する。
論文 参考訳(メタデータ) (2026-02-27T15:57:15Z) - Beyond Literal Mapping: Benchmarking and Improving Non-Literal Translation Evaluation [57.11989521509119]
本稿では,特殊なサブエージェントを起動するリフレクティブコアエージェントを中心に,エージェント翻訳評価フレームワークを提案する。
実験の結果、RATEの有効性が示され、現在の測定値と比較して少なくとも3.2メタスコアの改善が達成された。
論文 参考訳(メタデータ) (2026-01-12T09:03:42Z) - Languages Still Left Behind: Toward a Better Multilingual Machine Translation Benchmark [11.068031181100276]
我々は4つの言語(Asante Twi, Japanese, Jinghpaw, South Azerbaijani)のデータを研究する。
真の多言語評価に対するベンチマークの適合性の重大な欠点を明らかにする。
我々は、ドメイン汎用および文化的に中立なソーステキストを使用する多言語MTベンチマークを提唱する。
論文 参考訳(メタデータ) (2025-08-28T07:52:42Z) - Enhancing Low-Resource Minority Language Translation with LLMs and Retrieval-Augmented Generation for Cultural Nuances [4.017351230188094]
本研究では,Large Language Models (LLMs)とRetrieval-Augmented Generation (RAG)を統合することで,低リソース言語を翻訳する際の課題について検討する。
BLEUスコアは12% (辞書のみ) から31% (RAG with Gemini 2.0) まで様々である。
論文 参考訳(メタデータ) (2025-05-16T03:59:14Z) - Salute the Classic: Revisiting Challenges of Machine Translation in the
Age of Large Language Models [91.6543868677356]
ニューラルネットワーク翻訳の進化は、6つのコア課題の影響を受けている。
これらの課題には、ドメインミスマッチ、並列データの量、まれな単語予測、長文の翻訳、単語アライメントとしてのアテンションモデル、そして準最適ビームサーチが含まれる。
この研究はこれらの課題を再考し、先進的な大規模言語モデルにおけるそれらの継続的な関連性についての洞察を提供する。
論文 参考訳(メタデータ) (2024-01-16T13:30:09Z) - Adapting Large Language Models for Document-Level Machine Translation [46.370862171452444]
大規模言語モデル(LLM)は、様々な自然言語処理(NLP)タスクを大幅に進歩させた。
近年の研究では、中程度のLLMはタスク固有の微調整後、より大きなLLMよりも優れていることが示されている。
本研究では,特定の言語対に対する文書レベルの機械翻訳(DocMT)にLLMを適用することに焦点を当てた。
論文 参考訳(メタデータ) (2024-01-12T09:29:13Z) - Dictionary-based Phrase-level Prompting of Large Language Models for
Machine Translation [91.57514888410205]
大規模言語モデル(LLM)は、プロンプトによる機械翻訳(MT)能力を示す。
LLMは、低リソースやドメイン転送のシナリオで一般的なまれな単語で入力を翻訳するのに苦労する。
LLMプロンプトは、バイリンガル辞書からの事前知識を用いてプロンプトの制御ヒントを提供することにより、稀な単語に対する効果的な解決策を提供することができることを示す。
論文 参考訳(メタデータ) (2023-02-15T18:46:42Z) - SLING: Sino Linguistic Evaluation of Large Language Models [34.42512869432145]
Sling (Sino linguistics) は、中国語における38Kの最小文対を9つの高水準言語現象に分類する。
Sling 上で 18 個の事前訓練された単言語 (BERT-base-zh など) とマルチ言語 (mT5 や XLM など) の言語モデルをテストする。
実験の結果, LMの平均精度は人的性能(69.7%対97.1%)よりはるかに低いが, BERT-base-zhは試験されたLMの最大精度(84.8%)を達成していることがわかった。
論文 参考訳(メタデータ) (2022-10-21T02:29:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。