論文の概要: From prompting to evidence-based translation: A RAG+prompt system for Japanese-Chinese translation and its pedagogical potential
- arxiv url: http://arxiv.org/abs/2605.03387v1
- Date: Tue, 05 May 2026 05:48:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-06 19:35:43.787743
- Title: From prompting to evidence-based translation: A RAG+prompt system for Japanese-Chinese translation and its pedagogical potential
- Title(参考訳): 証明に基づく翻訳へ向けて:日本語翻訳のためのRAG+プロンプトシステムとその教育的可能性
- Authors: Wenshi Gu,
- Abstract要約: 本研究では,言語解析,埋め込み型検索,迅速な構築,LLM生成をベースモデルを変更することなく統合した検索強化型RAG+Prompt翻訳システムについて検討した。
我々は、RAG+Prompt翻訳システムにより、NMCCを含む文のJa-Zh翻訳を解釈可能で監査可能な方法で改善することが結論付けられた。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Large language models perform well on high-resource pairs but are less reliable for Japanese-Chinese sentences containing noun-modifying clause constructions (NMCCs). This study evaluates a retrieval-augmented generation RAG+Prompt translation system that integrates linguistic analysis, embedding-based retrieval, prompt construction, and LLM generation without modifying the base model. The analysis module outputs A1 (inner vs. outer NMCC) and A2 (risk predictions: lexical choice/NMCC handling/word order/style/register); top-k = 5 similar Ja-Zh examples (L2 distance) and A1/A2 are inserted into an enhanced prompt. Using GPT-4o and a 66-sentence test set, we compare six knowledge-base sizes (0/100/200/500/1,000/2,000). Macro-averaged sentence-level BLEU (1-4-gram with brevity penalty; cased; Chinese at the character level) is the sole metric. Mean BLEU increases from 24.28 at 0 (RAG disabled) to 29.96 at 2,000 (+5.68; +23.4%). The upward trend holds across sizes, with larger knowledge bases yielding higher scores. We conclude that the RAG+Prompt translation system improves Ja-Zh translation of sentences containing NMCCs in an interpretable and auditable manner. Limitations include one base model, one metric, and reliance on published texts and commercial APIs; future work will broaden genres, language pairs, and evaluation metrics.
- Abstract(参考訳): 大規模言語モデルは高資源対でよく機能するが、名詞修飾節構造(NMCC)を含む日本語文では信頼性が低い。
本研究では,言語解析,埋め込み型検索,迅速な構築,LLM生成をベースモデルを変更することなく統合した検索強化型RAG+Prompt翻訳システムについて検討する。
分析モジュールは、A1(インナー対外NMCC)とA2(リスク予測:語彙選択/NMCCハンドリング/ワードオーダー/スタイル/登録)を出力し、トップk = 5類似のJa-Zh例(L2距離)とA1/A2を拡張プロンプトに挿入する。
GPT-4oと66文テストセットを用いて、6つの知識ベースサイズ(0/100/200/500/1,000/2,000)を比較した。
マクロ平均文レベルBLEU(1-4グラム、略式は中国語、文字レベルでは中国語)は唯一のメートル法である。
平均BLEUは0で24.28から2000で29.96に増加(+5.68; +23.4%)。
上向きの傾向は、より大きな知識ベースがより高いスコアを得るサイズにまたがる。
我々は、RAG+Prompt翻訳システムにより、NMCCを含む文のJa-Zh翻訳を解釈可能で監査可能な方法で改善することが結論付けられた。
制限には、1つのベースモデル、1つのメトリック、出版されたテキストや商用APIへの依存が含まれる。
関連論文リスト
- Chain-of-Thought Reasoning Improves Context-Aware Translation with Large Language Models [2.4063592468412276]
本稿では,文間依存関係を含む文を翻訳する大規模言語モデルの能力を評価する。
我々はDeepSeek-R1, GPT, Llama, Mistral, Phiの12 LLMを2つのタスクで評価した。
最良のモデルは推論を生かし、最初のタスクで約90%の精度で到達し、COMETは2タスクで約92%のスコアを得る。
論文 参考訳(メタデータ) (2025-10-20T20:14:46Z) - GemDetox at TextDetox CLEF 2025: Enhancing a Massively Multilingual Model for Text Detoxification on Low-resource Languages [32.22353317193898]
PAN 2025 Multilingual Text Detoxification Challengeについて述べる。
パラメータ効率のよいLoRA SFT微調整を施し、少数ショットやチェーン・オブ・サートのような技法を推し進める。
当社のシステムは、まず、高リソースおよび低リソース言語にランク付けする。
論文 参考訳(メタデータ) (2025-09-24T10:06:40Z) - SCRum-9: Multilingual Stance Classification over Rumours on Social Media [15.412870757706473]
SCRum-9は、Xから7,516のツイートを含む9つの言語でRumour分析のための最大のデータセットである。
本稿では,多言語合成データを用いた姿勢分類手法を提案する。
SCRum-9は研究コミュニティに公開され、ソーシャルメディア上の誤解を招く物語の多言語分析のさらなる研究を促進する可能性がある。
論文 参考訳(メタデータ) (2025-05-25T00:50:43Z) - Retrieval-Augmented Machine Translation with Unstructured Knowledge [63.97706326080482]
Retrieval-augmented Generation (RAG)は、大規模言語モデル(LLM)を強化するために追加情報を導入する
機械翻訳(MT)では、従来の研究は通常、ペア化されたMTコーパスや知識グラフからコンテキスト内例を検索する。
本稿では,非構造化文書を用いた検索強化MTについて検討する。
論文 参考訳(メタデータ) (2024-12-05T17:00:32Z) - Prosody in Cascade and Direct Speech-to-Text Translation: a case study
on Korean Wh-Phrases [79.07111754406841]
本研究は,韻律が重要な役割を果たす発話を明瞭にするための直接S2TTシステムの能力を評価するために,コントラスト評価を用いることを提案する。
本結果は,カスケード翻訳モデルよりも直接翻訳システムの価値を明確に示すものである。
論文 参考訳(メタデータ) (2024-02-01T14:46:35Z) - Improving Translation Faithfulness of Large Language Models via
Augmenting Instructions [89.76691340615848]
SWIE(Segment-Weighted Instruction Embedding)と命令追従データセットOVERMISSを提案する。
SWIEは、以下の入力および応答表現に大域的な命令表現を追加することにより、モデル命令理解を改善する。
OVERMISSは、オーバー翻訳とミス翻訳の結果を正しい翻訳と比較することにより、モデルの忠実度を向上させる。
論文 参考訳(メタデータ) (2023-08-24T09:32:29Z) - Few-Shot Cross-lingual Transfer for Coarse-grained De-identification of
Code-Mixed Clinical Texts [56.72488923420374]
事前学習型言語モデル (LM) は低リソース環境下での言語間移動に大きな可能性を示している。
脳卒中におけるコードミキシング(スペイン・カタラン)臨床ノートの低リソース・実世界の課題を解決するために,NER (name recognition) のためのLMの多言語間転写特性を示す。
論文 参考訳(メタデータ) (2022-04-10T21:46:52Z) - Explicit Alignment Objectives for Multilingual Bidirectional Encoders [111.65322283420805]
本稿では,多言語エンコーダAMBER(Aligned Multilingual Bi-directional EncodeR)の学習方法を提案する。
AMBERは、異なる粒度で多言語表現を整列する2つの明示的なアライメント目標を使用して、追加の並列データに基づいて訓練される。
実験結果から、AMBERは、シーケンスタグ付けで1.1平均F1スコア、XLMR-大規模モデル上での検索で27.3平均精度を得ることがわかった。
論文 参考訳(メタデータ) (2020-10-15T18:34:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。