論文の概要: G^2C-MT: Graph-Guided Context Selection for Document-Level Machine Translation
- arxiv url: http://arxiv.org/abs/2606.03078v1
- Date: Tue, 02 Jun 2026 03:09:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-03 22:00:04.719004
- Title: G^2C-MT: Graph-Guided Context Selection for Document-Level Machine Translation
- Title(参考訳): G^2C-MT:文書レベル機械翻訳のためのグラフガイド付き文脈選択
- Authors: Baijun Ji, Zixuan Zhou, Xiangyu Duan, Yu Liu, Longbo Sun, Rupu Wei, Bohong Zhao,
- Abstract要約: ドキュメントレベルの機械翻訳(DocMT)では、長距離の談話の依存関係をキャプチャする必要がある。
G2C-MTは、DocMTコンテキスト選択を軽量な談話グラフ上の構造化経路発見問題とみなしている。
このフレームワークは自然にマルチパスコンテキストサンプリングをサポートしており、談話・あいまいな入力に対して多様な翻訳候補を集約することで堅牢性を向上させることができる。
- 参考スコア(独自算出の注目度): 7.730467866001466
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Effective document-level machine translation (DocMT) requires capturing long-range discourse dependencies. Recent work has explored retrieval-based and discourse-aware context selection. However, these approaches often lack an explicit mechanism for modeling structured discourse dependencies between distant paragraphs in a document. In this paper, we propose G^2C-MT (Graph-Guided Context for Machine Translation), which views DocMT context selection as a structured path discovery problem on a lightweight discourse graph, rather than retrieving unstructured context sets or relying on expensive LLM-based discourse modeling. In detail, we represent each paragraph as a node and model the relationship between each pair of nodes, considering their semantic similarity, adjacency, and keyword overlap. Furthermore, we propose a depth-biased random walk over the graph to sample a backward context path for each target paragraph. The context path will be used to prompt a large language model (LLM) for translation. This framework naturally supports multi-path context sampling, which can improve robustness by aggregating diverse translation candidates for discourse-ambiguous inputs. Experiments conducted across various domains show that G^2C-MT outperforms strong baselines on multiple LLMs, including DeepSeek-V3, Gemini-2.5-Flash-lite, and the Qwen-2.5/3 series.
- Abstract(参考訳): ドキュメントレベルの効率的な機械翻訳(DocMT)は、長距離の談話の依存関係をキャプチャする必要がある。
最近の研究は、検索ベースおよび談話対応コンテキスト選択について検討している。
しかしながら、これらのアプローチは文書内の遠い段落間の構造化された談話依存性をモデル化するための明確なメカニズムを欠いていることが多い。
本稿では,G^2C-MT(Graph-Guided Context for Machine Translation, 機械翻訳用グラフガイドコンテキスト)を提案する。
詳細は,各段落をノードとして表現し,それぞれのノード間の関係をモデル化する。
さらに,グラフ上の奥行きに偏ったランダムウォークを提案し,各段落の逆方向のコンテキストパスをサンプリングする。
コンテキストパスは、翻訳のための大きな言語モデル(LLM)を促すために使用される。
このフレームワークは自然にマルチパスコンテキストサンプリングをサポートしており、談話・あいまいな入力に対して多様な翻訳候補を集約することで堅牢性を向上させることができる。
G^2C-MTは、DeepSeek-V3、Gemini-2.5-Flash-lite、Qwen-2.5/3シリーズなど、複数のLLMにおいて強力なベースラインを達成している。
関連論文リスト
- Chain of Evidence: Pixel-Level Visual Attribution for Iterative Retrieval-Augmented Generation [19.889854990300595]
反復検索拡張生成(iRAG)は、複雑なマルチホップ問題に答える強力なパラダイムとして登場した。
Evidence (CoE) の textbfChain について述べる。
論文 参考訳(メタデータ) (2026-05-02T06:40:42Z) - $G^2$-Reader: Dual Evolving Graphs for Multimodal Document QA [53.491241153213565]
G2$-Readerはマルチモーダルな質問応答のためのデュアルグラフシステムである。
Qwen3-VL-32B-Instructによる$G2$-Readerの平均精度は66.21%に達し、強力なベースラインとスタンドアローンのGPT-5(53.08%)を上回った。
5つのマルチモーダルドメインにわたるVisDoMBenchでは、Qwen3-VL-32B-Instructを使った$G2$-Readerが平均精度66.21%に達し、強力なベースラインとスタンドアロンのGPT-5(53.08%)を上回っている。
論文 参考訳(メタデータ) (2026-01-29T17:52:54Z) - Discourse Graph Guided Document Translation with Large Language Models [18.88786853549414]
TransGraphは、構造化された談話グラフを通じてチャンク間の関係を明示的にモデル化する、談話誘導フレームワークである。
翻訳品質と用語の整合性の強いベースラインを一貫して越えつつ、トークンオーバーヘッドを著しく低くする。
論文 参考訳(メタデータ) (2025-11-10T15:48:01Z) - GRAFT: A Graph-based Flow-aware Agentic Framework for Document-level Machine Translation [29.444855969559153]
文書翻訳のためのGRAFT(Graph Augmented Agentic Framework for Document Level Translation)を提案する。
GRAFTは、セグメンテーション、DAGに基づく依存性モデリング、凝集性フレームワークへの談話対応翻訳を統合している。
8つの翻訳方向と6つの多様なドメインにわたる実験により、GRAFTはDocMTシステムよりも大きな性能向上を達成できることが示された。
論文 参考訳(メタデータ) (2025-07-04T05:45:55Z) - Beyond Chunking: Discourse-Aware Hierarchical Retrieval for Long Document Question Answering [51.7493726399073]
本稿では,長文質問応答を改善するための対話型階層型フレームワークを提案する。
このフレームワークには3つの重要な革新がある: 長文の専門的な談話解析、LLMに基づく談話関係ノードの拡張、構造誘導階層検索である。
論文 参考訳(メタデータ) (2025-05-26T14:45:12Z) - M-DocSum: Do LVLMs Genuinely Comprehend Interleaved Image-Text in Document Summarization? [49.53982792497275]
本稿では,LVLM(Large Vision-Language Models)が文書中のインターリーブ画像テキストを真に理解しているかどうかを検討する。
既存の文書理解ベンチマークは、しばしば質問応答形式を用いてLVLMを評価する。
マルチモーダル文書要約ベンチマーク(M-DocSum-Bench)について紹介する。
M-DocSum-Benchは500の高品質なarXiv論文と、人間の好みに合わせたインターリーブされたマルチモーダル要約で構成されている。
論文 参考訳(メタデータ) (2025-03-27T07:28:32Z) - A Case Study on Context-Aware Neural Machine Translation with Multi-Task Learning [49.62044186504516]
文書レベルのニューラルネットワーク翻訳(DocNMT)では、コンテクストやソース文のエンコーディングにおいてマルチエンコーダアプローチが一般的である。
近年の研究では、コンテキストエンコーダがノイズを発生させ、コンテキストの選択に頑健なモデルを実現することが示されている。
本稿では、マルチタスク学習(MTL)を通してコンテキストエンコーディングを明示的にモデル化することで、コンテキスト選択に敏感なモデルを実現することにより、この観察をさらに検討する。
論文 参考訳(メタデータ) (2024-07-03T12:50:49Z) - MGDoc: Pre-training with Multi-granular Hierarchy for Document Image
Understanding [53.03978356918377]
異なるレベルの粒度のコンテンツ間の空間的階層的関係は、文書画像理解タスクに不可欠である。
既存の方法は単語レベルか地域レベルから特徴を学習するが、両方を同時に考えることができない。
MGDocは,ページレベル,領域レベル,単語レベル情報を同時にエンコードするマルチモーダル・マルチグラニュラ事前学習フレームワークである。
論文 参考訳(メタデータ) (2022-11-27T22:47:37Z) - SMDT: Selective Memory-Augmented Neural Document Translation [53.4627288890316]
本稿では,文脈の広い仮説空間を含む文書を扱うために,選択的メモリ拡張型ニューラル文書翻訳モデルを提案する。
トレーニングコーパスから類似のバイリンガル文ペアを抽出し,グローバルな文脈を拡大する。
ローカルなコンテキストと多様なグローバルなコンテキストをキャプチャする選択的なメカニズムで、2ストリームのアテンションモデルを拡張する。
論文 参考訳(メタデータ) (2022-01-05T14:23:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。