論文の概要: Discourse Graph Guided Document Translation with Large Language Models
- arxiv url: http://arxiv.org/abs/2511.07230v1
- Date: Mon, 10 Nov 2025 15:48:01 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-11 21:18:45.340072
- Title: Discourse Graph Guided Document Translation with Large Language Models
- Title(参考訳): 大規模言語モデルを用いた談話グラフ案内文書翻訳
- Authors: Viet-Thanh Pham, Minghan Wang, Hao-Han Liao, Thuy-Trang Vu,
- Abstract要約: TransGraphは、構造化された談話グラフを通じてチャンク間の関係を明示的にモデル化する、談話誘導フレームワークである。
翻訳品質と用語の整合性の強いベースラインを一貫して越えつつ、トークンオーバーヘッドを著しく低くする。
- 参考スコア(独自算出の注目度): 18.88786853549414
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Adapting large language models to full document translation remains challenging due to the difficulty of capturing long-range dependencies and preserving discourse coherence throughout extended texts. While recent agentic machine translation systems mitigate context window constraints through multi-agent orchestration and persistent memory, they require substantial computational resources and are sensitive to memory retrieval strategies. We introduce TransGraph, a discourse-guided framework that explicitly models inter-chunk relationships through structured discourse graphs and selectively conditions each translation segment on relevant graph neighbourhoods rather than relying on sequential or exhaustive context. Across three document-level MT benchmarks spanning six languages and diverse domains, TransGraph consistently surpasses strong baselines in translation quality and terminology consistency while incurring significantly lower token overhead.
- Abstract(参考訳): 大きな言語モデルをフルドキュメント翻訳に適応させることは、長い範囲の依存関係をキャプチャし、拡張されたテキストを通して会話コヒーレンスを保存するのが困難であるため、依然として困難である。
最近のエージェント機械翻訳システムは、マルチエージェントオーケストレーションと永続メモリによるコンテキストウィンドウ制約を緩和するが、それらはかなりの計算資源を必要とし、メモリ検索戦略に敏感である。
このフレームワークは,連続的あるいは徹底的な文脈に依存するのではなく,構造化された談話グラフと関連するグラフ領域上の各翻訳セグメントを選択的に条件付けることで,チャンク間の関係を明示的にモデル化する。
6つの言語と多種多様なドメインにまたがる3つの文書レベルのMTベンチマークにおいて、TransGraphは、トークンオーバーヘッドを著しく低くしながら、翻訳品質と用語の一貫性の強いベースラインを一貫して越えている。
関連論文リスト
- GRAFT: A Graph-based Flow-aware Agentic Framework for Document-level Machine Translation [29.444855969559153]
文書翻訳のためのGRAFT(Graph Augmented Agentic Framework for Document Level Translation)を提案する。
GRAFTは、セグメンテーション、DAGに基づく依存性モデリング、凝集性フレームワークへの談話対応翻訳を統合している。
8つの翻訳方向と6つの多様なドメインにわたる実験により、GRAFTはDocMTシステムよりも大きな性能向上を達成できることが示された。
論文 参考訳(メタデータ) (2025-07-04T05:45:55Z) - Multilingual Contextualization of Large Language Models for Document-Level Machine Translation [28.08957305340726]
大規模言語モデル (LLM) は文レベルの機械翻訳において高い性能を示している。
高品質な文書レベルのデータを対象とした微調整により,LLMに基づく長期文書翻訳を改善する手法を提案する。
提案手法は,文書から文書への直接翻訳やチャンクレベルの翻訳など,複数の翻訳パラダイムをサポートする。
論文 参考訳(メタデータ) (2025-04-16T14:52:22Z) - PICASO: Permutation-Invariant Context Composition with State Space Models [98.91198288025117]
State Space Models (SSM) は、コンテキストのデータベースを固定次元の状態にマッピング可能にすることで、有望なソリューションを提供する。
本研究では,SSM力学から導かれる単純な数学的関係を,生のコンテキストトークンの連結効果を効率的に近似する複数の状態に構成する。
我々は,WikiText と MSMARCO をゼロショットと微調整の両方で評価し,平均5.4倍のスピードアップを楽しみながら最強の演奏ベースラインと一致できることを示す。
論文 参考訳(メタデータ) (2025-02-24T19:48:00Z) - Text Reading Order in Uncontrolled Conditions by Sparse Graph
Segmentation [71.40119152422295]
テキストの読み出し順序を識別するための軽量でスケーラブルで一般化可能なアプローチを提案する。
モデルは言語に依存しず、多言語データセットで効果的に実行される。
モバイルデバイスを含むあらゆるプラットフォームにデプロイできるほど小さい。
論文 参考訳(メタデータ) (2023-05-04T06:21:00Z) - PARAGRAPH2GRAPH: A GNN-based framework for layout paragraph analysis [6.155943751502232]
本稿では,言語に依存しないグラフニューラルネットワーク(GNN)モデルを提案する。
我々のモデルは産業アプリケーション、特に多言語シナリオに適しています。
論文 参考訳(メタデータ) (2023-04-24T03:54:48Z) - Unsupervised Image-to-Image Translation with Generative Prior [103.54337984566877]
教師なし画像画像変換は、ペアデータなしで2つの視覚領域間の翻訳を学習することを目的としている。
本稿では,GP-UNIT(Generative Prior-guided UN Image-to-image Translation)という新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2022-04-07T17:59:23Z) - BASS: Boosting Abstractive Summarization with Unified Semantic Graph [49.48925904426591]
BASSは、統合されたセマンティックグラフに基づく抽象的な要約を促進するためのフレームワークである。
文書表現と要約生成の両方を改善するために,グラフベースのエンコーダデコーダモデルを提案する。
実験結果から,提案アーキテクチャは長期文書および複数文書要約タスクに大幅な改善をもたらすことが示された。
論文 参考訳(メタデータ) (2021-05-25T16:20:48Z) - Document Graph for Neural Machine Translation [42.13593962963306]
文書は, 距離に関係なく, 関連コンテキストを関連づけるグラフとして表現できることを示す。
IWSLT English- French, Chinese- English, WMT English-German and Opensubtitle English- Russian などの様々なNMTベンチマークの実験では、文書グラフの使用により翻訳品質が大幅に向上することを示した。
論文 参考訳(メタデータ) (2020-12-07T06:48:59Z) - GATE: Graph Attention Transformer Encoder for Cross-lingual Relation and
Event Extraction [107.8262586956778]
言語に依存しない文表現を学習するために、普遍的な依存解析を伴うグラフ畳み込みネットワーク(GCN)を導入する。
GCNは、長い範囲の依存関係を持つ単語をモデル化するのに苦労する。
そこで本研究では,構文的距離の異なる単語間の依存関係を学習するための自己認識機構を提案する。
論文 参考訳(メタデータ) (2020-10-06T20:30:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。