論文の概要: LaTeXTrans: Structured LaTeX Translation with Multi-Agent Coordination
- arxiv url: http://arxiv.org/abs/2508.18791v1
- Date: Tue, 26 Aug 2025 08:17:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-27 17:42:38.751996
- Title: LaTeXTrans: Structured LaTeX Translation with Multi-Agent Coordination
- Title(参考訳): LaTeXTrans:多エージェント座標を用いた構造化LaTeX変換
- Authors: Ziming Zhu, Chenglong Wang, Shunjie Xing, Yifu Huo, Fengning Tian, Quan Du, Di Yang, Chunliang Zhang, Tong Xiao, Jingbo Zhu,
- Abstract要約: 構造化フォーマットの文書は、セマンティックな整合性とコンパイル可能性を維持するために正確に保存されなければならない。
本稿では,この課題に対処するための協調型マルチエージェントシステムMTTransを紹介する。
MTTransは,翻訳精度と構造忠実度の両方において,主流システムより優れていることを示す。
- 参考スコア(独自算出の注目度): 46.53643691093418
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Despite the remarkable progress of modern machine translation (MT) systems on general-domain texts, translating structured LaTeX-formatted documents remains a significant challenge. These documents typically interleave natural language with domain-specific syntax, such as mathematical equations, tables, figures, and cross-references, all of which must be accurately preserved to maintain semantic integrity and compilability. In this paper, we introduce LaTeXTrans, a collaborative multi-agent system designed to address this challenge. LaTeXTrans ensures format preservation, structural fidelity, and terminology consistency through six specialized agents: 1) a Parser that decomposes LaTeX into translation-friendly units via placeholder substitution and syntax filtering; 2) a Translator, Validator, Summarizer, and Terminology Extractor that work collaboratively to ensure context-aware, self-correcting, and terminology-consistent translations; 3) a Generator that reconstructs the translated content into well-structured LaTeX documents. Experimental results demonstrate that LaTeXTrans can outperform mainstream MT systems in both translation accuracy and structural fidelity, offering an effective and practical solution for translating LaTeX-formatted documents.
- Abstract(参考訳): 汎用ドメインテキストにおける機械翻訳(MT)システムの顕著な進歩にもかかわらず、構造化されたLaTeX形式文書の翻訳は依然として大きな課題である。
これらの文書は、通常、数学的方程式、表、図形、相互参照といった、ドメイン固有の構文と自然言語をインターリーブするが、これらは全て意味論的整合性とコンパイル可能性を維持するために正確に保存されなければならない。
本稿では,この課題に対処するために設計された協調型マルチエージェントシステムであるLaTeXTransを紹介する。
LaTeXTransは、6つの特殊エージェントを通してフォーマットの保存、構造的忠実性、用語的一貫性を保証する。
1) LaTeXをプレースホルダー置換及び構文フィルタリングにより翻訳しやすい単位に分解するパーサー
2) 文脈認識,自己訂正及び用語一貫性翻訳を保証するために協力して働く翻訳者,検証者,要約者及び用語外訳者
3) 翻訳された内容を構造化されたLaTeX文書に再構成するジェネレータ。
実験結果から,LaTeXTransは翻訳精度と構造忠実度の両方でメインストリームMTシステムより優れており,LaTeXフォーマット文書の翻訳に有効かつ実用的なソリューションを提供する。
関連論文リスト
- LATTE: Improving Latex Recognition for Tables and Formulae with Iterative Refinement [11.931911831112357]
ソースとレンダリングされたPDF画像は、特に公式やテーブルでは、大きく異なるように見える。
以前の作業は、単一のイテレーションでソースを生成し、複雑な公式に苦労する。
本稿では,認識のための最初の反復的改良フレームワークであるLATTEを提案する。
論文 参考訳(メタデータ) (2024-09-21T17:18:49Z) - MathBridge: A Large Corpus Dataset for Translating Spoken Mathematical Expressions into $LaTeX$ Formulas for Improved Readability [10.757551947236879]
数学的な文を公式に翻訳する最初の広範囲なデータセットであるMathBridgeを紹介する。
MathBridgeは、数学的な音声文から公式に変換するための事前訓練された言語モデルの能力を大幅に向上させる。
論文 参考訳(メタデータ) (2024-08-07T18:07:15Z) - Towards Semantic Markup of Mathematical Documents via User Interaction [0.0]
本稿では,既存の s マクロ定義から文法を自動生成し,それらを解析することで,式の意味的マークアップにアプローチする。
また、解析結果を曖昧にするためのGUIベースのツールも提示し、未入力の$lambda$-termsを解析するための文法を用いてその可能性を示す。
論文 参考訳(メタデータ) (2024-08-05T12:36:40Z) - AnyTrans: Translate AnyText in the Image with Large Scale Models [88.5887934499388]
本稿では、画像中のタスク翻訳AnyText(TATI)のためのオール・エンコンパス・フレームワークであるAnyTransを紹介する。
我々のフレームワークは、翻訳中にテキスト要素と視覚要素の両方から文脈的手がかりを取り入れている。
6つの言語対の多言語テキスト画像翻訳データからなるMTIT6というテストデータセットを精巧にコンパイルした。
論文 参考訳(メタデータ) (2024-06-17T11:37:48Z) - TextFormer: A Query-based End-to-End Text Spotter with Mixed Supervision [61.186488081379]
Transformerアーキテクチャを用いた問合せベースのエンドツーエンドテキストスポッターであるTextFormerを提案する。
TextFormerは、画像エンコーダとテキストデコーダの上に構築され、マルチタスクモデリングのための共同セマンティック理解を学ぶ。
分類、セグメンテーション、認識のブランチの相互訓練と最適化を可能にし、より深い特徴共有をもたらす。
論文 参考訳(メタデータ) (2023-06-06T03:37:41Z) - A Bilingual Parallel Corpus with Discourse Annotations [82.07304301996562]
本稿では,Jiang et al. (2022)で最初に導入された大きな並列コーパスであるBWBと,注釈付きテストセットについて述べる。
BWBコーパスは、専門家によって英語に翻訳された中国の小説で構成されており、注釈付きテストセットは、様々な談話現象をモデル化する機械翻訳システムの能力を調査するために設計されている。
論文 参考訳(メタデータ) (2022-10-26T12:33:53Z) - Machine Translation of Mathematical Text [0.0]
数学的テキストを含む文書を対象とした機械翻訳システムPolyMath Translatorを実装した。
現在の実装は英語をフランス語に翻訳し、数学文の保留テストコーパスでBLEUスコアが53.5に達した。
さらに編集することなくPDFにコンパイルできる文書を生成する。
論文 参考訳(メタデータ) (2020-10-11T11:59:40Z) - A High-Quality Multilingual Dataset for Structured Documentation
Translation [101.41835967142521]
本稿では,文書領域を対象とした高品質な多言語データセットを提案する。
エンタープライズソフトウェアプラットフォームのオンラインドキュメントからXML構造化の並列テキストセグメントを収集します。
論文 参考訳(メタデータ) (2020-06-24T02:08:44Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。