論文の概要: Building from Scratch: A Multi-Agent Framework with Human-in-the-Loop for Multilingual Legal Terminology Mapping
- arxiv url: http://arxiv.org/abs/2512.12950v1
- Date: Mon, 15 Dec 2025 03:29:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-16 17:54:56.521337
- Title: Building from Scratch: A Multi-Agent Framework with Human-in-the-Loop for Multilingual Legal Terminology Mapping
- Title(参考訳): Scratchから構築する:多言語法定用語マッピングのためのHuman-in-the-Loopを用いたマルチエージェントフレームワーク
- Authors: Lingyi Meng, Maolin Liu, Hao Wang, Yilan Cheng, Qi Yang, Idlkaid Mohanmmed,
- Abstract要約: 本稿では,多言語法的用語データベース構築のための人間-AI協調手法を提案する。
このアプローチは、プロセス全体を通じて高度な大規模言語モデルと法的ドメインエキスパートを統合する。
単一の自動化パイプラインとは異なり、私たちのアプローチは、人間の専門家の参加方法に重点を置いています。
- 参考スコア(独自算出の注目度): 4.664349534386531
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Accurately mapping legal terminology across languages remains a significant challenge, especially for language pairs like Chinese and Japanese, which share a large number of homographs with different meanings. Existing resources and standardized tools for these languages are limited. To address this, we propose a human-AI collaborative approach for building a multilingual legal terminology database, based on a multi-agent framework. This approach integrates advanced large language models and legal domain experts throughout the entire process-from raw document preprocessing, article-level alignment, to terminology extraction, mapping, and quality assurance. Unlike a single automated pipeline, our approach places greater emphasis on how human experts participate in this multi-agent system. Humans and AI agents take on different roles: AI agents handle specific, repetitive tasks, such as OCR, text segmentation, semantic alignment, and initial terminology extraction, while human experts provide crucial oversight, review, and supervise the outputs with contextual knowledge and legal judgment. We tested the effectiveness of this framework using a trilingual parallel corpus comprising 35 key Chinese statutes, along with their English and Japanese translations. The experimental results show that this human-in-the-loop, multi-agent workflow not only improves the precision and consistency of multilingual legal terminology mapping but also offers greater scalability compared to traditional manual methods.
- Abstract(参考訳): 言語間の法律用語の正確なマッピングは依然として重要な課題であり、特に中国語と日本語のような言語対は、異なる意味を持つ多数のホモグラフを共有している。
これらの言語のための既存のリソースと標準化されたツールは限られている。
そこで本研究では,マルチエージェントフレームワークに基づく多言語法的用語データベース構築のための人間-AI協調手法を提案する。
このアプローチは、原文書前処理、記事レベルのアライメント、用語抽出、マッピング、品質保証に至るまで、プロセス全体を通じて高度な大規模言語モデルと法的なドメインエキスパートを統合します。
単一の自動化パイプラインとは異なり、このアプローチは、人間の専門家がこのマルチエージェントシステムにどのように参加するかに重点を置いています。
AIエージェントは、OCR、テキストセグメンテーション、セマンティックアライメント、初期用語抽出などの特定の反復的なタスクを処理し、一方で、人間の専門家は、文脈的知識と法的判断でアウトプットを重要視し、レビューし、監督する。
このフレームワークの有効性を,35の中国法令と英語と日本語の翻訳を組み合わせた3言語並列コーパスを用いて検証した。
実験結果から,このヒューマン・イン・ザ・ループ・マルチエージェント・ワークフローは,多言語法的用語マッピングの精度と一貫性を向上するだけでなく,従来の手作業法に比べて拡張性も向上することが示された。
関連論文リスト
- Pun Intended: Multi-Agent Translation of Wordplay with Contrastive Learning and Phonetic-Semantic Embeddings [0.0]
本研究では,現在最先端の大規模言語モデルとワードプレイ生成のための特化技術を組み合わせることで,句を英語からフランス語に翻訳する新しい手法を提案する。
我々の方法論の主な目的は、単に語彙を重複させるのではなく、原文の語句の言語的創造性とユーモアを捉えることである。
論文 参考訳(メタデータ) (2025-07-09T03:09:14Z) - TransLaw: Benchmarking Large Language Models in Multi-Agent Simulation of the Collaborative Translation [1.112686067941444]
TransLawは、実世界の香港の事例法翻訳のために実装された新しいマルチエージェントフレームワークである。
翻訳者(Translator)、アノテーション(Annotator)、Proofreader(Proofreader)という3つの専門エージェントを使って、法律的な意味において高精度な翻訳を共同で作成している。
論文 参考訳(メタデータ) (2025-07-01T15:39:26Z) - (Perhaps) Beyond Human Translation: Harnessing Multi-Agent Collaboration for Translating Ultra-Long Literary Texts [56.7988577327046]
翻訳企業の役割と協調の実践をシミュレートする,新しいマルチエージェントフレームワークであるTransAgentsを紹介する。
本研究は,翻訳品質の向上,特にテキストの長文化におけるマルチエージェント協調の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2024-05-20T05:55:08Z) - Advancing Multilingual Pre-training: TRIP Triangular Document-level
Pre-training for Multilingual Language Models [107.83158521848372]
我々は,従来のモノリンガルおよびバイリンガルの目的を,グラフト法と呼ばれる新しい手法で三言語的目的に加速する分野において,最初のテキストbfTriangular Document-level textbfPre-training(textbfTRIP)を提案する。
TRIPは、3つの多言語文書レベルの機械翻訳ベンチマークと1つの言語間抽象的な要約ベンチマークで、最大3.11d-BLEU点と8.9ROUGE-L点の一貫性のある改善を含む、強力なSOTAスコアを達成している。
論文 参考訳(メタデータ) (2022-12-15T12:14:25Z) - Learning to Answer Multilingual and Code-Mixed Questions [4.290420179006601]
質問応答(QA)は、人間とコンピュータのシームレスな相互作用において重要な要素である。
もっとも古い研究分野の1つであるにもかかわらず、現在のQAシステムは多言語クエリを扱う上で重要な課題に直面している。
この論文は、多言語環境でエンドユーザクエリを扱うためのQA技術の進歩に焦点を当てている。
論文 参考訳(メタデータ) (2022-11-14T16:49:58Z) - Multilingual Multimodality: A Taxonomical Survey of Datasets,
Techniques, Challenges and Opportunities [10.721189858694396]
マルチ言語とマルチモーダル(MultiX)ストリームの統合について検討する。
我々は、並列アノテーションで研究された言語、金または銀のデータを調べ、これらのモダリティと言語がモデリングにおいてどのように相互作用するかを理解する。
モデリングアプローチの長所と短所とともに、どのシナリオを確実に使用できるのかをよりよく理解するために、モデリングアプローチについて説明します。
論文 参考訳(メタデータ) (2022-10-30T21:46:01Z) - Revamping Multilingual Agreement Bidirectionally via Switched
Back-translation for Multilingual Neural Machine Translation [107.83158521848372]
マルチリンガル・コンセンサス(MA)は、マルチリンガル・ニューラル・マシン翻訳(MNMT)の重要性を示した
textbfBidirectional textbfMultilingual textbfAgreement via textbfSwitched textbfBack-textbftranslation (textbfBMA-SBT)
これは、訓練済みのMNMTモデルを微調整するための、新規で普遍的な多言語合意フレームワークである。
論文 参考訳(メタデータ) (2022-09-28T09:14:58Z) - AM2iCo: Evaluating Word Meaning in Context across Low-ResourceLanguages
with Adversarial Examples [51.048234591165155]
本稿では, AM2iCo, Adversarial and Multilingual Meaning in Contextを提案する。
言語間文脈における単語の意味の同一性を理解するために、最先端(SotA)表現モデルを忠実に評価することを目的としている。
その結果、現在のSotAプリトレーニングエンコーダは人間のパフォーマンスにかなり遅れていることが明らかとなった。
論文 参考訳(メタデータ) (2021-04-17T20:23:45Z) - Crossing the Conversational Chasm: A Primer on Multilingual
Task-Oriented Dialogue Systems [51.328224222640614]
大規模な学習済みニューラルネットワークモデルに基づく最新のTODモデルは、データ空腹です。
ToDのユースケースのデータ取得は高価で面倒だ。
論文 参考訳(メタデータ) (2021-04-17T15:19:56Z) - Evaluating Multilingual Text Encoders for Unsupervised Cross-Lingual
Retrieval [51.60862829942932]
本稿では,言語間文書・文検索タスクにおける最先端多言語エンコーダの適合性に着目した体系的実証研究を行う。
文レベルのCLIRでは、最先端のパフォーマンスが達成できることを実証する。
しかし、ピーク性能は、汎用の多言語テキストエンコーダをオフ・ザ・シェルフで使うのではなく、文の理解タスクにさらに特化したバリエーションに依存している。
論文 参考訳(メタデータ) (2021-01-21T00:15:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。