論文の概要: LegalWorld: A Life-Cycle Interactive Environment for Legal Agents
- arxiv url: http://arxiv.org/abs/2606.18728v1
- Date: Wed, 17 Jun 2026 06:11:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.030082
- Title: LegalWorld: A Life-Cycle Interactive Environment for Legal Agents
- Title(参考訳): LegalWorld: 法律エージェントのためのライフサイクルインタラクティブ環境
- Authors: Songhan Zuo, Shengbin Yue, Tao Chiang, Guanying Li, Yun Song, Xuanjing Huang, Zhongyu Wei,
- Abstract要約: 本稿では,中国の民事訴訟を5段階の因果関係の州連鎖としてモデル化したライフサイクルインタラクティブ環境であるLegalWorldを紹介する。
We build LongJud-Bench to evaluate agent capabilities across all five connected stage。
- 参考スコア(独自算出の注目度): 51.88999937175361
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Civil litigation is inherently a life-cycle process: what a lawyer drafts on day one constrains what unfolds at trial months later. Yet existing legal benchmarks evaluate isolated subtasks, and prior legal-agent simulators reinitialize each scenario from shared ground truth, leaving cross-stage causal dependencies unmodeled. We present LegalWorld, a life-cycle interactive environment that models Chinese civil litigation as a causally connected state chain of five stages (seven sub-scenarios), grounded in 75,309 paired Chinese civil judgments. We pair it with reusable infrastructure (local memory, global case memory, a Skill/Tool library) that keeps each dispute consistent across its full life cycle. Building on this environment, we construct LongJud-Bench to evaluate agent capability across all five connected stages. 18,992 ratings from 217 legal-background evaluators confirm that LegalWorld trajectories are procedurally faithful and role-consistent; and a capability-level cross-model evaluation reveals sharp divergences that aggregate scores cannot expose, with no single backbone leading across consultation, drafting, and courtroom advocacy. Detailed resources will be released publicly.
- Abstract(参考訳): 民事訴訟は本質的にライフサイクルプロセスであり、弁護士が初日に起草したものは、裁判の数ヶ月後に展開するものを制限している。
しかし、既存の法定ベンチマークでは、孤立したサブタスクを評価し、以前の法定エージェントシミュレータは、各シナリオを共有基底真理から再起動し、ステージ間の因果関係はモデル化されていない。
我々は,中国の民事訴訟を5段階(7つのサブシナリオ)の因果関係の州連鎖としてモデル化し,75,309対の中国民事判決を根拠としたライフサイクルインタラクティブ環境であるLegalWorldを提示する。
再利用可能なインフラストラクチャ(ローカルメモリ、グローバルケースメモリ、スキル/ツールライブラリ)と組み合わせて、各コンフリクトをフルライフサイクルにわたって一貫性を保つことができます。
この環境上に構築したLongJud-Benchは,5つの連結ステージにまたがるエージェント能力を評価する。
217の法的背景評価者からの18,992のレーティングは、法的な世界軌道は手続き的に忠実で、役割に一貫性があることを確認し、能力レベルのクロスモデル評価では、スコアが露出できない鋭い分岐が示され、単一のバックボーンが相談、起草、法廷の擁護に導かれることはない。
詳細なリソースは公開されます。
関連論文リスト
- Civil Court Simulation with Large Language Models [32.2877994633458]
裁判所のシミュレーションは法的教育と司法実務を橋渡しするが、人間に基づくシミュレーションは費用がかかり、スケールが難しい。
中国民事事件のマルチエージェント裁判所シミュレーションフレームワークを提案する。
論文 参考訳(メタデータ) (2026-06-08T15:30:49Z) - CyberJurors: A Multi-Agent Simulation Task for E-Commerce Disputes Verdict [59.06704011432714]
電子商取引プラットフォームは、大量の取引紛争を判断するためにクラウドソースの陪審員を募集し始めた。
本稿では,先駆的タスクであるEDV(E-Commerce Dispute Verdicts)と,6,000件の現実世界のケースからなるマルチモーダルベンチマークであるVerdictBenchを紹介する。
本稿では,論争ロジックを明確にし,判定プロセスを制御するマルチエージェントフレームワークであるCyberJurorsを提案する。
論文 参考訳(メタデータ) (2026-05-27T12:07:44Z) - LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [54.57434222018289]
我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。
LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。
LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文 参考訳(メタデータ) (2026-01-31T10:18:32Z) - AppellateGen: A Benchmark for Appellate Legal Judgment Generation [30.9030336647868]
7,351対のケースペアからなる第2のインスタンス法定判断生成のためのベンチマークであるAppellateGenを紹介する。
このタスクは、最初の評決と明らかな更新について推論することで、法的に拘束力のある判断を起草するモデルを必要とする。
本稿では,SOPに基づく法的マルチエージェントシステム(SLMAS)を提案し,その生成過程を個別の課題識別,検索,起草の段階に分解する。
論文 参考訳(メタデータ) (2026-01-04T02:15:17Z) - AppealCase: A Dataset and Benchmark for Civil Case Appeal Scenarios [47.83822985839837]
本稿では,91件の民事事件の1万対の実世界と一致した第1インスタンスと第2インスタンスの文書からなるFiceCaseデータセットを提案する。
このデータセットには、判断の逆転、逆転理由、引用された法的規定、クレームレベルの決定、第2のインスタンスに新たな情報があるかどうかという5つの側面に沿った詳細なアノテーションも含まれている。
実験結果から, すべてのモデルが判定逆転予測タスクにおいて50%未満のF1スコアを達成し, 魅力シナリオの複雑さと課題を浮き彫りにしていることがわかった。
論文 参考訳(メタデータ) (2025-05-22T10:50:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。