論文の概要: SimuCourt: Building Judicial Decision-Making Agents with Real-world
Judgement Documents
- arxiv url: http://arxiv.org/abs/2403.02959v1
- Date: Tue, 5 Mar 2024 13:30:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-03-06 14:50:56.598867
- Title: SimuCourt: Building Judicial Decision-Making Agents with Real-world
Judgement Documents
- Title(参考訳): SimuCourt: 現実の判断文書を用いた司法判断エージェントの構築
- Authors: Zhitao He, Pengfei Cao, Chenhao Wang, Zhuoran Jin, Yubo Chen, Jiexin
Xu, Huaijun Li, Xiaojian Jiang, Kang Liu, Jun Zhao
- Abstract要約: 本稿では,審査員の意思決定をシミュレートする新しいマルチエージェントフレームワーク,AgentsCourtを提案する。
われわれの枠組みは,裁判所の審理シミュレーション,法的情報検索,判決の精査という,現実世界の古典的法廷裁判プロセスに従う。
私たちのモデルは、第1および第2のインスタンス設定で8.6%と9.1%のF1スコアを大幅に改善します。
- 参考スコア(独自算出の注目度): 20.3895876500467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: With the development of deep learning, natural language processing technology
has effectively improved the efficiency of various aspects of the traditional
judicial industry. However, most current efforts focus solely on individual
judicial stage, overlooking cross-stage collaboration. As the autonomous agents
powered by large language models are becoming increasingly smart and able to
make complex decisions in real-world settings, offering new insights for
judicial intelligence. In this paper, (1) we introduce SimuCourt, a judicial
benchmark that encompasses 420 judgment documents from real-world, spanning the
three most common types of judicial cases, and a novel task Judicial
Decision-Making to evaluate the judicial analysis and decision-making power of
agents. To support this task, we construct a large-scale judicial knowledge
base, JudicialKB, with multiple legal knowledge. (2) we propose a novel
multi-agent framework, AgentsCourt. Our framework follows the real-world
classic court trial process, consisting of court debate simulation, legal
information retrieval and judgement refinement to simulate the decision-making
of judge. (3) we perform extensive experiments, the results demonstrate that,
our framework outperforms the existing advanced methods in various aspects,
especially in generating legal grounds, where our model achieves significant
improvements of 8.6% and 9.1% F1 score in the first and second instance
settings, respectively.
- Abstract(参考訳): ディープラーニングの発展に伴い、自然言語処理技術は伝統的な司法産業の様々な面の効率を効果的に改善した。
しかし、現在のほとんどの取り組みは、個別の司法段階にのみ焦点を合わせ、段階横断的なコラボレーションを見越している。
大きな言語モデルを利用した自律エージェントがますます賢くなり、現実の環境で複雑な決定を下すようになり、司法情報に新たな洞察を与えている。
本稿では,(1)実世界から420件の判決文書を包含する司法ベンチマークであるsimucourtと,エージェントの司法分析と意思決定力を評価するための新たなタスク司法決定について紹介する。
この課題を支援するために,複数の法的知識を持つ大規模司法知識基盤である司法KBを構築した。
2) 新たなマルチエージェントフレームワークであるエージェントコートを提案する。
本枠組みは,裁判所の審理シミュレーション,法的情報検索,判決の精査により,判決決定をシミュレートする,現実世界の古典的裁判所審理プロセスに従う。
3) 広範な実験を行った結果, 提案手法は, 既存の先進的手法, 特に法的根拠の生成において, 第一インスタンスと第二インスタンスの設定において, それぞれ8.6%, 9.1%のf1スコアの大幅な改善を達成している。
関連論文リスト
- Ready Jurist One: Benchmarking Language Agents for Legal Intelligence in Dynamic Environments [24.249035670782092]
LLMをベースとしたエージェントに適した,対話型かつダイナミックな法律環境であるJ1-ENVSを紹介する。
環境複雑さの3段階にわたる中国の法律の6つの代表的なシナリオで構成されている。
また、タスクパフォーマンスと手続き的コンプライアンスの両方を評価するために、きめ細かい評価フレームワークであるJ1-EVALを導入します。
論文 参考訳(メタデータ) (2025-07-05T13:31:21Z) - A Data Science Approach to Calcutta High Court Judgments: An Efficient LLM and RAG-powered Framework for Summarization and Similar Cases Retrieval [2.359291431338925]
本研究は,Calcutta High Courtの判決を解析するための枠組みを提案する。
ペガサスモデルを微調整することにより、判例の要約において大幅な改善が達成される。
RAGベースのフレームワークは、ユーザクエリに応答して、同様のケースを効率的に検索し、徹底的な概要と要約を提供する。
論文 参考訳(メタデータ) (2025-06-28T20:24:34Z) - RLJP: Legal Judgment Prediction via First-Order Logic Rule-enhanced with Large Language Models [58.69183479148083]
法的判断予測(LJP)は、法的AIにおいて重要な課題である。
既存のLJPモデルは、高いパフォーマンスのために司法上の前例と法的な知識を統合している。
しかし彼らは、厳密な論理分析を必要とする法的判断の重要な要素である法的推論論理を無視している。
本稿では、一階述語論理(FOL)形式と比較学習(CL)に基づく規則強化された法的判断予測フレームワークを提案する。
論文 参考訳(メタデータ) (2025-05-27T14:50:21Z) - AppealCase: A Dataset and Benchmark for Civil Case Appeal Scenarios [47.83822985839837]
本稿では,91件の民事事件の1万対の実世界と一致した第1インスタンスと第2インスタンスの文書からなるFiceCaseデータセットを提案する。
このデータセットには、判断の逆転、逆転理由、引用された法的規定、クレームレベルの決定、第2のインスタンスに新たな情報があるかどうかという5つの側面に沿った詳細なアノテーションも含まれている。
実験結果から, すべてのモデルが判定逆転予測タスクにおいて50%未満のF1スコアを達成し, 魅力シナリオの複雑さと課題を浮き彫りにしていることがわかった。
論文 参考訳(メタデータ) (2025-05-22T10:50:33Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - Agents on the Bench: Large Language Model Based Multi Agent Framework for Trustworthy Digital Justice [0.5217870815854703]
本稿では,エージェントベンチという,大規模言語モデルに基づくマルチエージェントフレームワークを提案する。
提案手法では,複数のLCM主体のエージェントを用いて,司法機関の協調的検討と意思決定過程をシミュレートする。
我々の枠組みは、現実世界の司法プロセスをより深く反映し、正確性、公正性、社会的な考慮を向上する。
論文 参考訳(メタデータ) (2024-12-24T23:13:37Z) - LegalAgentBench: Evaluating LLM Agents in Legal Domain [53.70993264644004]
LegalAgentBenchは、中国の法律領域でLLMエージェントを評価するために特別に設計されたベンチマークである。
LegalAgentBenchには、現実世界の法的シナリオから17のコーパスが含まれており、外部知識と対話するための37のツールを提供している。
論文 参考訳(メタデータ) (2024-12-23T04:02:46Z) - AgentCourt: Simulating Court with Adversarial Evolvable Lawyer Agents [25.509677234774056]
AgentCourtは、LLMベースのエージェントの対角的進化を通じて課題に対処する包括的な法的シミュレーションフレームワークである。
1000件の民事事件をシミュレートすることにより、エージェントの法的推論能力を高める進化した知識基盤を構築する。
我々の研究は、法的なAIにおける敵対的学習の重要性を強調し、より広範な司法・規制の文脈にシミュレーションに基づく法的推論を拡張するための有望な方向性を提案する。
論文 参考訳(メタデータ) (2024-08-15T11:33:20Z) - LawLLM: Law Large Language Model for the US Legal System [43.13850456765944]
我々は,米国法域に特化して設計されたマルチタスクモデルであるLawLLM(Law Large Language Model)を紹介する。
類似症例検索(SCR)、PCR(Precedent Case Recommendation)、LJP(Lawal Judgment Prediction)においてLawLLMが優れている
そこで本研究では,各タスクに対して,生の法定データをトレーニング可能な形式に変換する,カスタマイズされたデータ前処理手法を提案する。
論文 参考訳(メタデータ) (2024-07-27T21:51:30Z) - Learning Interpretable Legal Case Retrieval via Knowledge-Guided Case Reformulation [22.85652668826498]
本稿では,大言語モデル(LLM)に基づく法的な知識誘導型事例修正手法であるKELLERを紹介する。
犯罪や法律記事に関する専門的な法的知識を取り入れることで、大規模な言語モデルにより、原訴訟を犯罪の簡潔なサブファクトに正確に修正することができる。
論文 参考訳(メタデータ) (2024-06-28T08:59:45Z) - InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。
われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。
InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文 参考訳(メタデータ) (2024-06-21T06:19:03Z) - Leveraging Large Language Models for Relevance Judgments in Legal Case Retrieval [18.058942674792604]
本稿では,訴訟の関連判断に適した新規な数ショットワークフローを提案する。
LLMと人的専門家の関連判断を比較することで,信頼性の高い関連判断が得られたことを実証的に示す。
論文 参考訳(メタデータ) (2024-03-27T09:46:56Z) - LLM vs. Lawyers: Identifying a Subset of Summary Judgments in a Large UK
Case Law Dataset [0.0]
本研究は, 英国裁判所判決の大規模コーパスから, 判例, 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、
我々は、ケンブリッジ法コーパス356,011英国の裁判所決定を用いて、大きな言語モデルは、キーワードに対して重み付けされたF1スコアが0.94対0.78であると判断する。
我々は,3,102件の要約判断事例を同定し抽出し,その分布を時間的範囲の様々な英国裁判所にマップできるようにする。
論文 参考訳(メタデータ) (2024-03-04T10:13:30Z) - Multi-Defendant Legal Judgment Prediction via Hierarchical Reasoning [49.23103067844278]
マルチディペンダント・ケースの各被告に対する判断結果を自動予測することを目的としたマルチディペンダント・LJPの課題を提案する。
マルチディペンダント LJP の課題は,(1) 各被告の識別不能な判断結果, (2) 訓練と評価のための実世界のデータセットの欠如である。
論文 参考訳(メタデータ) (2023-12-10T04:46:30Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z) - How Does NLP Benefit Legal System: A Summary of Legal Artificial
Intelligence [81.04070052740596]
法律人工知能(Legal AI)は、人工知能、特に自然言語処理の技術を適用して、法的領域におけるタスクに役立てることに焦点を当てている。
本稿では,LegalAIにおける研究の歴史,現状,今後の方向性について紹介する。
論文 参考訳(メタデータ) (2020-04-25T14:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。