論文の概要: LegalOne: A Family of Foundation Models for Reliable Legal Reasoning
- arxiv url: http://arxiv.org/abs/2602.00642v2
- Date: Tue, 03 Feb 2026 14:54:35 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 16:18:58.832731
- Title: LegalOne: A Family of Foundation Models for Reliable Legal Reasoning
- Title(参考訳): LegalOne: 信頼性の高い法的推論のための基礎モデルファミリー
- Authors: Haitao Li, Yifan Chen, Shuo Miao, Qian Dong, Jia Chen, Yiran Hu, Junjie Chen, Minghao Qin, Yueyue Wu, Yujia Zhou, Qingyao Ai, Yiqun Liu, Cheng Luo, Quan Zhou, Ya Zhang, Jikun Hu,
- Abstract要約: 我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。
LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。
LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
- 参考スコア(独自算出の注目度): 54.57434222018289
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: While Large Language Models (LLMs) have demonstrated impressive general capabilities, their direct application in the legal domain is often hindered by a lack of precise domain knowledge and complexity of performing rigorous multi-step judicial reasoning. To address this gap, we present LegalOne, a family of foundational models specifically tailored for the Chinese legal domain. LegalOne is developed through a comprehensive three-phase pipeline designed to master legal reasoning. First, during mid-training phase, we propose Plasticity-Adjusted Sampling (PAS) to address the challenge of domain adaptation. This perplexity-based scheduler strikes a balance between the acquisition of new knowledge and the retention of original capabilities, effectively establishing a robust legal foundation. Second, during supervised fine-tuning, we employ Legal Agentic CoT Distillation (LEAD) to distill explicit reasoning from raw legal texts. Unlike naive distillation, LEAD utilizes an agentic workflow to convert complex judicial processes into structured reasoning trajectories, thereby enforcing factual grounding and logical rigor. Finally, we implement a Curriculum Reinforcement Learning (RL) strategy. Through a progressive reinforcement process spanning memorization, understanding, and reasoning, LegalOne evolves from simple pattern matching to autonomous and reliable legal reasoning. Experimental results demonstrate that LegalOne achieves state-of-the-art performance across a wide range of legal tasks, surpassing general-purpose LLMs with vastly larger parameter counts through enhanced knowledge density and efficiency. We publicly release the LegalOne weights and the LegalKit evaluation framework to advance the field of Legal AI, paving the way for deploying trustworthy and interpretable foundation models in high-stakes judicial applications.
- Abstract(参考訳): LLM(Large Language Models)は印象的な汎用機能を示しているが、法域での直接的な適用は、正確なドメイン知識の欠如と厳密な多段階の司法推論を実行する複雑さによって妨げられていることが多い。
このギャップに対処するため、我々は中国の法律ドメインに特化した基礎モデルのファミリーであるLegalOneを紹介します。
LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。
まず, 学習中段階において, ドメイン適応の課題に対処するために, 塑性調整サンプリング(PAS)を提案する。
この難易度に基づくスケジューラは、新しい知識の獲得と元の能力の維持のバランスをとっており、事実上堅牢な法的基盤を確立している。
第2に, 監督微調整中に, 生法文書から明確な推論を抽出するために, 法定剤CoT蒸留法(LEAD)を用いた。
ナイーブ蒸留とは異なり、LEADは複雑な司法手続きを構造化された推論軌道に変換し、事実的根拠と論理的厳密さを強制するエージェントワークフローを利用する。
最後に,カリキュラム強化学習(RL)戦略を実装した。
記憶、理解、推論にまたがる進歩的な強化プロセスを通じて、LegalOneは単純なパターンマッチングから自律的で信頼できる法的推論へと進化する。
実験結果から,LegalOneは,知識密度と効率性の向上を通じて,パラメータ数が非常に大きい汎用LLMを超越して,多種多様な法的タスクにおける最先端性能を実現していることが示された。
LegalOneの重みとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させ、信頼性の高い、解釈可能な基礎モデルを高度な司法アプリケーションに展開する道を開いた。
関連論文リスト
- PLawBench: A Rubric-Based Benchmark for Evaluating LLMs in Real-World Legal Practice [67.71760070255425]
本稿では,大規模言語モデル (LLM) を評価するための実践的ベンチマークであるPLawBenchを紹介する。
PLawBenchは、13の実践的な法的シナリオにわたる850の質問で構成され、各質問には専門家が設計した評価ルーブが伴っている。
人間の専門的判断に合わせたLLMに基づく評価器を用いて,10種類の最先端のLLMを評価した。
論文 参考訳(メタデータ) (2026-01-23T11:36:10Z) - ReGal: A First Look at PPO-based Legal AI for Judgment Prediction and Summarization in India [10.522785783474857]
本稿では,Reinforcement Learning-based Legal Reasoning(ReGal)を紹介する。
本手法は, (i) 裁判所判断予測・説明(CJPE) と (ii) 法的文書要約の2つの重要な法的課題にまたがって評価される。
論文 参考訳(メタデータ) (2025-12-19T19:13:41Z) - Judicial Requirements for Generative AI in Legal Reasoning [0.0]
大規模言語モデル(LLM)はプロのドメインに統合されているが、法律のような高度な分野における制限は理解されていない。
本稿では、AIシステムが司法判断における信頼性の高い推論ツールとして機能しなければならない中核機能について述べる。
論文 参考訳(メタデータ) (2025-08-26T09:56:26Z) - ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation [56.79698529022327]
法的な主張は、事件における原告の要求を言及し、法的理由づけと事件解決を導くのに不可欠である。
本稿では,その事例の事実に基づく法的クレーム生成の問題について考察する。
われわれは,中国法定クレーム生成タスクの最初のデータセットであるClaymGen-CNを構築した。
論文 参考訳(メタデータ) (2025-08-24T07:19:25Z) - GLARE: Agentic Reasoning for Legal Judgment Prediction [60.13483016810707]
法学分野では、法的判断予測(LJP)がますます重要になっている。
既存の大規模言語モデル (LLM) には、法的な知識が不足しているため、推論に不十分な重大な問題がある。
GLAREは,異なるモジュールを呼び出し,重要な法的知識を動的に獲得するエージェント的法的推論フレームワークである。
論文 参考訳(メタデータ) (2025-08-22T13:38:12Z) - Continual Pre-Training is (not) What You Need in Domain Adaption [5.64352123192466]
本稿では,法定大言語モデル(LLM)の法的推論能力向上におけるDACP(Domain-Adaptive Continual Pre-Training)の有効性について検討する。
DACPはドメイン固有の知識を高めるが、すべての法的タスクにおけるパフォーマンスを均一に改善するわけではないことを実証する。
本稿では,DACPに関わるトレードオフ,特にモデル一般化と迅速なタスクのパフォーマンスへの影響について論じ,法的なAIにおけるドメイン適応戦略を最適化するための今後の研究の方向性を提案する。
論文 参考訳(メタデータ) (2025-04-18T10:14:51Z) - Optimizing Numerical Estimation and Operational Efficiency in the Legal Domain through Large Language Models [13.067312163677933]
本稿では,Large Language Modelsと特殊設計のプロンプトを統合して,法的な人工知能(LegalAI)アプリケーションにおける精度要件に対処する手法を提案する。
本手法を検証するために,精度指向の LegalAI タスクに適したキュレートデータセットを提案する。
論文 参考訳(メタデータ) (2024-07-26T18:46:39Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。