論文の概要: Luwen Technical Report
- arxiv url: http://arxiv.org/abs/2604.06737v1
- Date: Wed, 08 Apr 2026 06:59:07 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-09 17:30:51.37929
- Title: Luwen Technical Report
- Title(参考訳): リューエン技術報告
- Authors: Yiquan Wu, Yuhang Liu, Yifei Liu, Ang Li, Siying Zhou, Kun Kuang,
- Abstract要約: 我々は,バイチュン基礎モデルに基づいて構築された,オープンソースの中国語法定言語モデルであるLuwenを紹介する。
予測と生成の両方にまたがる5つの代表的な法的課題について,Lewenの評価を行った。
- 参考スコア(独自算出の注目度): 51.49034733167549
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large language models have demonstrated remarkable capabilities across a wide range of natural language processing tasks, yet their application in the legal domain remains challenging due to the specialized terminology, complex reasoning requirements, and rapidly evolving legal knowledge involved. In this paper, we present Luwen, an open-source Chinese legal language model built upon the Baichuan foundation model through three key techniques: continual pre-training on a large-scale legal corpus, supervised fine-tuning with carefully curated legal instruction data, and retrieval-augmented generation integrated with a comprehensive legal knowledge base. We evaluate Luwen on five representative legal tasks spanning both prediction and generation settings, including legal judgment prediction, judicial examination, legal text summarization, law article question answering, and judicial decision reasoning. Experimental results show that Luwen outperforms several strong baselines, demonstrating the effectiveness of our approach in adapting general-purpose language models to the legal domain.
- Abstract(参考訳): 大規模言語モデルは、幅広い自然言語処理タスクにおいて顕著な能力を示してきたが、専門用語、複雑な推論要求、そして急速に進化する法的知識のために、法律分野における彼らの応用は依然として困難である。
本稿では,バイチュン基礎モデルに基づいて構築されたオープンソースの中国語の言語モデルであるLuwenについて,大規模コーパスの継続事前学習,厳格にキュレートされた法的指導データによる微調整,総合的な法知識ベースと統合された検索強化世代という3つの重要な技術を用いて紹介する。
我々は,法的な判断予測,司法審査,法的テキスト要約,法的記事質問応答,司法決定推論など,予測と世代設定にまたがる5つの代表的な法的課題について,Lewenの評価を行った。
実験結果から,Luwenは法域に汎用言語モデルを適用する際のアプローチの有効性を示した。
関連論文リスト
- LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [54.57434222018289]
我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。
LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。
LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文 参考訳(メタデータ) (2026-01-31T10:18:32Z) - ReGal: A First Look at PPO-based Legal AI for Judgment Prediction and Summarization in India [10.522785783474857]
本稿では,Reinforcement Learning-based Legal Reasoning(ReGal)を紹介する。
本手法は, (i) 裁判所判断予測・説明(CJPE) と (ii) 法的文書要約の2つの重要な法的課題にまたがって評価される。
論文 参考訳(メタデータ) (2025-12-19T19:13:41Z) - ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation [56.79698529022327]
法的な主張は、事件における原告の要求を言及し、法的理由づけと事件解決を導くのに不可欠である。
本稿では,その事例の事実に基づく法的クレーム生成の問題について考察する。
われわれは,中国法定クレーム生成タスクの最初のデータセットであるClaymGen-CNを構築した。
論文 参考訳(メタデータ) (2025-08-24T07:19:25Z) - GLARE: Agentic Reasoning for Legal Judgment Prediction [60.13483016810707]
法学分野では、法的判断予測(LJP)がますます重要になっている。
既存の大規模言語モデル (LLM) には、法的な知識が不足しているため、推論に不十分な重大な問題がある。
GLAREは,異なるモジュールを呼び出し,重要な法的知識を動的に獲得するエージェント的法的推論フレームワークである。
論文 参考訳(メタデータ) (2025-08-22T13:38:12Z) - Legal Evalutions and Challenges of Large Language Models [42.51294752406578]
我々は,OPENAI o1モデルを事例研究として,法律規定の適用における大規模モデルの性能評価に利用した。
我々は、オープンソース、クローズドソース、および法律ドメインのために特別に訓練された法律固有のモデルを含む、最先端のLLMを比較します。
論文 参考訳(メタデータ) (2024-11-15T12:23:12Z) - Natural Language Processing for the Legal Domain: A Survey of Tasks, Datasets, Models, and Challenges [7.767611860493713]
本調査は,手動フィルタリング後の131項目を最終選択した154の研究をレビューし,システムレビューおよびメタ分析フレームワークの優先報告項目に従う。
法律分野におけるNLPに関する基礎概念を探求し、法律文書の処理の独特な側面と課題を詳述する。
本稿では, 文書要約, エンティティ認識, 質問回答, 議論マイニング, テキスト分類, 判断予測など, 法的テキストに特有のNLPタスクの概要について述べる。
論文 参考訳(メタデータ) (2024-10-25T01:17:02Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。