論文の概要: ShiZhi: A Chinese Lightweight Large Language Model for Court View Generation
- arxiv url: http://arxiv.org/abs/2510.09297v1
- Date: Fri, 10 Oct 2025 11:42:17 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 00:38:48.805472
- Title: ShiZhi: A Chinese Lightweight Large Language Model for Court View Generation
- Title(参考訳): ShiZhi: コートビュー生成のための中国の軽量大言語モデル
- Authors: Zhitian Hou, Kun Zeng,
- Abstract要約: 裁判所ビュー生成に特化して設計された最初の大規模言語モデル(LLM)であるShiZhiを紹介する。
我々は,110万件以上の中国宮廷ビュー生成データセットを構築し,それぞれが対応する裁判所ビューと組み合わせた事実記述を含む。
ShiZhiは、裁判所のビュー生成で58.5 BLEU-1、充電予測で86.1%の精度で92.5%のマクロF1を達成している。
- 参考スコア(独自算出の注目度): 5.700478095524631
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Criminal Court View Generation (CVG) is a fundamental task in legal artificial intelligence, aiming to automatically generate the "Court View" section of a legal case document. Generating court views is challenging due to the diversity and complexity of case facts, and directly generating from raw facts may limit performance. In this paper, we present ShiZhi, the first large language model (LLM) specifically designed for court view generation. We construct a Chinese Court View Generation dataset, CCVG, of more than 110K cases, each containing fact descriptions paired with corresponding court views. Based on this dataset, ShiZhi achieving 58.5 BLEU-1 on court view generation and 86.1\% accuracy with 92.5\% macro F1 on charge prediction. Experimental results demonstrate that even a small LLM can generate reasonable and legally coherent court views when trained on high-quality domain-specific data. Our model and dataset are available at \href{https://github.com/ZhitianHou/ShiZhi}{https://github.com/ZhitianHou/ShiZhi}.
- Abstract(参考訳): 刑事裁判所ビュー生成(Criminal Court View Generation, CVG)は、訴訟文書の"Court View"セクションを自動生成することを目的とした、法的人工知能の基本的なタスクである。
ケースファクトの多様性と複雑さのため、裁判所の見解の生成は困難であり、生の事実から直接生成することでパフォーマンスが制限される可能性がある。
本稿では,裁判所ビュー生成に特化して設計された最初の大規模言語モデル(LLM)であるShiZhiを紹介する。
我々は,110万件以上に及ぶ中国宮廷ビュー生成データセットCCVGを構築し,それぞれが対応する裁判所ビューと組み合わせた事実記述を含む。
このデータセットに基づいて、ShiZhiは裁判所のビュー生成で58.5 BLEU-1、電荷予測で92.5\%のマクロF1で86.1\%の精度を達成した。
実験結果から,小規模のLLMであっても,高品質なドメイン固有データに基づいて訓練した場合に,合理的かつ法的に整合性のある裁判所の見解を生成できることが示唆された。
我々のモデルとデータセットは \href{https://github.com/ZhitianHou/ShiZhi}{https://github.com/ZhitianHou/ShiZhi} で利用可能です。
関連論文リスト
- ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation [56.79698529022327]
法的な主張は、事件における原告の要求を言及し、法的理由づけと事件解決を導くのに不可欠である。
本稿では,その事例の事実に基づく法的クレーム生成の問題について考察する。
われわれは,中国法定クレーム生成タスクの最初のデータセットであるClaymGen-CNを構築した。
論文 参考訳(メタデータ) (2025-08-24T07:19:25Z) - LEXam: Benchmarking Legal Reasoning on 340 Law Exams [76.3521146499006]
textscLEXamは,法科116科の法科試験を対象とする340件の法科試験を対象とする,新しいベンチマークである。
このデータセットは、英語とドイツ語で4,886の法試験質問で構成されており、その中には2,841の長文のオープンエンド質問と2,045の多重選択質問が含まれている。
この結果から,モデル間の差分化におけるデータセットの有効性が示唆された。
論文 参考訳(メタデータ) (2025-05-19T08:48:12Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - Event Grounded Criminal Court View Generation with Cooperative (Large) Language Models [12.569076604769156]
本稿では,共用(大規模)言語モデルを用いた刑事裁判所ビュー生成のためのイベントグラウンドドジェネレーション(EGG)手法を提案する。
我々はまず,大量の注釈付きイベントを伴わずに事象を抽出できるLLMに基づく抽出法を設計する。
そして,抽出した事象を事例事実と事象を融合して,裁判所ビュー生成に組み込む。
論文 参考訳(メタデータ) (2024-04-10T13:31:07Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - PARAMANU-AYN: Pretrain from scratch or Continual Pretraining of LLMs for Legal Domain Adaptation? [3.9018931027384056]
パラマヌ・アイン(Paramanu-Ayn)は、インドの訴訟文書に特化して訓練された法律言語モデルのコレクションである。
Paramanu-Aynは1つのGPU上でわずか185時間、コンテキストサイズ8192のスクラッチから事前トレーニングされた。
論文 参考訳(メタデータ) (2024-03-20T15:39:54Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model
Collaboration [52.57055162778548]
法的判断予測(LJP)は、法律AIにおいてますます重要な課題となっている。
先行は、同様の事実を持つ以前の訴訟であり、国家法制度におけるその後の事件の判断の基礎となっている。
近年のディープラーニングの進歩により、LJPタスクの解決に様々なテクニックが使えるようになった。
論文 参考訳(メタデータ) (2023-10-13T16:47:20Z) - A Multi-Task Benchmark for Korean Legal Language Understanding and
Judgement Prediction [19.89425856249463]
韓国の法律AIデータセットであるLBox Openの大規模なベンチマークについて紹介する。
この法定コーパスは150万の韓国の先例(2億6400万トークン)で構成され、そのうち過去4年間に63万の判決が下された。
2つの分類課題は事例名(10k)と個々の事例の事実記述による法令(3k)の予測である。
LJP タスクは,(1) 1k 件の犯罪事例からなり,そのモデルに詳細な量の予測,労働への投獄,及び与えられた事実に対する労働範囲のない投獄が求められる。
論文 参考訳(メタデータ) (2022-06-10T16:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。