論文の概要: Exploring Lightweight Large Language Models for Court View Generation
- arxiv url: http://arxiv.org/abs/2605.16770v1
- Date: Sat, 16 May 2026 02:44:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:47.014408
- Title: Exploring Lightweight Large Language Models for Court View Generation
- Title(参考訳): コートビュー生成のための軽量大言語モデルの探索
- Authors: Zhitian Hou, Tianyong Hao, Nanli Zeng, Zhixiong Chao, Kun Zeng,
- Abstract要約: 刑事裁判所ビュージェネレーション(CVG)は、法律人工知能(Legal AI)における重要な課題である
CVGにおける軽量(2B未満)大言語モデル(LLM)の機能とその電荷予測への影響について検討する。
また、CVGタスク用の3つの公開データセットを含む評価フレームワークであるCVGEvalKitを開発し、料金を予測する。
- 参考スコア(独自算出の注目度): 7.8505608893153065
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Criminal Court View Generation (CVG) is a critical task in Legal Artificial Intelligence (Legal AI), involving the generation of court view based on case facts. In this work, we systematically explore the capabilities of lightweight (smaller than 2B) large language models (LLMs) in CVG and their impact on charge prediction. Our study addresses four key questions: (1) how does different architecture of LLMs affect the CVG quality and charge prediction. (2) how does LLMs size contribute to the performance, (3) how do lightweight LLMs compare with Deep Neural Networks (DNNs) in these tasks, and (4) how does predicting charge by court view generation first compare with predicting it directly. Additionally, we also develop CVGEvalKit, an evaluation framework including three public available datasets for CVG tasks, as well as predicting their charges. Comprehensive experiments are conducted on this framework, where models are trained on a mixed training set and evaluated on each dataset's test set. Experimental results provide new insights into the trade-offs between model architecture, model size, and the influence between different tasks, highlighting the potential of lightweight LLMs in judicial AI applications. The source code is anonymously available at \url{https://github.com/ZhitianHou/CVGEvalKit}
- Abstract(参考訳): 刑事裁判所ビュー生成(英語: Criminal Court View Generation、CVG)は、法律人工知能(Legal AI)において重要な課題であり、事件事実に基づく裁判所ビューの生成を含む。
本研究では,CVGにおける軽量(2B未満)大言語モデル(LLM)の機能とその電荷予測への影響を系統的に検討する。
本研究は,LLMの異なるアーキテクチャがCVGの品質と電荷予測にどのように影響を与えるか,という4つの重要な疑問に対処する。
2) LLM のサイズはパフォーマンスにどのように貢献するか,(3) 軽量 LLM はこれらのタスクにおいてディープニューラルネットワーク (DNN) とどのように比較するか,(4) コートビュー生成による電荷の予測は直接予測と比較するか,などである。
また、CVGタスク用の3つの公開データセットを含む評価フレームワークであるCVGEvalKitを開発し、料金を予測する。
このフレームワークでは、モデルを混合トレーニングセットでトレーニングし、各データセットのテストセットで評価する。
実験結果は、モデルアーキテクチャ間のトレードオフ、モデルサイズ、異なるタスク間の影響に関する新たな洞察を与え、司法AIアプリケーションにおける軽量LLMの可能性を強調します。
ソースコードは匿名で \url{https://github.com/ZhitianHou/CVGEvalKit} で入手できる。
関連論文リスト
- Predicting Language Models' Success at Zero-Shot Probabilistic Prediction [23.802154124780376]
個人レベルの特徴を生成するためのゼロショットモデルとして,大規模言語モデル(LLM)の能力について検討する。
LLMのパフォーマンスは、同じデータセット内のタスクと異なるデータセットの両方で非常に可変であることがわかった。
タスクレベルでのLLMのパフォーマンスを予測するためのメトリクスを構築し、LLMがうまく機能する可能性のあるタスクと、それらが適さない可能性のあるタスクを区別することを目的としている。
論文 参考訳(メタデータ) (2025-09-18T18:57:05Z) - VHELM: A Holistic Evaluation of Vision Language Models [75.88987277686914]
視覚言語モデル(VHELM)の全体的評価について述べる。
VHELMは、視覚的知覚、知識、推論、バイアス、公平性、多言語性、堅牢性、毒性、安全性の9つの側面の1つ以上をカバーするために、さまざまなデータセットを集約する。
私たちのフレームワークは軽量で自動で、評価の実行が安価で高速に行えるように設計されています。
論文 参考訳(メタデータ) (2024-10-09T17:46:34Z) - LBC: Language-Based-Classifier for Out-Of-Variable Generalization [14.033963471962823]
大規模言語モデル(LLM)は、応答生成のような自然言語処理タスクにおいて大きな成功を収めている。
LLMの事前学習された知識により、追加のトレーニングなしでテストに現れる新しい変数を解釈できることがわかった。
本稿では,LBC(Language-Based-Classifier)を提案する。
論文 参考訳(メタデータ) (2024-08-20T15:05:02Z) - LLM-Select: Feature Selection with Large Language Models [64.5099482021597]
大規模言語モデル(LLM)は、データサイエンスの標準ツールに匹敵するパフォーマンスで、最も予測可能な機能を選択することができる。
以上の結果から,LSMはトレーニングに最適な機能を選択するだけでなく,そもそもどの機能を収集すべきかを判断する上でも有用である可能性が示唆された。
論文 参考訳(メタデータ) (2024-07-02T22:23:40Z) - Evaluating and Explaining Large Language Models for Code Using Syntactic
Structures [74.93762031957883]
本稿では,コード用大規模言語モデルに特有の説明可能性手法であるASTxplainerを紹介する。
その中核にあるASTxplainerは、トークン予測をASTノードに整合させる自動メソッドを提供する。
私たちは、最も人気のあるGitHubプロジェクトのキュレートデータセットを使用して、コード用の12の人気のあるLLMに対して、実証的な評価を行います。
論文 参考訳(メタデータ) (2023-08-07T18:50:57Z) - CodeGen2: Lessons for Training LLMs on Programming and Natural Languages [116.74407069443895]
我々はエンコーダとデコーダベースのモデルを単一のプレフィックスLMに統一する。
学習方法は,「フリーランチ」仮説の主張を考察する。
データ配信においては,混合分布と多言語学習がモデル性能に及ぼす影響について検討した。
論文 参考訳(メタデータ) (2023-05-03T17:55:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。