論文の概要: LegalMidm: Use-Case-Driven Legal Domain Specialization for Korean Large Language Model
- arxiv url: http://arxiv.org/abs/2604.25297v1
- Date: Tue, 28 Apr 2026 07:07:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.747884
- Title: LegalMidm: Use-Case-Driven Legal Domain Specialization for Korean Large Language Model
- Title(参考訳): LegalMidm:韓国の大規模言語モデルのためのユースケース駆動型法律ドメインスペシャライゼーション
- Authors: Youngjoon Jang, Chanhee Park, Hyeonseok Moon, Young-kyoung Ham, Jiwon Moon, Jinhyeon Kim, JuKyung Jung, Heuiseok Lim,
- Abstract要約: 高品質でユースケース駆動の法定データセットと最適化されたトレーニングパイプラインを構築するための方法論を提案する。
弊社のアプローチでは、法律専門家とのコラボレーションと厳格なデータキュレーションにより、関連性と事実の正確性を確保する。
- 参考スコア(独自算出の注目度): 22.5210475970878
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, the rapid proliferation of open-source large language models (LLMs) has spurred efforts to turn general-purpose models into domain specialists. However, many domain-specialized LLMs are developed using datasets and training protocols that are not aligned with the nuanced requirements of real-world applications. In the legal domain, where precision and reliability are essential, this lack of consideration limits practical utility. In this study, we propose a systematic training framework grounded in the practical needs of the legal domain, with a focus on Korean law. We introduce LegalMidm, a Korean legal-domain LLM, and present a methodology for constructing high-quality, use-case-driven legal datasets and optimized training pipelines. Our approach emphasizes collaboration with legal professionals and rigorous data curation to ensure relevance and factual accuracy, and demonstrates effectiveness in key legal tasks.
- Abstract(参考訳): 近年,オープンソースの大規模言語モデル(LLM)の急速な普及により,汎用モデルをドメインスペシャリストに転換する取り組みが活発化している。
しかし、多くのドメイン特化LDMは、現実のアプリケーションのニュアンス要件に合致しないデータセットとトレーニングプロトコルを使用して開発されている。
精度と信頼性が不可欠である法的領域では、この考慮の欠如は実用性を制限している。
本研究では,韓国の法律に焦点をあてて,法律領域の実践的ニーズに基づく体系的な訓練枠組みを提案する。
韓国の法律ドメイン LLM である LegalMidm を紹介し,高品質でユースケース駆動の法定データセットを構築するための方法論と,最適化されたトレーニングパイプラインを提案する。
弊社のアプローチは、法律専門家と厳密なデータキュレーションを併用して、関連性と事実の正確性を確保し、重要な法的タスクにおける有効性を実証するものである。
関連論文リスト
- PoliLegalLM: A Technical Report on a Large Language Model for Political and Legal Affairs [42.80108620217788]
PoliLegalLMは、政治的および法的応用に適したドメイン固有の大規模言語モデルである。
我々は、大規模で高品質な法定コーパスを構築し、構造化後学習パイプラインを設計する。
我々は、LawBench、LexEval、および実世界のデータセットPoliLegalを含む3つの代表的なベンチマークでPoliLegalLMを評価した。
論文 参考訳(メタデータ) (2026-04-19T17:06:56Z) - WisdomInterrogatory (LuWen): An Open-Source Legal Large Language Model Technical Report [55.27414605169639]
Wesdom Interrogatory (LuWen)は,バイチュン基礎モデルに基づいて構築された,オープンソースの中国語の法律モデルである。
予測と生成の両方にまたがる5つの代表的な法的課題についてLuWenを評価する。
論文 参考訳(メタデータ) (2026-04-08T06:59:07Z) - LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [54.57434222018289]
我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。
LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。
LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文 参考訳(メタデータ) (2026-01-31T10:18:32Z) - PLawBench: A Rubric-Based Benchmark for Evaluating LLMs in Real-World Legal Practice [67.71760070255425]
本稿では,大規模言語モデル (LLM) を評価するための実践的ベンチマークであるPLawBenchを紹介する。
PLawBenchは、13の実践的な法的シナリオにわたる850の質問で構成され、各質問には専門家が設計した評価ルーブが伴っている。
人間の専門的判断に合わせたLLMに基づく評価器を用いて,10種類の最先端のLLMを評価した。
論文 参考訳(メタデータ) (2026-01-23T11:36:10Z) - Optimizing Numerical Estimation and Operational Efficiency in the Legal Domain through Large Language Models [13.067312163677933]
本稿では,Large Language Modelsと特殊設計のプロンプトを統合して,法的な人工知能(LegalAI)アプリケーションにおける精度要件に対処する手法を提案する。
本手法を検証するために,精度指向の LegalAI タスクに適したキュレートデータセットを提案する。
論文 参考訳(メタデータ) (2024-07-26T18:46:39Z) - InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。
われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。
InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文 参考訳(メタデータ) (2024-06-21T06:19:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。