論文の概要: Automatic Information Extraction From Employment Tribunal Judgements Using Large Language Models
- arxiv url: http://arxiv.org/abs/2403.12936v1
- Date: Tue, 19 Mar 2024 17:43:08 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-20 13:14:11.359200
- Title: Automatic Information Extraction From Employment Tribunal Judgements Using Large Language Models
- Title(参考訳): 大規模言語モデルを用いた雇用裁判からの自動情報抽出
- Authors: Joana Ribeiro de Faria, Huiyuan Xie, Felix Steffek,
- Abstract要約: 本稿では,大規模言語モデルであるGPT-4の英国雇用裁判所事件からの自動情報抽出への応用について述べる。
手動検証プロセスを用いて臨界情報を抽出する際のGPT-4の性能を慎重に評価した。
- 参考スコア(独自算出の注目度): 0.4810407297181484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Court transcripts and judgments are rich repositories of legal knowledge, detailing the intricacies of cases and the rationale behind judicial decisions. The extraction of key information from these documents provides a concise overview of a case, crucial for both legal experts and the public. With the advent of large language models (LLMs), automatic information extraction has become increasingly feasible and efficient. This paper presents a comprehensive study on the application of GPT-4, a large language model, for automatic information extraction from UK Employment Tribunal (UKET) cases. We meticulously evaluated GPT-4's performance in extracting critical information with a manual verification process to ensure the accuracy and relevance of the extracted data. Our research is structured around two primary extraction tasks: the first involves a general extraction of eight key aspects that hold significance for both legal specialists and the general public, including the facts of the case, the claims made, references to legal statutes, references to precedents, general case outcomes and corresponding labels, detailed order and remedies and reasons for the decision. The second task is more focused, aimed at analysing three of those extracted features, namely facts, claims and outcomes, in order to facilitate the development of a tool capable of predicting the outcome of employment law disputes. Through our analysis, we demonstrate that LLMs like GPT-4 can obtain high accuracy in legal information extraction, highlighting the potential of LLMs in revolutionising the way legal information is processed and utilised, offering significant implications for legal research and practice.
- Abstract(参考訳): 裁判所の書き起こしと判断は、訴訟の複雑さと司法決定の背後にある根拠を詳述した豊富な法的知識の蓄積である。
これらの文書から重要な情報を抽出することは、法的専門家と公衆の両方にとって不可欠な事件の簡潔な概要を提供する。
大規模言語モデル(LLM)の出現に伴い、自動情報抽出はますます実現可能で効率的になっている。
本稿では,英国雇用裁判所(UKET)の事例から,大規模言語モデルであるGPT-4を自動抽出するための総合的研究について述べる。
我々は,手動検証プロセスを用いて重要な情報を抽出する際のGPT-4の性能を慎重に評価し,抽出したデータの正確さと妥当性を確かめた。
本研究は, 法律専門家と一般市民の双方にとって重要な8つの重要な側面を総合的に抽出し, 訴訟の事実, 主張, 法律規程への言及, 前例への言及, 一般事例の成果, 対応するラベルへの言及, 決定の詳細な順序と修正, 理由について考察する。
第2の課題は、雇用法論争の結果を予測するツールの開発を促進するために、抽出された3つの特徴、すなわち事実、クレーム、成果を分析することを目的としている。
本分析により, GPT-4 などの LLM が法的な情報抽出において高い精度が得られることを示すとともに, 法的な情報の処理・活用方法の革新における LLM の可能性を強調し, 法的な研究・実践に重大な影響を及ぼすことを示した。
関連論文リスト
- JudgeRank: Leveraging Large Language Models for Reasoning-Intensive Reranking [81.88787401178378]
本稿では,文書関連性を評価する際に,人間の認知過程をエミュレートする新しいエージェント・リランカであるJiceRankを紹介する。
我々は,推論集約型BRIGHTベンチマークを用いて判定Rankを評価し,第1段階の検索手法よりも性能が大幅に向上したことを示す。
さらに、JiceRankは、人気の高いBEIRベンチマークの細調整された最先端リランカと同等に動作し、ゼロショットの一般化能力を検証している。
論文 参考訳(メタデータ) (2024-10-31T18:43:12Z) - Learning Interpretable Legal Case Retrieval via Knowledge-Guided Case Reformulation [22.85652668826498]
本稿では,大言語モデル(LLM)に基づく法的な知識誘導型事例修正手法であるKELLERを紹介する。
犯罪や法律記事に関する専門的な法的知識を取り入れることで、大規模な言語モデルにより、原訴訟を犯罪の簡潔なサブファクトに正確に修正することができる。
論文 参考訳(メタデータ) (2024-06-28T08:59:45Z) - InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。
われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。
InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文 参考訳(メタデータ) (2024-06-21T06:19:03Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - Leveraging Large Language Models for Relevance Judgments in Legal Case Retrieval [18.058942674792604]
本稿では,訴訟の関連判断に適した新規な数ショットワークフローを提案する。
LLMと人的専門家の関連判断を比較することで,信頼性の高い関連判断が得られたことを実証的に示す。
論文 参考訳(メタデータ) (2024-03-27T09:46:56Z) - Low-Resource Court Judgment Summarization for Common Law Systems [32.13166048504629]
CLSumは,多審理法裁判所判決文書を要約する最初のデータセットである。
これは、データ拡張、要約生成、評価において、大規模言語モデル(LLM)を採用する最初の裁判所判決要約作業である。
論文 参考訳(メタデータ) (2024-03-07T12:47:42Z) - LLM vs. Lawyers: Identifying a Subset of Summary Judgments in a Large UK
Case Law Dataset [0.0]
本研究は, 英国裁判所判決の大規模コーパスから, 判例, 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、 判例、
我々は、ケンブリッジ法コーパス356,011英国の裁判所決定を用いて、大きな言語モデルは、キーワードに対して重み付けされたF1スコアが0.94対0.78であると判断する。
我々は,3,102件の要約判断事例を同定し抽出し,その分布を時間的範囲の様々な英国裁判所にマップできるようにする。
論文 参考訳(メタデータ) (2024-03-04T10:13:30Z) - Legal Summarisation through LLMs: The PRODIGIT Project [4.840725842638346]
PRODIGITは、AIに焦点を当てたデジタル技術を通じて、税務判事や弁護士を支援することを目的としている。
我々は、司法決定の要約の作成と関連する情報の抽出に焦点を合わせてきた。
我々は,抽出的,抽象的要約のための様々なツールとアプローチをデプロイし,評価した。
論文 参考訳(メタデータ) (2023-08-04T16:59:48Z) - Leveraging Large Language Models for Topic Classification in the Domain
of Public Affairs [65.9077733300329]
大規模言語モデル (LLM) は公務員文書の分析を大幅に強化する可能性を秘めている。
LLMは、公共の分野など、ドメイン固有のドキュメントを処理するのに非常に役立ちます。
論文 参考訳(メタデータ) (2023-06-05T13:35:01Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - A Survey on Legal Judgment Prediction: Datasets, Metrics, Models and
Challenges [73.34944216896837]
法定判断予測(LJP)は,事実記述に基づく判断結果の自動予測に自然言語処理(NLP)技術を適用している。
6言語で31のLJPデータセットを分析し、その構築過程を示し、LJPの分類方法を定義する。
異なる訴訟の8つの代表的データセットに対する最先端の結果を示し、オープンな課題について議論する。
論文 参考訳(メタデータ) (2022-04-11T04:06:28Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。