Fugu-MT 論文翻訳(概要): Understand Legal Documents with Contextualized Large Language Models

論文の概要: Understand Legal Documents with Contextualized Large Language Models

arxiv url: http://arxiv.org/abs/2303.12135v1
Date: Tue, 21 Mar 2023 18:48:11 GMT
ステータス: 翻訳完了
システム内更新日: 2023-03-23 16:26:15.594972
Title: Understand Legal Documents with Contextualized Large Language Models
Title（参考訳）: 文脈付き大規模言語モデルによる法的文書の理解
Authors: Xin Jin, Yuchen Wang
Abstract要約: 本稿では,SemEval-2023タスク6について,法的テキストの理解について述べる。我々はまず,文内および文間両方の包括的文脈情報を考慮した法-BERT-HSLNモデルを開発した。次に、法的なエンティティを認識するために、法的なコンテキスト化とエンティティ認識を備えた法的なLUKEモデルをトレーニングする。
参考スコア（独自算出の注目度）: 16.416510744265086
License: http://creativecommons.org/licenses/by/4.0/
Abstract: The growth of pending legal cases in populous countries, such as India, has become a major issue. Developing effective techniques to process and understand legal documents is extremely useful in resolving this problem. In this paper, we present our systems for SemEval-2023 Task 6: understanding legal texts (Modi et al., 2023). Specifically, we first develop the Legal-BERT-HSLN model that considers the comprehensive context information in both intra- and inter-sentence levels to predict rhetorical roles (subtask A) and then train a Legal-LUKE model, which is legal-contextualized and entity-aware, to recognize legal entities (subtask B). Our evaluations demonstrate that our designed models are more accurate than baselines, e.g., with an up to 15.0% better F1 score in subtask B. We achieved notable performance in the task leaderboard, e.g., 0.834 micro F1 score, and ranked No.5 out of 27 teams in subtask A.
Abstract（参考訳）: インドなど、人口の多い国における未解決の訴訟の成長は大きな問題となっている。法律文書の処理・理解に有効な手法を開発することは,この問題の解決に極めて有用である。本稿では,SemEval-2023タスク6における法文理解システムについて述べる(Modi et al., 2023)。具体的には、まず、文内と文間の両方の包括的文脈情報を考察し、修辞的役割(サブタスクA)を予測する法-BERT-HSLNモデルを開発し、法-コンテキスト化およびエンティティ認識の法-LUKEモデルを訓練し、法的実体(サブタスクB)を認識する。私たちの設計モデルはベースラインよりも正確であること,例えばサブタスクBでは15.0%,タスクリーダボードでは0.834マイクロF1スコア,サブタスクAでは27チーム中5位など,優れたパフォーマンスを実現しています。

関連論文リスト

LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [54.57434222018289]
我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。 LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。 LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文参考訳（メタデータ） (2026-01-31T10:18:32Z)
ReGal: A First Look at PPO-based Legal AI for Judgment Prediction and Summarization in India [10.522785783474857]
本稿では,Reinforcement Learning-based Legal Reasoning(ReGal)を紹介する。本手法は, (i) 裁判所判断予測・説明(CJPE) と (ii) 法的文書要約の2つの重要な法的課題にまたがって評価される。
論文参考訳（メタデータ） (2025-12-19T19:13:41Z)
ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation [56.79698529022327]
法的な主張は、事件における原告の要求を言及し、法的理由づけと事件解決を導くのに不可欠である。本稿では,その事例の事実に基づく法的クレーム生成の問題について考察する。われわれは,中国法定クレーム生成タスクの最初のデータセットであるClaymGen-CNを構築した。
論文参考訳（メタデータ） (2025-08-24T07:19:25Z)
LegalSeg: Unlocking the Structure of Indian Legal Judgments Through Rhetorical Role Classification [6.549338652948716]
7000以上の文書と140万の文で構成され、7つの修辞的な役割をラベル付けした、このタスクのための最大の注釈付きデータセットであるLegalSegを紹介します。以上の結果から,より広義の文脈,構造的関係,逐次的な文情報を含むモデルが,文レベルの特徴にのみ依存するモデルよりも優れていることが示された。
論文参考訳（メタデータ） (2025-02-09T10:07:05Z)
LawLLM: Law Large Language Model for the US Legal System [43.13850456765944]
我々は,米国法域に特化して設計されたマルチタスクモデルであるLawLLM(Law Large Language Model)を紹介する。類似症例検索(SCR)、PCR(Precedent Case Recommendation)、LJP(Lawal Judgment Prediction)においてLawLLMが優れているそこで本研究では,各タスクに対して,生の法定データをトレーニング可能な形式に変換する,カスタマイズされたデータ前処理手法を提案する。
論文参考訳（メタデータ） (2024-07-27T21:51:30Z)
InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。 InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文参考訳（メタデータ） (2024-06-21T06:19:03Z)
LawInstruct: A Resource for Studying Language Model Adaptation to the Legal Domain [47.001169623840354]
58の注釈付き法律データセットを集約し、それぞれに命令を書き、LawInstructを作成します。ローインストラクチャーは17の国際司法管轄区域、24の言語、および法的QA、訴訟の要約、法的議論のマイニングなど様々なタスクにまたがる1200万の事例をカバーしている。 Flan-T5(FLawN-T5)の法的な命令チューニングは、すべてのモデルサイズでLegalBenchのパフォーマンスを向上させる。
論文参考訳（メタデータ） (2024-04-02T17:33:34Z)
DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-03-27T10:40:14Z)
Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model Collaboration [52.57055162778548]
法的判断予測(LJP)は、法律AIにおいてますます重要な課題となっている。先行は、同様の事実を持つ以前の訴訟であり、国家法制度におけるその後の事件の判断の基礎となっている。近年のディープラーニングの進歩により、LJPタスクの解決に様々なテクニックが使えるようになった。
論文参考訳（メタデータ） (2023-10-13T16:47:20Z)
NeCo@ALQAC 2023: Legal Domain Knowledge Acquisition for Low-Resource Languages through Data Enrichment [2.441072488254427]
本稿では,ベトナムのテキスト処理タスクに対するNeCo Teamのソリューションを,ALQAC 2023(Automated Legal Question Answering Competition 2023)で紹介する。法的な文書検索タスクでは,類似度ランキングと深層学習モデルを組み合わせた手法が採用されているが,第2の課題では,異なる質問タイプを扱うための適応的手法が提案されている。提案手法は, 競争の両課題において, 法的分野における質問応答システムの潜在的メリットと有効性を示す, 卓越した結果を達成している。
論文参考訳（メタデータ） (2023-09-11T14:43:45Z)
NOWJ at COLIEE 2023 -- Multi-Task and Ensemble Approaches in Legal Information Processing [1.5593460008414899]
我々は,法情報処理技術の進歩に焦点を当てたCOLIEE 2023コンペティションへのNOWJチームのアプローチを提示する。我々は、最先端の機械学習モデルとBERT、Longformer、BM25級アルゴリズム、マルチタスク学習モデルといった革新的なアプローチを採用している。
論文参考訳（メタデータ） (2023-06-08T03:10:49Z)
THUIR@COLIEE 2023: Incorporating Structural Knowledge into Pre-trained Language Models for Legal Case Retrieval [16.191450092389722]
本稿では,COLIEE 2023におけるチャンピオンシップチームTHUIRのアプローチを要約する。具体的には,訴訟の理解を深めるために,構造化された事前学習言語モデルを設計する。最終的に、異なる次元の機能をマージするために、学習とランクの手法が使用される。
論文参考訳（メタデータ） (2023-05-11T14:08:53Z)
SAILER: Structure-aware Pre-trained Language Model for Legal Case Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文参考訳（メタデータ） (2023-04-22T10:47:01Z)
SemEval 2023 Task 6: LegalEval - Understanding Legal Texts [2.172613863157655]
法律文書の処理と自動理解のためのNLPベースの技術を開発する必要がある。 Task-A (Rhetorical Roles Labeling) は、法的文書を意味的に一貫性のある単位に自動的に構造化することを目的としており、Task-B (Legal Named Entity Recognition) は、法的文書内の関連エンティティを識別する、Task-C (Court Judgement Prediction with Explanation) は、訴訟の結果を自動的に予測する可能性を探る。それぞれのサブタスクにおいて、提案されたシステムはベースラインよりも優れているが、多くのスコープがある。
論文参考訳（メタデータ） (2023-04-19T10:28:32Z)
Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文参考訳（メタデータ） (2021-05-09T09:39:25Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。