論文の概要: IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoning
- arxiv url: http://arxiv.org/abs/2407.05399v1
- Date: Sun, 7 Jul 2024 14:55:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-09 19:47:49.321245
- Title: IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoning
- Title(参考訳): IL-TUR:インドの法律文理解と推論のためのベンチマーク
- Authors: Abhinav Joshi, Shounak Paul, Akshat Sharma, Pawan Goyal, Saptarshi Ghosh, Ashutosh Modi,
- Abstract要約: 世界中の法制度は、事例や文書の指数的な増加と共に浸水している。
法律文書を自動的に処理し理解するためのNLPおよびML技術を開発する必要がある。
本稿では, IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoningを提案する。
- 参考スコア(独自算出の注目度): 16.12863746776168
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Legal systems worldwide are inundated with exponential growth in cases and documents. There is an imminent need to develop NLP and ML techniques for automatically processing and understanding legal documents to streamline the legal system. However, evaluating and comparing various NLP models designed specifically for the legal domain is challenging. This paper addresses this challenge by proposing IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoning. IL-TUR contains monolingual (English, Hindi) and multi-lingual (9 Indian languages) domain-specific tasks that address different aspects of the legal system from the point of view of understanding and reasoning over Indian legal documents. We present baseline models (including LLM-based) for each task, outlining the gap between models and the ground truth. To foster further research in the legal domain, we create a leaderboard (available at: https://exploration-lab.github.io/IL-TUR/) where the research community can upload and compare legal text understanding systems.
- Abstract(参考訳): 世界中の法制度は、事例や文書の指数的な増加と共に浸水している。
法体系を合理化するためには、法律文書を自動的に処理し、理解するためのNLPおよびML技術を開発する必要がある。
しかし、法域に特化して設計された様々なNLPモデルの評価と比較は困難である。
本稿では, IL-TUR: Benchmark for Indian Legal Text Understanding and Reasoningを提案する。
IL-TURには、モノリンガル(英語、ヒンディー語)と多言語(インド語)のドメイン固有のタスクが含まれており、インドの法律文書に対する理解と推論の観点から、法体系の異なる側面に対処している。
各タスクのベースラインモデル(LLMベースを含む)を提示し、モデルと基礎的真理のギャップを概説する。
法律分野におけるさらなる研究を促進するために、研究コミュニティが法的テキスト理解システムをアップロードして比較できるリーダーボード(https://exploration-lab.github.io/IL-TUR/)を作成します。
関連論文リスト
- InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。
われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。
InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文 参考訳(メタデータ) (2024-06-21T06:19:03Z) - PARAMANU-AYN: An Efficient Novel Generative and Instruction-tuned Language Model for Indian Legal Case Documents [3.9018931027384056]
パラマヌ・アイン(Paramanu-Ayn)は、インド最高裁判所、インド憲法、インド刑法典の事例文書にのみ基づく言語モデルである。
我々のモデルはCPU上で動作し、42.46トークン/秒のCPU推論速度を達成した。
論文 参考訳(メタデータ) (2024-03-20T15:39:54Z) - Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model
Collaboration [52.57055162778548]
法的判断予測(LJP)は、法律AIにおいてますます重要な課題となっている。
先行は、同様の事実を持つ以前の訴訟であり、国家法制度におけるその後の事件の判断の基礎となっている。
近年のディープラーニングの進歩により、LJPタスクの解決に様々なテクニックが使えるようになった。
論文 参考訳(メタデータ) (2023-10-13T16:47:20Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - An Inclusive Notion of Text [69.36678873492373]
テキストの概念の明確さは再現可能で一般化可能なNLPにとって不可欠である,と我々は主張する。
言語的および非言語的要素の2層分類を導入し,NLPモデリングに使用することができる。
論文 参考訳(メタデータ) (2022-11-10T14:26:43Z) - Pre-trained Language Models for the Legal Domain: A Case Study on Indian
Law [7.366081387295463]
私たちは、インドの法律データに基づいて、人気のある2つの法的PLM(LegalBERTとCaseLawBERT)を再訓練し、インドの法文に基づく語彙でモデルをゼロからトレーニングします。
我々は,新たなドメイン(インド文)の性能向上だけでなく,原ドメイン(ヨーロッパ文,イギリス文)の性能向上にも留意する。
論文 参考訳(メタデータ) (2022-09-13T15:01:11Z) - Indian Legal Text Summarization: A Text Normalisation-based Approach [0.0]
インドの裁判所制度には4つ以上のクロア事件がある。
テキスト要約のための多くの最先端モデルが、機械学習が進むにつれて登場した。
ドメインに依存しないモデルは、法的テキストではうまくいきません。
著者らは、インドの文脈で法的テキストを正規化するための方法論を提案している。
論文 参考訳(メタデータ) (2022-06-13T15:16:50Z) - Indian Legal NLP Benchmarks : A Survey [0.0]
インド法典テキストのために、別々に自然言語処理ベンチマークを作成する必要がある。
これは、インドの法律テキストに対する自然言語処理の応用の革新を刺激する。
論文 参考訳(メタデータ) (2021-07-13T13:10:10Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z) - A Dataset for Statutory Reasoning in Tax Law Entailment and Question
Answering [37.66486350122862]
本稿では,法定推論における自然言語理解手法の性能について検討する。
我々は、法的ドメインのテキストコーパスとともにデータセットを導入する。
タスクを完全に解くように設計された手作りPrologベースのシステムと対比する。
論文 参考訳(メタデータ) (2020-05-11T16:54:42Z) - How Does NLP Benefit Legal System: A Summary of Legal Artificial
Intelligence [81.04070052740596]
法律人工知能(Legal AI)は、人工知能、特に自然言語処理の技術を適用して、法的領域におけるタスクに役立てることに焦点を当てている。
本稿では,LegalAIにおける研究の歴史,現状,今後の方向性について紹介する。
論文 参考訳(メタデータ) (2020-04-25T14:45:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。