論文の概要: LexGLUE: A Benchmark Dataset for Legal Language Understanding in English
- arxiv url: http://arxiv.org/abs/2110.00976v1
- Date: Sun, 3 Oct 2021 10:50:51 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-06 06:21:38.677919
- Title: LexGLUE: A Benchmark Dataset for Legal Language Understanding in English
- Title(参考訳): LexGLUE: 英語の法言語理解のためのベンチマークデータセット
- Authors: Ilias Chalkidis, Abhik Jana, Dirk Hartung, Michael Bommarito, Ion
Androutsopoulos, Daniel Martin Katz, and Nikolaos Aletras
- Abstract要約: 我々は,多種多様なNLUタスクのモデル性能を評価するためのデータセットの集合であるLexGLUEベンチマークを紹介する。
また、複数の汎用的および法的指向モデルの評価と分析を行い、後者が複数のタスクにまたがるパフォーマンス改善を一貫して提供することを示した。
- 参考スコア(独自算出の注目度): 15.026117429782996
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Law, interpretations of law, legal arguments, agreements, etc. are typically
expressed in writing, leading to the production of vast corpora of legal text.
Their analysis, which is at the center of legal practice, becomes increasingly
elaborate as these collections grow in size. Natural language understanding
(NLU) technologies can be a valuable tool to support legal practitioners in
these endeavors. Their usefulness, however, largely depends on whether current
state-of-the-art models can generalize across various tasks in the legal
domain. To answer this currently open question, we introduce the Legal General
Language Understanding Evaluation (LexGLUE) benchmark, a collection of datasets
for evaluating model performance across a diverse set of legal NLU tasks in a
standardized way. We also provide an evaluation and analysis of several generic
and legal-oriented models demonstrating that the latter consistently offer
performance improvements across multiple tasks.
- Abstract(参考訳): 法律、法律の解釈、法的議論、合意などは通常、書面で表現され、法文の膨大なコーパスが生み出される。
彼らの分析は、法律実務の中心にあり、これらのコレクションのサイズが大きくなるにつれて、ますます精巧になっていく。
自然言語理解(NLU)技術は、これらの取り組みにおける法的実践者を支援する貴重なツールとなり得る。
しかし、それらの有用性は、現在の最先端モデルが法域内の様々なタスクにまたがって一般化できるかどうかに大きく依存する。
現在公開されているこの疑問に答えるために、我々は、さまざまな法的NLUタスクの集合にわたるモデルパフォーマンスを評価するデータセットの集合であるLexGLUEベンチマーク(LexGLUE)を紹介する。
また,複数タスクにまたがる性能改善が一貫して実現されていることを示す,いくつかの汎用的および法的なモデルの評価と分析も提供する。
関連論文リスト
- Legal Evalutions and Challenges of Large Language Models [42.51294752406578]
我々は,OPENAI o1モデルを事例研究として,法律規定の適用における大規模モデルの性能評価に利用した。
我々は、オープンソース、クローズドソース、および法律ドメインのために特別に訓練された法律固有のモデルを含む、最先端のLLMを比較します。
論文 参考訳(メタデータ) (2024-11-15T12:23:12Z) - Natural Language Processing for the Legal Domain: A Survey of Tasks, Datasets, Models, and Challenges [4.548047308860141]
自然言語処理は、法律専門家や法務担当者の法務分野における活動の仕方に革命をもたらしている。
本調査では,手動フィルタリング後の127項目を最終選択として,システムレビューとメタアナライズフレームワークの優先報告項目に従って,148の研究をレビューした。
法律分野における自然言語処理に関する基礎概念を探求する。
論文 参考訳(メタデータ) (2024-10-25T01:17:02Z) - LawLLM: Law Large Language Model for the US Legal System [43.13850456765944]
我々は,米国法域に特化して設計されたマルチタスクモデルであるLawLLM(Law Large Language Model)を紹介する。
類似症例検索(SCR)、PCR(Precedent Case Recommendation)、LJP(Lawal Judgment Prediction)においてLawLLMが優れている
そこで本研究では,各タスクに対して,生の法定データをトレーニング可能な形式に変換する,カスタマイズされたデータ前処理手法を提案する。
論文 参考訳(メタデータ) (2024-07-27T21:51:30Z) - InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。
われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。
InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文 参考訳(メタデータ) (2024-06-21T06:19:03Z) - Precedent-Enhanced Legal Judgment Prediction with LLM and Domain-Model
Collaboration [52.57055162778548]
法的判断予測(LJP)は、法律AIにおいてますます重要な課題となっている。
先行は、同様の事実を持つ以前の訴訟であり、国家法制度におけるその後の事件の判断の基礎となっている。
近年のディープラーニングの進歩により、LJPタスクの解決に様々なテクニックが使えるようになった。
論文 参考訳(メタデータ) (2023-10-13T16:47:20Z) - LeXFiles and LegalLAMA: Facilitating English Multinational Legal
Language Model Development [8.931169262582442]
法律指向事前学習言語モデル(PLM)の性能に関する詳細な分析を行う。
本研究は, 本来の目的, 獲得した知識, 法的言語理解能力の相互作用について検討する。
関連する法的トピックにおいて,提案性能は上流のパフォーマンスと強く相関していることが判明した。
論文 参考訳(メタデータ) (2023-05-12T14:21:38Z) - Unlocking Practical Applications in Legal Domain: Evaluation of GPT for
Zero-Shot Semantic Annotation of Legal Texts [0.0]
我々は、短いテキストスニペットのセマンティックアノテーションを実行するための、最先端の生成事前学習トランスフォーマ(GPT)モデルの有効性を評価する。
その結果、GPTモデルは様々な種類の文書のゼロショット設定において驚くほどよく機能することがわかった。
論文 参考訳(メタデータ) (2023-05-08T01:55:53Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Benchmarking Generalization via In-Context Instructions on 1,600+
Language Tasks [95.06087720086133]
Natural-Instructions v2 は 1,600 以上の多種多様な言語タスクとその専門家による命令のコレクションである。
ベンチマークでは、タグ付け、インフィル、書き換えなど、70以上の異なるタスクタイプがカバーされている。
このベンチマークにより、モデルのクロスタスク一般化の大規模評価が可能になる。
論文 参考訳(メタデータ) (2022-04-16T03:12:30Z) - Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。
判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文 参考訳(メタデータ) (2021-05-09T09:39:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。