Fugu-MT 論文翻訳(概要): FLawN-T5: An Empirical Examination of Effective Instruction-Tuning Data Mixtures for Legal Reasoning

論文の概要: FLawN-T5: An Empirical Examination of Effective Instruction-Tuning Data Mixtures for Legal Reasoning

arxiv url: http://arxiv.org/abs/2404.02127v1
Date: Tue, 2 Apr 2024 17:33:34 GMT
ステータス: 翻訳完了
システム内更新日: 2024-04-03 15:20:18.290344
Title: FLawN-T5: An Empirical Examination of Effective Instruction-Tuning Data Mixtures for Legal Reasoning
Title（参考訳）: FLawN-T5: 法的推論のための効果的な命令-調整データ混合の実験的検討
Authors: Joel Niklaus, Lucia Zheng, Arya D. McCarthy, Christopher Hahn, Brian M. Rosen, Peter Henderson, Daniel E. Ho, Garrett Honke, Percy Liang, Christopher Manning,
Abstract要約: LawInstructは17の管轄区域、24の言語、合計12万のサンプルをカバーする大規模な法的命令データセットである。ドメイン固有の事前学習と指導訓練がLegalBenchの性能を向上させることを示す。 LawInstructは、より強力な情報処理と法的領域における意思決定能力を備えたモデルの開発を促進するためのリソースである。
参考スコア（独自算出の注目度）: 47.001169623840354
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Instruction tuning is an important step in making language models useful for direct user interaction. However, many legal tasks remain out of reach for most open LLMs and there do not yet exist any large scale instruction datasets for the domain. This critically limits research in this application area. In this work, we curate LawInstruct, a large legal instruction dataset, covering 17 jurisdictions, 24 languages and a total of 12M examples. We present evidence that domain-specific pretraining and instruction tuning improve performance on LegalBench, including improving Flan-T5 XL by 8 points or 16\% over the baseline. However, the effect does not generalize across all tasks, training regimes, model sizes, and other factors. LawInstruct is a resource for accelerating the development of models with stronger information processing and decision making capabilities in the legal domain.
Abstract（参考訳）: インストラクションチューニングは、言語モデルを直接的なユーザインタラクションに役立つものにするための重要なステップである。しかし、多くの法的タスクは、ほとんどのオープンなLLMには及ばず、ドメインのための大規模な命令データセットは存在しない。これにより、この応用分野の研究は極めて制限される。本研究では,17の管轄区域,24の言語,合計12万のサンプルを対象とする大規模法的指導データセットであるLawInstructをキュレートする。そこで本研究では,ドメイン固有の事前学習と指導訓練により,Flan-T5 XLを8点,あるいは16\%向上させるなど,LegalBenchの性能が向上することを示す。しかし、この効果は全てのタスク、訓練体制、モデルサイズ、その他の要因にまたがって一般化されるわけではない。 LawInstructは、より強力な情報処理と法的領域における意思決定能力を備えたモデルの開発を促進するためのリソースである。

関連論文リスト

LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [54.57434222018289]
我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。 LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。 LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文参考訳（メタデータ） (2026-01-31T10:18:32Z)
PLawBench: A Rubric-Based Benchmark for Evaluating LLMs in Real-World Legal Practice [67.71760070255425]
本稿では,大規模言語モデル (LLM) を評価するための実践的ベンチマークであるPLawBenchを紹介する。 PLawBenchは、13の実践的な法的シナリオにわたる850の質問で構成され、各質問には専門家が設計した評価ルーブが伴っている。人間の専門的判断に合わせたLLMに基づく評価器を用いて,10種類の最先端のLLMを評価した。
論文参考訳（メタデータ） (2026-01-23T11:36:10Z)
Chinese Labor Law Large Language Model Benchmark [11.552694592413303]
我々は、中国労働法に合わせた大規模言語モデルであるWorkersLawLLMを紹介する。また、さまざまな労働法タスクをカバーするベンチマークであるBurveLawBenchを紹介します。実験により、WorkersLawLLMは、汎用および既存の法律固有のLLMよりも一貫して優れていることが示された。
論文参考訳（メタデータ） (2026-01-15T01:27:29Z)
LEXam: Benchmarking Legal Reasoning on 340 Law Exams [61.344330783528015]
LEXamは、様々な科目と学位レベルの116の法学校コースにまたがる340の法試験から派生した、新しいベンチマークである。このデータセットは、英語とドイツ語で4,886の法試験の質問で構成されており、その中には2,841の長文のオープンエンドの質問と2,045のマルチチョイスの質問が含まれている。
論文参考訳（メタデータ） (2025-05-19T08:48:12Z)
(Mis)Fitting: A Survey of Scaling Laws [52.598843243928584]
本稿では,パラメータ比に対する最適トークンのような質問に対して,いくつかの先行研究が到達した結論の相違について論じる。スケーリングのトレンドを研究する50以上の論文を調査します。本稿では,法律研究のスケールアップに寄与しながら,著者が考慮すべきチェックリストを提案する。
論文参考訳（メタデータ） (2025-02-26T09:27:54Z)
LegalAgentBench: Evaluating LLM Agents in Legal Domain [53.70993264644004]
LegalAgentBenchは、中国の法律領域でLLMエージェントを評価するために特別に設計されたベンチマークである。 LegalAgentBenchには、現実世界の法的シナリオから17のコーパスが含まれており、外部知識と対話するための37のツールを提供している。
論文参考訳（メタデータ） (2024-12-23T04:02:46Z)
TransformLLM: Adapting Large Language Models via LLM-Transformed Reading Comprehension Text [5.523385345486362]
法的な応用に特化して設計された言語モデルを開発した。我々の革新的なアプローチは、Large Language Models (LLMs) を用いて、生のトレーニングデータを読解テキストに変換することによって、法的タスクの能力を大幅に向上させる。
論文参考訳（メタデータ） (2024-10-28T19:32:18Z)
Natural Language Processing for the Legal Domain: A Survey of Tasks, Datasets, Models, and Challenges [4.548047308860141]
本調査は,手動フィルタリング後の133項目を最終選択した154の研究をレビューし,システムレビューおよびメタ分析フレームワークの優先報告項目に従う。法律分野におけるNLPに関する基礎概念を探求し、法律文書の処理の独特な側面と課題を詳述する。本稿では,法的文書要約,法的名称付きエンティティ認識,法的質問回答,法的条項マイニング,法的テキスト分類,法的判断予測など,法的テキストに特有のNLPタスクの概要について述べる。
論文参考訳（メタデータ） (2024-10-25T01:17:02Z)
LexSumm and LexT5: Benchmarking and Modeling Legal Summarization Tasks in English [1.3723120574076126]
この研究は、英語の法的な要約タスクを評価するために設計されたベンチマークであるLexSummをキュレートする。これは、米国、英国、EU、インドなどの様々な司法管轄区域から8つのイングランドの法的な要約データセットで構成されている。我々は、法ドメイン内の既存のBERTスタイルエンコーダのみのモデルの制限に対処する、法的指向シーケンス・ツー・シーケンスモデルであるLexT5をリリースする。
論文参考訳（メタデータ） (2024-10-12T13:16:51Z)
The Factuality of Large Language Models in the Legal Domain [8.111302195052641]
本稿では,法域における知識基盤としての大規模言語モデル(LLM)の事実性について検討する。事例法と法律に関する多様な事実質問のデータセットを設計する。次に、データセットを用いて、精度、エイリアス、ファジィマッチングなど、異なる評価手法で複数のLCMを評価する。
論文参考訳（メタデータ） (2024-09-18T08:30:20Z)
Performance Law of Large Language Models [58.32539851241063]
性能法則は、LLMアーキテクチャの選択と計算資源の効率的な割り当てを導くために用いられる。性能法則は、LLMアーキテクチャの選択と計算資源の効率的な割り当てを広範な実験なしで導くのに利用できる。
論文参考訳（メタデータ） (2024-08-19T11:09:12Z)
InternLM-Law: An Open Source Chinese Legal Large Language Model [72.2589401309848]
InternLM-Lawは、中国法に関する様々な法的クエリに対処するための特殊なLLMである。われわれは、中国法域に100万以上のクエリを含むデータセットを慎重に構築する。 InternLM-LawはLawBench上で最高の平均性能を達成し、20サブタスク中13サブタスクでGPT-4を含む最先端モデルを上回っている。
論文参考訳（メタデータ） (2024-06-21T06:19:03Z)
PARAMANU-AYN: Pretrain from scratch or Continual Pretraining of LLMs for Legal Domain Adaptation? [3.9018931027384056]
パラマヌ・アイン(Paramanu-Ayn)は、インドの訴訟文書に特化して訓練された法律言語モデルのコレクションである。 Paramanu-Aynは1つのGPU上でわずか185時間、コンテキストサイズ8192のスクラッチから事前トレーニングされた。
論文参考訳（メタデータ） (2024-03-20T15:39:54Z)
Self-Checker: Plug-and-Play Modules for Fact-Checking with Large Language Models [75.75038268227554]
Self-Checkerはファクトチェックを容易にするプラグインとプレイモジュールからなるフレームワークである。このフレームワークは、低リソース環境でファクトチェックシステムを構築するための、高速で効率的な方法を提供する。
論文参考訳（メタデータ） (2023-05-24T01:46:07Z)
Towards Building the Federated GPT: Federated Instruction Tuning [66.7900343035733]
本稿では,大規模言語モデル(LLM)の命令チューニングのための学習フレームワークとして,FedIT(Federated Instruction Tuning)を紹介する。我々は,FedITを用いてクライアントの終端における多種多様な命令セットを活用することにより,ローカル命令のみを限定した集中学習に比べ,LLMの性能を向上させることを実証した。
論文参考訳（メタデータ） (2023-05-09T17:42:34Z)
SAILER: Structure-aware Pre-trained Language Model for Legal Case Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文参考訳（メタデータ） (2023-04-22T10:47:01Z)
Understand Legal Documents with Contextualized Large Language Models [16.416510744265086]
本稿では,SemEval-2023タスク6について,法的テキストの理解について述べる。我々はまず,文内および文間両方の包括的文脈情報を考慮した法-BERT-HSLNモデルを開発した。次に、法的なエンティティを認識するために、法的なコンテキスト化とエンティティ認識を備えた法的なLUKEモデルをトレーニングする。
論文参考訳（メタデータ） (2023-03-21T18:48:11Z)
LexGLUE: A Benchmark Dataset for Legal Language Understanding in English [15.026117429782996]
我々は,多種多様なNLUタスクのモデル性能を評価するためのデータセットの集合であるLexGLUEベンチマークを紹介する。また、複数の汎用的および法的指向モデルの評価と分析を行い、後者が複数のタスクにまたがるパフォーマンス改善を一貫して提供することを示した。
論文参考訳（メタデータ） (2021-10-03T10:50:51Z)
Lawformer: A Pre-trained Language Model for Chinese Legal Long Documents [56.40163943394202]
我々は,中国法定長文理解のためのLongformerベースの事前学習言語モデル,Lawformerをリリースする。判決の予測,類似事例の検索,法的読解,法的質問の回答など,さまざまな法務上の課題について法務担当者を評価した。
論文参考訳（メタデータ） (2021-05-09T09:39:25Z)
When Does Pretraining Help? Assessing Self-Supervised Learning for Law and the CaseHOLD Dataset [2.0924876102146714]
53,000以上の選択質問からなる新しいデータセットを提示し、引用されたケースの保持状況を特定する。タスクがプリトレーニングコーパスと十分な類似性を示すと、ドメイン事前トレーニングが保証される可能性がある。我々の研究結果は、研究者がいつリソース集約的な事前訓練を行うべきかを知らせ、Transformerベースのアーキテクチャも、異なる法的言語を示唆する埋め込みを学習することを示す。
論文参考訳（メタデータ） (2021-04-18T00:57:16Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。