Fugu-MT 論文翻訳(概要): eagerlearners at SemEval2024 Task 5: The Legal Argument Reasoning Task in Civil Procedure

論文の概要: eagerlearners at SemEval2024 Task 5: The Legal Argument Reasoning Task in Civil Procedure

arxiv url: http://arxiv.org/abs/2406.16490v1
Date: Mon, 24 Jun 2024 09:57:44 GMT
ステータス: 翻訳完了
システム内更新日: 2024-06-25 15:24:04.667443
Title: eagerlearners at SemEval2024 Task 5: The Legal Argument Reasoning Task in Civil Procedure
Title（参考訳）: SemEval2024 Task 5: The Legal Argument Reasoning Task in Civil Procedure
Authors: Hoorieh Sabzevari, Mohammadmostafa Rostamkhani, Sauleh Eetemadi,
Abstract要約: 本研究では,3大言語モデルを用いたデータ分類におけるゼロショット法の性能について検討した。私たちの主要なデータセットは、米国民事訴訟のドメインから来ています。
参考スコア（独自算出の注目度）: 0.04096453902709291
License: http://creativecommons.org/licenses/by/4.0/
Abstract: This study investigates the performance of the zero-shot method in classifying data using three large language models, alongside two models with large input token sizes and the two pre-trained models on legal data. Our main dataset comes from the domain of U.S. civil procedure. It includes summaries of legal cases, specific questions, potential answers, and detailed explanations for why each solution is relevant, all sourced from a book aimed at law students. By comparing different methods, we aimed to understand how effectively they handle the complexities found in legal datasets. Our findings show how well the zero-shot method of large language models can understand complicated data. We achieved our highest F1 score of 64% in these experiments.
Abstract（参考訳）: 本研究では,3大言語モデルと2大入力トークンサイズを持つ2つのモデル,および2つの法定データを用いた事前学習モデルを用いて,ゼロショット法の性能について検討した。私たちの主要なデータセットは、米国民事訴訟のドメインから来ています。これには、訴訟の要約、特定の質問、潜在的な答え、そして、各解決がなぜ関連しているのかに関する詳細な説明が含まれる。異なる手法を比較することで、法的なデータセットにある複雑さを効果的に扱えるかを理解することを目指していた。以上の結果から,大規模言語モデルのゼロショット手法が複雑なデータをいかに理解できるかが示唆された。これらの実験でF1スコアが最も高かったのは64%でした。

関連論文リスト

Structured Definitions and Segmentations for Legal Reasoning in LLMs: A Study on Indian Legal Data [27.162165587035176]
大規模な言語モデル(LLM)は、Webからの広範なデータセットに基づいて訓練され、目覚ましい一般的な推論スキルを示す。しかし、主にドメイン固有の事前訓練がないため、法律のような専門分野に苦しむことが多い。従来の研究では、知識ギャップに対処するためのコンテキスト内アプローチを検証し、ドメインの完全な整合性のない新しいドメインにおけるモデル性能を高めてきた。
論文参考訳（メタデータ） (2025-11-14T13:24:00Z)
LEXam: Benchmarking Legal Reasoning on 340 Law Exams [76.3521146499006]
textscLEXamは,法科116科の法科試験を対象とする340件の法科試験を対象とする,新しいベンチマークである。このデータセットは、英語とドイツ語で4,886の法試験質問で構成されており、その中には2,841の長文のオープンエンド質問と2,045の多重選択質問が含まれている。この結果から,モデル間の差分化におけるデータセットの有効性が示唆された。
論文参考訳（メタデータ） (2025-05-19T08:48:12Z)
A Llama walks into the 'Bar': Efficient Supervised Fine-Tuning for Legal Reasoning in the Multi-state Bar Exam [38.71998082580061]
法的な推論タスクは、ドメイン固有の知識と推論プロセスの複雑さのために、大きな言語モデル(LLM)に固有の課題を示す。本稿では,Llama 2 7B と Llama 3 8B の小さい言語モデルが,MBE (Multi-state Bar Examination) の限られたデータセットを用いて,いかに効果的に微調整できるかを検討する。
論文参考訳（メタデータ） (2025-04-07T11:31:22Z)
Procedural Knowledge in Pretraining Drives Reasoning in Large Language Models [30.066436019078164]
推論タスクを行う際に,大規模言語モデルが採用する一般化戦略について検討する。以上の結果から, モデルを用いた推論手法は検索と異なり, より一般化可能な戦略であることが示唆された。
論文参考訳（メタデータ） (2024-11-19T15:47:12Z)
Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文参考訳（メタデータ） (2024-10-09T06:26:39Z)
The Factuality of Large Language Models in the Legal Domain [8.111302195052641]
本稿では,法域における知識基盤としての大規模言語モデル(LLM)の事実性について検討する。事例法と法律に関する多様な事実質問のデータセットを設計する。次に、データセットを用いて、精度、エイリアス、ファジィマッチングなど、異なる評価手法で複数のLCMを評価する。
論文参考訳（メタデータ） (2024-09-18T08:30:20Z)
TriSum: Learning Summarization Ability from Large Language Models with Structured Rationale [66.01943465390548]
本稿では,大規模言語モデルのテキスト要約能力を,コンパクトで局所的なモデルに抽出するフレームワークであるTriSumを紹介する。本手法は,様々なベンチマーク上での局所モデル性能を向上させる。また、要約の合理性に関する洞察を提供することで、解釈可能性も向上する。
論文参考訳（メタデータ） (2024-03-15T14:36:38Z)
Modeling Legal Reasoning: LM Annotation at the Edge of Human Agreement [3.537369004801589]
我々は法学哲学に基づく法学推論の分類について研究する。我々は、ドメインの専門家チームによって注釈付けされた、アメリカ合衆国最高裁判所の歴史的意見の新しいデータセットを使用します。生成モデルは、人間のアノテーションに提示される命令と同等の命令が与えられた場合、性能が良くないことがわかった。
論文参考訳（メタデータ） (2023-10-27T19:27:59Z)
Automated Refugee Case Analysis: An NLP Pipeline for Supporting Legal Practitioners [0.0]
本稿では,訴訟から対象情報を検索,処理,抽出するためのエンドツーエンドパイプラインを提案する。カナダにおける難民法を事例として,未研究の法域を調査した。
論文参考訳（メタデータ） (2023-05-24T19:37:23Z)
Selective In-Context Data Augmentation for Intent Detection using Pointwise V-Information [100.03188187735624]
PLMとPVI(pointwise V-information)に基づく新しい手法を導入し,モデル学習におけるデータポイントの有用性を計測する。提案手法はまず,学習データの小さなシード上でPLMを微調整し,与えられた意図に対応する発話を新たに生成する。そこで本手法は,大規模言語モデルの表現力を活用し,多様な学習データを生成する。
論文参考訳（メタデータ） (2023-02-10T07:37:49Z)
Ensemble Transfer Learning for Multilingual Coreference Resolution [60.409789753164944]
非英語で作業する場合に頻繁に発生する問題は、注釈付きトレーニングデータの不足である。我々は,様々なトランスファー学習技術を組み合わせた,シンプルだが効果的なアンサンブルベースのフレームワークを設計する。また、ウィキペディアアンカーテキストを利用して、コア参照解決モデルをブートストラップする低コストのTL手法を提案する。
論文参考訳（メタデータ） (2023-01-22T18:22:55Z)
The Legal Argument Reasoning Task in Civil Procedure [2.079168053329397]
我々は,米国民事訴訟の領域から新たなNLPタスクとデータセットを提示する。データセットの各インスタンスは、ケースの一般的な導入、特定の質問、可能な解決策引数で構成されている。
論文参考訳（メタデータ） (2022-11-05T17:41:00Z)
An Empirical Investigation of Commonsense Self-Supervision with Knowledge Graphs [67.23285413610243]
大規模知識グラフから抽出した情報に基づく自己監督は、言語モデルの一般化を改善することが示されている。本研究では,言語モデルに適用可能な合成データを生成するための知識サンプリング戦略とサイズの影響について検討する。
論文参考訳（メタデータ） (2022-05-21T19:49:04Z)
When Can Models Learn From Explanations? A Formal Framework for Understanding the Roles of Explanation Data [84.87772675171412]
個々のデータポイントの説明がモデリング性能を向上させる状況について検討する。 e-SNLI、TACRED、SemEvalの3つの既存のデータセットを使って説明します。
論文参考訳（メタデータ） (2021-02-03T18:57:08Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。