論文の概要: CDJUR-BR -- A Golden Collection of Legal Document from Brazilian Justice
with Fine-Grained Named Entities
- arxiv url: http://arxiv.org/abs/2305.18315v1
- Date: Sat, 20 May 2023 00:48:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2023-06-04 11:28:30.740279
- Title: CDJUR-BR -- A Golden Collection of Legal Document from Brazilian Justice
with Fine-Grained Named Entities
- Title(参考訳): cdjur-br -- きめ細かな名称を持つブラジルの裁判官による法文書の黄金のコレクション
- Authors: Antonio Mauricio, Vladia Pinheiro, Vasco Furtado, Jo\~ao Ara\'ujo
Monteiro Neto, Francisco das Chagas Juc\'a Bomfim, Andr\'e C\^amara Ferreira
da Costa, Raquel Silveira, Nilsiton Arag\~ao
- Abstract要約: ブラジル司法の黄金コレクション(CDJUR-BR)の開発について述べる。
CDJUR-BRは、法律文書に専門家が注釈を付けた細かな名前のエンティティのセットについて検討している。
BERTモデルに基づくNERをCDJUR-BRでトレーニングし,CDJUR-BRの有病率を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A basic task for most Legal Artificial Intelligence (Legal AI) applications
is Named Entity Recognition (NER). However, texts produced in the context of
legal practice make references to entities that are not trivially recognized by
the currently available NERs. There is a lack of categorization of legislation,
jurisprudence, evidence, penalties, the roles of people in a legal process
(judge, lawyer, victim, defendant, witness), types of locations (crime
location, defendant's address), etc. In this sense, there is still a need for a
robust golden collection, annotated with fine-grained entities of the legal
domain, and which covers various documents of a legal process, such as
petitions, inquiries, complaints, decisions and sentences. In this article, we
describe the development of the Golden Collection of the Brazilian Judiciary
(CDJUR-BR) contemplating a set of fine-grained named entities that have been
annotated by experts in legal documents. The creation of CDJUR-BR followed its
own methodology that aimed to attribute a character of comprehensiveness and
robustness. Together with the CDJUR-BR repository we provided a NER based on
the BERT model and trained with the CDJUR-BR, whose results indicated the
prevalence of the CDJUR-BR.
- Abstract(参考訳): ほとんどの法的な人工知能(Legal AI)アプリケーションのための基本的なタスクは、名前付きエンティティ認識(NER)である。
しかし、法律実務の文脈で作成されたテキストは、現在利用可能なNERによって自明に認識されていないエンティティを参照する。
法律、法学、証拠、罰則、法的過程における人々の役割(裁判官、弁護士、被害者、被告、証人)、場所の種類(犯罪場所、被告の住所など)の分類が欠如している。
この意味では、法的ドメインの細かな実体に注釈を付け、請願書、問合せ、苦情、判決、判決など、法的プロセスの様々な文書をカバーする、堅牢な黄金のコレクションがいまだに必要である。
本稿では,ブラジル司法裁判所のゴールデンコレクション(CDJUR-BR)の開発について述べる。
CDJUR-BRの作成は、包括性とロバスト性の特徴を属性とする独自の方法論を踏襲した。
CDJUR-BRリポジトリとともに、BERTモデルに基づいたNERを提供し、CDJUR-BRでトレーニングした。
関連論文リスト
- Labeling Case Similarity based on Co-Citation of Legal Articles in Judgment Documents with Empirical Dispute-Based Evaluation [0.9902389530203038]
本稿では,ケース内における法的論文の共引用を利用して類似性を確立し,アルゴリズム的アノテーションを実現する手法を提案する。
我々は、原告の告発、被告の反論、紛争点に基づく同様の事件を推奨する制度を採用している。
評価の結果,微調整されたテキスト埋め込みモデルと合理的なBiLSTMモジュールを併用したリコメンデータは,法律論文の共引用によって類似度が測定された労働事例を推薦できることがわかった。
論文 参考訳(メタデータ) (2025-04-29T00:26:37Z) - JuDGE: Benchmarking Judgment Document Generation for Chinese Legal System [12.256518096712334]
JuDGE(Judgment Document Generation Evaluation)は、中国の法体系における判定文書生成の性能を評価するための新しいベンチマークである。
本研究では,実訴訟の事実記述からなる包括的データセットを構築し,対応する全判決文書と組み合わせた。
法律専門家と共同で,生成した判定文書の品質を評価するための総合的な自動評価フレームワークを構築した。
論文 参考訳(メタデータ) (2025-03-18T13:48:18Z) - A Law Reasoning Benchmark for LLM with Tree-Organized Structures including Factum Probandum, Evidence and Experiences [76.73731245899454]
本稿では,階層的なファクトラム,証拠,暗黙的な経験に富む透明な法理推論スキーマを提案する。
このスキーマにインスパイアされた課題は、テキストのケース記述を取り込み、最終決定を正当化する階層構造を出力する。
このベンチマークは、Intelligent Courtにおける透明で説明可能なAI支援法推論の道を開く」。
論文 参考訳(メタデータ) (2025-03-02T10:26:54Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - CaseGen: A Benchmark for Multi-Stage Legal Case Documents Generation [22.98779736851499]
中国法域における多段階訴訟文書生成のベンチマークであるCaseGenを紹介する。
CaseGenは、法律の専門家によって注釈付けされた500の実ケースサンプルに基づいており、7つの重要なケースセクションをカバーしている。
防衛声明の起草、裁判事実の執筆、法的推論の作成、判決結果の生成の4つの重要なタスクをサポートする。
論文 参考訳(メタデータ) (2025-02-25T08:03:32Z) - Learning Interpretable Legal Case Retrieval via Knowledge-Guided Case Reformulation [22.85652668826498]
本稿では,大言語モデル(LLM)に基づく法的な知識誘導型事例修正手法であるKELLERを紹介する。
犯罪や法律記事に関する専門的な法的知識を取り入れることで、大規模な言語モデルにより、原訴訟を犯罪の簡潔なサブファクトに正確に修正することができる。
論文 参考訳(メタデータ) (2024-06-28T08:59:45Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - Report of the 1st Workshop on Generative AI and Law [78.62063815165968]
本報告では、生成AIと法に関する第1回ワークショップ(GenLaw)の開催状況について述べる。
コンピュータサイエンスと法学の実践者や学者の学際的なグループが集まり、ジェネレーティブAI法がもたらす技術的、教義的、政策上の課題について議論した。
論文 参考訳(メタデータ) (2023-11-11T04:13:37Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - FlairNLP at SemEval-2023 Task 6b: Extraction of Legal Named Entities
from Legal Texts using Contextual String Embeddings [0.0]
我々は、知識抽出技術、特に訴訟判決における法的実体の命名された実体抽出技術を用いている。
法文のキュレートされたデータセットに基づいて学習したモデルを用いて,シーケンスラベリングの領域におけるアートアーキテクチャのいくつかの状態を評価する。
Flair EmbeddingsでトレーニングされたBi-LSTMモデルは、最良の結果を得る。
論文 参考訳(メタデータ) (2023-06-03T19:38:04Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Named Entity Recognition in Indian court judgments [0.0]
我々は14の法人タイプにマッピングされた46545の注釈付き法人を新たに導入する。
判決文から法的に命名されたエンティティを抽出するベースラインモデルも開発されている。
論文 参考訳(メタデータ) (2022-11-07T10:44:44Z) - An Uncommon Task: Participatory Design in Legal AI [64.54460979588075]
われわれは10年以上前に行われた法律分野における、注目に値する、未調査のAI設計プロセスについて検討する。
インタラクティブなシミュレーション手法によって,コンピュータ科学者と弁護士が共同設計者になれることを示す。
論文 参考訳(メタデータ) (2022-03-08T15:46:52Z) - Semantic Segmentation of Legal Documents via Rhetorical Roles [3.285073688021526]
本稿では,法的文書を意味的に一貫性のある単位に分割する修辞的役割 (RR) システムを提案する。
我々は,法的文書をセグメント化するための補助的タスクとして,文書の修辞的役割ラベルシフトを用いたマルチタスク学習に基づくディープラーニングモデルを開発した。
論文 参考訳(メタデータ) (2021-12-03T10:49:19Z) - LEGAL-BERT: The Muppets straight out of Law School [52.53830441117363]
我々は、BERTモデルを下流の法的タスクに適用するためのアプローチを検討し、複数のデータセットで評価する。
以上の結果から,事前学習と微調整のガイドラインが盲目的に従う場合が多いが,法域において必ずしも適切ではないことが示唆された。
LEGAL-BERTは、法的なNLP研究、計算法、法的な技術応用を支援するためのBERTモデルのファミリーである。
論文 参考訳(メタデータ) (2020-10-06T09:06:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。