論文の概要: CDJUR-BR -- A Golden Collection of Legal Document from Brazilian Justice
with Fine-Grained Named Entities
- arxiv url: http://arxiv.org/abs/2305.18315v1
- Date: Sat, 20 May 2023 00:48:52 GMT
- ステータス: 処理完了
- システム内更新日: 2023-06-04 11:28:30.740279
- Title: CDJUR-BR -- A Golden Collection of Legal Document from Brazilian Justice
with Fine-Grained Named Entities
- Title(参考訳): cdjur-br -- きめ細かな名称を持つブラジルの裁判官による法文書の黄金のコレクション
- Authors: Antonio Mauricio, Vladia Pinheiro, Vasco Furtado, Jo\~ao Ara\'ujo
Monteiro Neto, Francisco das Chagas Juc\'a Bomfim, Andr\'e C\^amara Ferreira
da Costa, Raquel Silveira, Nilsiton Arag\~ao
- Abstract要約: ブラジル司法の黄金コレクション(CDJUR-BR)の開発について述べる。
CDJUR-BRは、法律文書に専門家が注釈を付けた細かな名前のエンティティのセットについて検討している。
BERTモデルに基づくNERをCDJUR-BRでトレーニングし,CDJUR-BRの有病率を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: A basic task for most Legal Artificial Intelligence (Legal AI) applications
is Named Entity Recognition (NER). However, texts produced in the context of
legal practice make references to entities that are not trivially recognized by
the currently available NERs. There is a lack of categorization of legislation,
jurisprudence, evidence, penalties, the roles of people in a legal process
(judge, lawyer, victim, defendant, witness), types of locations (crime
location, defendant's address), etc. In this sense, there is still a need for a
robust golden collection, annotated with fine-grained entities of the legal
domain, and which covers various documents of a legal process, such as
petitions, inquiries, complaints, decisions and sentences. In this article, we
describe the development of the Golden Collection of the Brazilian Judiciary
(CDJUR-BR) contemplating a set of fine-grained named entities that have been
annotated by experts in legal documents. The creation of CDJUR-BR followed its
own methodology that aimed to attribute a character of comprehensiveness and
robustness. Together with the CDJUR-BR repository we provided a NER based on
the BERT model and trained with the CDJUR-BR, whose results indicated the
prevalence of the CDJUR-BR.
- Abstract(参考訳): ほとんどの法的な人工知能(Legal AI)アプリケーションのための基本的なタスクは、名前付きエンティティ認識(NER)である。
しかし、法律実務の文脈で作成されたテキストは、現在利用可能なNERによって自明に認識されていないエンティティを参照する。
法律、法学、証拠、罰則、法的過程における人々の役割(裁判官、弁護士、被害者、被告、証人)、場所の種類(犯罪場所、被告の住所など)の分類が欠如している。
この意味では、法的ドメインの細かな実体に注釈を付け、請願書、問合せ、苦情、判決、判決など、法的プロセスの様々な文書をカバーする、堅牢な黄金のコレクションがいまだに必要である。
本稿では,ブラジル司法裁判所のゴールデンコレクション(CDJUR-BR)の開発について述べる。
CDJUR-BRの作成は、包括性とロバスト性の特徴を属性とする独自の方法論を踏襲した。
CDJUR-BRリポジトリとともに、BERTモデルに基づいたNERを提供し、CDJUR-BRでトレーニングした。
関連論文リスト
- Learning Interpretable Legal Case Retrieval via Knowledge-Guided Case Reformulation [22.85652668826498]
本稿では,大言語モデル(LLM)に基づく法的な知識誘導型事例修正手法であるKELLERを紹介する。
犯罪や法律記事に関する専門的な法的知識を取り入れることで、大規模な言語モデルにより、原訴訟を犯罪の簡潔なサブファクトに正確に修正することができる。
論文 参考訳(メタデータ) (2024-06-28T08:59:45Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - Report of the 1st Workshop on Generative AI and Law [78.62063815165968]
本報告では、生成AIと法に関する第1回ワークショップ(GenLaw)の開催状況について述べる。
コンピュータサイエンスと法学の実践者や学者の学際的なグループが集まり、ジェネレーティブAI法がもたらす技術的、教義的、政策上の課題について議論した。
論文 参考訳(メタデータ) (2023-11-11T04:13:37Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - FlairNLP at SemEval-2023 Task 6b: Extraction of Legal Named Entities
from Legal Texts using Contextual String Embeddings [0.0]
我々は、知識抽出技術、特に訴訟判決における法的実体の命名された実体抽出技術を用いている。
法文のキュレートされたデータセットに基づいて学習したモデルを用いて,シーケンスラベリングの領域におけるアートアーキテクチャのいくつかの状態を評価する。
Flair EmbeddingsでトレーニングされたBi-LSTMモデルは、最良の結果を得る。
論文 参考訳(メタデータ) (2023-06-03T19:38:04Z) - SAILER: Structure-aware Pre-trained Language Model for Legal Case
Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。
既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。
本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文 参考訳(メタデータ) (2023-04-22T10:47:01Z) - Named Entity Recognition in Indian court judgments [0.0]
我々は14の法人タイプにマッピングされた46545の注釈付き法人を新たに導入する。
判決文から法的に命名されたエンティティを抽出するベースラインモデルも開発されている。
論文 参考訳(メタデータ) (2022-11-07T10:44:44Z) - An Uncommon Task: Participatory Design in Legal AI [64.54460979588075]
われわれは10年以上前に行われた法律分野における、注目に値する、未調査のAI設計プロセスについて検討する。
インタラクティブなシミュレーション手法によって,コンピュータ科学者と弁護士が共同設計者になれることを示す。
論文 参考訳(メタデータ) (2022-03-08T15:46:52Z) - Semantic Segmentation of Legal Documents via Rhetorical Roles [3.285073688021526]
本稿では,法的文書を意味的に一貫性のある単位に分割する修辞的役割 (RR) システムを提案する。
我々は,法的文書をセグメント化するための補助的タスクとして,文書の修辞的役割ラベルシフトを用いたマルチタスク学習に基づくディープラーニングモデルを開発した。
論文 参考訳(メタデータ) (2021-12-03T10:49:19Z) - LEGAL-BERT: The Muppets straight out of Law School [52.53830441117363]
我々は、BERTモデルを下流の法的タスクに適用するためのアプローチを検討し、複数のデータセットで評価する。
以上の結果から,事前学習と微調整のガイドラインが盲目的に従う場合が多いが,法域において必ずしも適切ではないことが示唆された。
LEGAL-BERTは、法的なNLP研究、計算法、法的な技術応用を支援するためのBERTモデルのファミリーである。
論文 参考訳(メタデータ) (2020-10-06T09:06:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。