Fugu-MT 論文翻訳(概要): CDJUR-BR -- A Golden Collection of Legal Document from Brazilian Justice with Fine-Grained Named Entities

論文の概要: CDJUR-BR -- A Golden Collection of Legal Document from Brazilian Justice with Fine-Grained Named Entities

arxiv url: http://arxiv.org/abs/2305.18315v1
Date: Sat, 20 May 2023 00:48:52 GMT
ステータス: 翻訳完了
システム内更新日: 2023-06-04 11:28:30.740279
Title: CDJUR-BR -- A Golden Collection of Legal Document from Brazilian Justice with Fine-Grained Named Entities
Title（参考訳）: cdjur-br -- きめ細かな名称を持つブラジルの裁判官による法文書の黄金のコレクション
Authors: Antonio Mauricio, Vladia Pinheiro, Vasco Furtado, Jo\~ao Ara\'ujo Monteiro Neto, Francisco das Chagas Juc\'a Bomfim, Andr\'e C\^amara Ferreira da Costa, Raquel Silveira, Nilsiton Arag\~ao
Abstract要約: ブラジル司法の黄金コレクション(CDJUR-BR)の開発について述べる。 CDJUR-BRは、法律文書に専門家が注釈を付けた細かな名前のエンティティのセットについて検討している。 BERTモデルに基づくNERをCDJUR-BRでトレーニングし,CDJUR-BRの有病率を示した。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: A basic task for most Legal Artificial Intelligence (Legal AI) applications is Named Entity Recognition (NER). However, texts produced in the context of legal practice make references to entities that are not trivially recognized by the currently available NERs. There is a lack of categorization of legislation, jurisprudence, evidence, penalties, the roles of people in a legal process (judge, lawyer, victim, defendant, witness), types of locations (crime location, defendant's address), etc. In this sense, there is still a need for a robust golden collection, annotated with fine-grained entities of the legal domain, and which covers various documents of a legal process, such as petitions, inquiries, complaints, decisions and sentences. In this article, we describe the development of the Golden Collection of the Brazilian Judiciary (CDJUR-BR) contemplating a set of fine-grained named entities that have been annotated by experts in legal documents. The creation of CDJUR-BR followed its own methodology that aimed to attribute a character of comprehensiveness and robustness. Together with the CDJUR-BR repository we provided a NER based on the BERT model and trained with the CDJUR-BR, whose results indicated the prevalence of the CDJUR-BR.
Abstract（参考訳）: ほとんどの法的な人工知能(Legal AI)アプリケーションのための基本的なタスクは、名前付きエンティティ認識(NER)である。しかし、法律実務の文脈で作成されたテキストは、現在利用可能なNERによって自明に認識されていないエンティティを参照する。法律、法学、証拠、罰則、法的過程における人々の役割(裁判官、弁護士、被害者、被告、証人)、場所の種類(犯罪場所、被告の住所など)の分類が欠如している。この意味では、法的ドメインの細かな実体に注釈を付け、請願書、問合せ、苦情、判決、判決など、法的プロセスの様々な文書をカバーする、堅牢な黄金のコレクションがいまだに必要である。本稿では,ブラジル司法裁判所のゴールデンコレクション(CDJUR-BR)の開発について述べる。 CDJUR-BRの作成は、包括性とロバスト性の特徴を属性とする独自の方法論を踏襲した。 CDJUR-BRリポジトリとともに、BERTモデルに基づいたNERを提供し、CDJUR-BRでトレーニングした。

関連論文リスト

LegalOne: A Family of Foundation Models for Reliable Legal Reasoning [54.57434222018289]
我々は、中国の法律ドメインに特化された基礎モデルのファミリーであるLegalOneを紹介します。 LegalOneは、法的推論をマスターするために設計された包括的な3フェーズパイプラインを通じて開発されている。 LegalOneの重み付けとLegalKit評価フレームワークを公開して、Legal AIの分野を前進させます。
論文参考訳（メタデータ） (2026-01-31T10:18:32Z)
ReaKase-8B: Legal Case Retrieval via Knowledge and Reasoning Representations with LLMs [37.688405624086315]
ReaKase-8Bフレームワークは、抽出された法的事実、法的問題、法的関係のトリプレット、および効果的な訴訟検索のための法的推論を活用するために提案されている。 COLIEE 2022とCOLIEE 2023による2つのベンチマークデータセットの実験により、我々の知識と拡張埋め込みの推論が検索性能を大幅に向上することを示した。
論文参考訳（メタデータ） (2025-10-30T06:35:36Z)
SAMVAD: A Multi-Agent System for Simulating Judicial Deliberation Dynamics in India [0.0]
本稿では,インドの司法制度の枠組み内での審議プロセスのシミュレーションを目的とした,革新的なマルチエージェントシステム (MAS) であるSAMVADを紹介する。我々の制度は、裁判官、検察官、弁護人、複数の行政官(司法ベンチを模擬する)など、主要な司法職を代表するエージェントで構成されている。この研究の主な貢献は、インドにおけるランドマークな法律文書のドメイン固有の知識基盤に根ざした、検索型拡張世代(RAG)の統合である。
論文参考訳（メタデータ） (2025-09-04T01:04:44Z)
ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation [56.79698529022327]
法的な主張は、事件における原告の要求を言及し、法的理由づけと事件解決を導くのに不可欠である。本稿では,その事例の事実に基づく法的クレーム生成の問題について考察する。われわれは,中国法定クレーム生成タスクの最初のデータセットであるClaymGen-CNを構築した。
論文参考訳（メタデータ） (2025-08-24T07:19:25Z)
Incorporating Legal Structure in Retrieval-Augmented Generation: A Case Study on Copyright Fair Use [44.99833362998488]
本稿では,米国著作権法におけるフェアユース・ドクトリンに合わせて,ドメイン固有のRetrieval-Augmented Generationの実装を提案する。 DMCA削除の頻度の増加とコンテンツクリエーターにとってアクセス可能な法的支援の欠如により、我々は、セマンティック検索と法知識グラフと裁判所引用ネットワークを組み合わせて、検索品質と推論信頼性を向上させる構造的アプローチを提案する。
論文参考訳（メタデータ） (2025-05-04T15:53:49Z)
Labeling Case Similarity based on Co-Citation of Legal Articles in Judgment Documents with Empirical Dispute-Based Evaluation [0.9902389530203038]
本稿では,ケース内における法的論文の共引用を利用して類似性を確立し,アルゴリズム的アノテーションを実現する手法を提案する。我々は、原告の告発、被告の反論、紛争点に基づく同様の事件を推奨する制度を採用している。評価の結果,微調整されたテキスト埋め込みモデルと合理的なBiLSTMモジュールを併用したリコメンデータは,法律論文の共引用によって類似度が測定された労働事例を推薦できることがわかった。
論文参考訳（メタデータ） (2025-04-29T00:26:37Z)
JuDGE: Benchmarking Judgment Document Generation for Chinese Legal System [12.256518096712334]
JuDGE(Judgment Document Generation Evaluation)は、中国の法体系における判定文書生成の性能を評価するための新しいベンチマークである。本研究では,実訴訟の事実記述からなる包括的データセットを構築し,対応する全判決文書と組み合わせた。法律専門家と共同で,生成した判定文書の品質を評価するための総合的な自動評価フレームワークを構築した。
論文参考訳（メタデータ） (2025-03-18T13:48:18Z)
A Law Reasoning Benchmark for LLM with Tree-Organized Structures including Factum Probandum, Evidence and Experiences [76.73731245899454]
本稿では,階層的なファクトラム,証拠,暗黙的な経験に富む透明な法理推論スキーマを提案する。このスキーマにインスパイアされた課題は、テキストのケース記述を取り込み、最終決定を正当化する階層構造を出力する。このベンチマークは、Intelligent Courtにおける透明で説明可能なAI支援法推論の道を開く」。
論文参考訳（メタデータ） (2025-03-02T10:26:54Z)
AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文参考訳（メタデータ） (2025-02-28T19:14:48Z)
CaseGen: A Benchmark for Multi-Stage Legal Case Documents Generation [22.98779736851499]
中国法域における多段階訴訟文書生成のベンチマークであるCaseGenを紹介する。 CaseGenは、法律の専門家によって注釈付けされた500の実ケースサンプルに基づいており、7つの重要なケースセクションをカバーしている。防衛声明の起草、裁判事実の執筆、法的推論の作成、判決結果の生成の4つの重要なタスクをサポートする。
論文参考訳（メタデータ） (2025-02-25T08:03:32Z)
Learning Interpretable Legal Case Retrieval via Knowledge-Guided Case Reformulation [22.85652668826498]
本稿では,大言語モデル(LLM)に基づく法的な知識誘導型事例修正手法であるKELLERを紹介する。犯罪や法律記事に関する専門的な法的知識を取り入れることで、大規模な言語モデルにより、原訴訟を犯罪の簡潔なサブファクトに正確に修正することができる。
論文参考訳（メタデータ） (2024-06-28T08:59:45Z)
DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文参考訳（メタデータ） (2024-03-27T10:40:14Z)
Report of the 1st Workshop on Generative AI and Law [78.62063815165968]
本報告では、生成AIと法に関する第1回ワークショップ(GenLaw)の開催状況について述べる。コンピュータサイエンスと法学の実践者や学者の学際的なグループが集まり、ジェネレーティブAI法がもたらす技術的、教義的、政策上の課題について議論した。
論文参考訳（メタデータ） (2023-11-11T04:13:37Z)
MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文参考訳（メタデータ） (2023-10-24T08:17:11Z)
FlairNLP at SemEval-2023 Task 6b: Extraction of Legal Named Entities from Legal Texts using Contextual String Embeddings [0.0]
我々は、知識抽出技術、特に訴訟判決における法的実体の命名された実体抽出技術を用いている。法文のキュレートされたデータセットに基づいて学習したモデルを用いて,シーケンスラベリングの領域におけるアートアーキテクチャのいくつかの状態を評価する。 Flair EmbeddingsでトレーニングされたBi-LSTMモデルは、最良の結果を得る。
論文参考訳（メタデータ） (2023-06-03T19:38:04Z)
SAILER: Structure-aware Pre-trained Language Model for Legal Case Retrieval [75.05173891207214]
判例検索は知的法体系において中心的な役割を果たす。既存の言語モデルの多くは、異なる構造間の長距離依存関係を理解するのが難しい。本稿では, LEgal ケース検索のための構造対応プレトランザクショナル言語モデルを提案する。
論文参考訳（メタデータ） (2023-04-22T10:47:01Z)
Named Entity Recognition in Indian court judgments [0.0]
我々は14の法人タイプにマッピングされた46545の注釈付き法人を新たに導入する。判決文から法的に命名されたエンティティを抽出するベースラインモデルも開発されている。
論文参考訳（メタデータ） (2022-11-07T10:44:44Z)
An Uncommon Task: Participatory Design in Legal AI [64.54460979588075]
われわれは10年以上前に行われた法律分野における、注目に値する、未調査のAI設計プロセスについて検討する。インタラクティブなシミュレーション手法によって,コンピュータ科学者と弁護士が共同設計者になれることを示す。
論文参考訳（メタデータ） (2022-03-08T15:46:52Z)
Semantic Segmentation of Legal Documents via Rhetorical Roles [3.285073688021526]
本稿では,法的文書を意味的に一貫性のある単位に分割する修辞的役割 (RR) システムを提案する。我々は,法的文書をセグメント化するための補助的タスクとして,文書の修辞的役割ラベルシフトを用いたマルチタスク学習に基づくディープラーニングモデルを開発した。
論文参考訳（メタデータ） (2021-12-03T10:49:19Z)
LEGAL-BERT: The Muppets straight out of Law School [52.53830441117363]
我々は、BERTモデルを下流の法的タスクに適用するためのアプローチを検討し、複数のデータセットで評価する。以上の結果から,事前学習と微調整のガイドラインが盲目的に従う場合が多いが,法域において必ずしも適切ではないことが示唆された。 LEGAL-BERTは、法的なNLP研究、計算法、法的な技術応用を支援するためのBERTモデルのファミリーである。
論文参考訳（メタデータ） (2020-10-06T09:06:07Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。