論文の概要: HKJudge: A Legal Discourse-Annotated Corpus for Interpreting What Courts Find, How They Reason, and What They Rule
- arxiv url: http://arxiv.org/abs/2606.06679v1
- Date: Thu, 04 Jun 2026 19:53:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-08 14:33:29.424404
- Title: HKJudge: A Legal Discourse-Annotated Corpus for Interpreting What Courts Find, How They Reason, and What They Rule
- Title(参考訳): HKJudge: 裁判所が何を見つけたか、どのように関係し、どのようにルールを解釈するための法的な言論注釈付きコーパス
- Authors: Xi Xuan, Wenxin Zhang, Yufei Zhou, King-kui Sin, Chunyu Kit,
- Abstract要約: 本論では,最初の文レベルの専門家注釈付き法律談話コーパスであるHKJudgeを紹介する。
HKJudgeは、HKの裁判所階層の5段階すべてにわたる刑事判決を含み、$sim$290kの文と$sim$6.5Mのトークンを含んでいる。
私たちは、裁判所が見つけた事実、理由、そしてそれが規定するものをキャプチャする2階層の談話スキーマを設計します。
- 参考スコア(独自算出の注目度): 1.715323438290947
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Court judgments are central to legal practice and jurisprudence, yet discourse analysis of Hong Kong judgments has received limited attention, owing largely to the absence of expert-annotated corpora. We introduce the Hong Kong Judgment Discourse Dataset (HKJudge), the first sentence-level expert-annotated legal discourse corpus. HKJudge includes criminal judgments across all five levels of HK's court hierarchy, comprising $\sim$290k sentences and $\sim$6.5 million tokens, fully annotated by legal linguistics experts. We design a two-tier discourse schema that captures what facts a court finds, how it reasons, and what it rules. At the sentence level, each sentence is assigned one of 26 rhetorical roles. At the span level, sentences are further annotated with three sentencing elements (charge, imprisonment term, fine). Ten legal linguistics annotators produced the annotations with an inter-annotator agreement of $κ= 0.8$. We formulate two tasks on HKJudge, termed rhetorical role classification and legal element extraction, and provide the first benchmark evaluation of four BERT-based models, two open-source LLMs under zero-shot and fine-tuning settings, and four commercial LLMs on both tasks. Our work demonstrates the value of sentence-level discourse annotation for modeling the structure of HK judgments and provides a rich data foundation for future work on legal judgment prediction. The HKJudge dataset and code are available at https://github.com/xuanxixi/HKJudge.
- Abstract(参考訳): 裁判所判決は法的な慣行と法学的な判断の中心であるが、香港の判決の言説分析は、専門家が記載されたコーパスが欠如していることから、限定的に注目されている。
香港判決談話データセット(HKJudge, Hong Kong Judgment Discourse Dataset, HKJudge, HKJudge)について紹介する。
HKJudgeは、法的言語学の専門家によって完全に注釈付けされた$\sim$290kの文と$\sim$6.5Mのトークンを含む、HKの裁判所階層の5段階の刑事判決を含んでいる。
私たちは、裁判所が見つけた事実、理由、そしてそれが規定するものをキャプチャする2階層の談話スキーマを設計します。
文レベルでは、各文は26の修辞的役割の1つに割り当てられる。
スパンレベルでは、文はさらに3つのセンテンス要素(チャージ、投獄期間、罰金)で注釈付けされる。
10の法的言語アノテータは、κ=0.8$というアノテータ間合意でアノテーションを作成した。
我々はHKJudgeの2つのタスクを定式化し、修辞的役割分類と法定要素抽出と呼ばれ、4つのBERTモデル、ゼロショットおよび微調整条件下での2つのオープンソースLLM、両方のタスクにおける4つの商用LLMのベンチマーク評価を行う。
本研究は,HK判断の構造をモデル化するための文レベルの談話アノテーションの価値を実証し,将来的な法的判断予測のためのリッチなデータ基盤を提供する。
HKJudgeデータセットとコードはhttps://github.com/xuanxixi/HKJudgeで公開されている。
関連論文リスト
- CyberJurors: A Multi-Agent Simulation Task for E-Commerce Disputes Verdict [59.06704011432714]
電子商取引プラットフォームは、大量の取引紛争を判断するためにクラウドソースの陪審員を募集し始めた。
本稿では,先駆的タスクであるEDV(E-Commerce Dispute Verdicts)と,6,000件の現実世界のケースからなるマルチモーダルベンチマークであるVerdictBenchを紹介する。
本稿では,論争ロジックを明確にし,判定プロセスを制御するマルチエージェントフレームワークであるCyberJurorsを提案する。
論文 参考訳(メタデータ) (2026-05-27T12:07:44Z) - WisdomInterrogatory (LuWen): An Open-Source Legal Large Language Model Technical Report [55.27414605169639]
Wesdom Interrogatory (LuWen)は,バイチュン基礎モデルに基づいて構築された,オープンソースの中国語の法律モデルである。
予測と生成の両方にまたがる5つの代表的な法的課題についてLuWenを評価する。
論文 参考訳(メタデータ) (2026-04-08T06:59:07Z) - Making Judicial Reasoning Visible: Structured Annotation of Holding, Evidentiary Considerations, and Subsumption in Criminal Judgments [0.0]
刑事判決における司法的推論は、典型的には3つの要素から成り立っている: 保留、明白な考慮、従属である。
これらの要素は、司法決定の論理的基盤を形成するが、裁判所文書では構造化されず、大規模な実証分析を制限している。
この研究は、大規模な実証法的研究と法社会学の基礎を築き、司法公正性、一貫性、透明性を解析するための新しいツールを提供する。
論文 参考訳(メタデータ) (2025-09-15T09:33:07Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - JUREX-4E: Juridical Expert-Annotated Four-Element Knowledge Base for Legal Reasoning [20.9057475907066]
JUREX-4Eは155件の刑事訴追を専門とする4要素知識ベースである。
JUREX-4Eを類似電荷曖昧化タスクで評価し, 判例検索に適用する。
論文 参考訳(メタデータ) (2025-02-24T14:02:00Z) - DELTA: Pre-train a Discriminative Encoder for Legal Case Retrieval via Structural Word Alignment [55.91429725404988]
判例検索のための識別モデルであるDELTAを紹介する。
我々は浅層デコーダを利用して情報ボトルネックを作り、表現能力の向上を目指しています。
本手法は, 判例検索において, 既存の最先端手法よりも優れている。
論文 参考訳(メタデータ) (2024-03-27T10:40:14Z) - HK-LegiCoST: Leveraging Non-Verbatim Transcripts for Speech Translation [29.990957948085956]
カントン翻訳の3方向並列コーパスであるHK-LegiCoSTを紹介する。
コーパス作成における課題として, セグメンテーション, 長い音声録音のアライメント, 非バーベット文字との文レベルのアライメントについて述べる。
論文 参考訳(メタデータ) (2023-06-20T03:09:32Z) - Analyzing Hong Kong's Legal Judgments from a Computational Linguistics
point-of-view [0.0]
本稿では,香港の裁判所制度の法的判断を効果的に分析するために,統計的,機械学習,深層学習,ゼロショット学習に基づくいくつかの手法を提供することにより,ギャップを埋めようとしている。
提案手法は,(1)ネットワークグラフ生成,(2)ページランクアルゴリズム,(3)キーワード解析と要約,(4)知覚極性,(5)パラグラフ分類からなる。
これにより、香港での判断の全体的な分析は退屈さを減らし、より自動化され、高速な推論を用いて素早く洞察を抽出できる。
論文 参考訳(メタデータ) (2023-05-04T05:23:11Z) - Exploiting Contrastive Learning and Numerical Evidence for Confusing
Legal Judgment Prediction [46.71918729837462]
訴訟の事実記述文を考慮し、法的判断予測は、事件の告訴、法律記事、刑期を予測することを目的としている。
従来の研究では、標準的なクロスエントロピー分類損失と異なる分類誤差を区別できなかった。
本稿では,モコに基づく教師付きコントラスト学習を提案する。
さらに,事前学習した数値モデルにより符号化された抽出された犯罪量による事実記述の表現をさらに強化する。
論文 参考訳(メタデータ) (2022-11-15T15:53:56Z) - A Multi-Task Benchmark for Korean Legal Language Understanding and
Judgement Prediction [19.89425856249463]
韓国の法律AIデータセットであるLBox Openの大規模なベンチマークについて紹介する。
この法定コーパスは150万の韓国の先例(2億6400万トークン)で構成され、そのうち過去4年間に63万の判決が下された。
2つの分類課題は事例名(10k)と個々の事例の事実記述による法令(3k)の予測である。
LJP タスクは,(1) 1k 件の犯罪事例からなり,そのモデルに詳細な量の予測,労働への投獄,及び与えられた事実に対する労働範囲のない投獄が求められる。
論文 参考訳(メタデータ) (2022-06-10T16:51:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。