論文の概要: IndianBailJudgments-1200: A Multi-Attribute Dataset for Legal NLP on Indian Bail Orders
- arxiv url: http://arxiv.org/abs/2507.02506v1
- Date: Thu, 03 Jul 2025 10:13:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-04 15:37:16.170967
- Title: IndianBailJudgments-1200: A Multi-Attribute Dataset for Legal NLP on Indian Bail Orders
- Title(参考訳): IndianBailJudgments-1200: インドのベイル注文に関する法的NLPのためのマルチ属性データセット
- Authors: Sneha Deshmukh, Prathmesh Kamble,
- Abstract要約: インドのような地域では、構造化データセットが不足しているため、法的NLPは未発達のままである。
IndianBailJudgments-1200は、保釈決定に関する1200のインドの裁判所判決を含む新しいベンチマークである。
データセットはプロンプトエンジニアリングされたGPT-4oパイプラインを使用してアノテートされ、一貫性が検証された。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Legal NLP remains underdeveloped in regions like India due to the scarcity of structured datasets. We introduce IndianBailJudgments-1200, a new benchmark dataset comprising 1200 Indian court judgments on bail decisions, annotated across 20+ attributes including bail outcome, IPC sections, crime type, and legal reasoning. Annotations were generated using a prompt-engineered GPT-4o pipeline and verified for consistency. This resource supports a wide range of legal NLP tasks such as outcome prediction, summarization, and fairness analysis, and is the first publicly available dataset focused specifically on Indian bail jurisprudence.
- Abstract(参考訳): インドのような地域では、構造化データセットが不足しているため、法的NLPは未発達のままである。
IndianBailJudgments-1200は、保釈決定に関する1200のインドの裁判所判決からなる新しいベンチマークデータセットであり、保釈結果、IPCセクション、犯罪タイプ、法的推論を含む20以上の属性に注釈付けされている。
アノテーションはプロンプトエンジニアリングされたGPT-4oパイプラインを使用して生成され、一貫性が検証された。
このリソースは、結果予測、要約、公平性分析などの幅広い法的NLPタスクをサポートし、インド保釈法に焦点を絞った最初の公開データセットである。
関連論文リスト
- AppealCase: A Dataset and Benchmark for Civil Case Appeal Scenarios [47.83822985839837]
本稿では,91件の民事事件の1万対の実世界と一致した第1インスタンスと第2インスタンスの文書からなるFiceCaseデータセットを提案する。
このデータセットには、判断の逆転、逆転理由、引用された法的規定、クレームレベルの決定、第2のインスタンスに新たな情報があるかどうかという5つの側面に沿った詳細なアノテーションも含まれている。
実験結果から, すべてのモデルが判定逆転予測タスクにおいて50%未満のF1スコアを達成し, 魅力シナリオの複雑さと課題を浮き彫りにしていることがわかった。
論文 参考訳(メタデータ) (2025-05-22T10:50:33Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - NyayaAnumana & INLegalLlama: The Largest Indian Legal Judgment Prediction Dataset and Specialized Language Model for Enhanced Decision Analysis [5.790242888372048]
本稿では,インドにおける判例の最大かつ多種多様なコーパスであるNyayaAnumanaについて紹介する。
ニヤヤ・アヌナナには最高裁判所、高等裁判所、法廷、地方裁判所、日刊令など幅広い事件がある。
InLegalLlamaは,インド法体系の複雑さに合わせたドメイン固有生成型大規模言語モデル(LLM)である。
論文 参考訳(メタデータ) (2024-12-11T13:50:17Z) - Convolutional Neural Networks can achieve binary bail judgement
classification [0.5013868868152144]
我々は,ヒンディー語法文書のコーパス上に,畳み込みニューラルネットワーク(CNN)アーキテクチャをデプロイする。
我々はCNNモデルの助けを借りて保釈予測を行い、全体的な精度は93%である。
論文 参考訳(メタデータ) (2024-01-25T12:31:41Z) - SLJP: Semantic Extraction based Legal Judgment Prediction [0.0]
LJP(Lawal Judgment Prediction)は、像、刑期、刑期などの法的要素を推奨する司法支援システムである。
既存のインドのモデルのほとんどは、決定に影響を及ぼす事実記述(FD)に埋め込まれた意味論に十分に集中していなかった。
提案した意味抽出に基づく LJP (SLJP) モデルは, 複雑な非構造化の判例文書理解のための事前学習型変換器の利点を提供する。
論文 参考訳(メタデータ) (2023-12-13T08:50:02Z) - CSPRD: A Financial Policy Retrieval Dataset for Chinese Stock Market [61.59326951366202]
我々は、中国株式政策検索データセット(CSPRD)を導入して、新たな課題である政策検索を提案する。
CSPRDは、中国の政策コーパスの10k以上の項目から、経験豊富な専門家によってラベル付けされた700以上のパスを提供する。
我々の最高のパフォーマンスベースラインは56.1% MRR@10、28.5% NDCG@10、37.5% Recall@10、80.6% Precision@10である。
論文 参考訳(メタデータ) (2023-09-08T15:40:54Z) - Predicting delays in Indian lower courts using AutoML and Decision
Forests [0.0]
本稿では,出願時に利用可能な事例情報に基づいて,インドの下級裁判所における遅延を予測する分類モデルを提案する。
このモデルは2010年に提出された4200万件の訴訟のデータセットと、10年間にわたる結果に基づいて構築されている。
最良のモデルは81.4%の精度を達成し、精度、リコール、F1は0.81であることが判明した。
論文 参考訳(メタデータ) (2023-07-30T17:41:47Z) - A Survey on Legal Judgment Prediction: Datasets, Metrics, Models and
Challenges [73.34944216896837]
法定判断予測(LJP)は,事実記述に基づく判断結果の自動予測に自然言語処理(NLP)技術を適用している。
6言語で31のLJPデータセットを分析し、その構築過程を示し、LJPの分類方法を定義する。
異なる訴訟の8つの代表的データセットに対する最先端の結果を示し、オープンな課題について議論する。
論文 参考訳(メタデータ) (2022-04-11T04:06:28Z) - LawSum: A weakly supervised approach for Indian Legal Document
Summarization [1.7284359928761968]
インド最高裁判所が提供した1万以上の判決からなる新たなデータセットを提案する。
提案したデータセットは、一般的な法的略語を正規化することによって前処理される。
私たちはまた、日付、原告の名前、被告人、およびそれらを代表する人々といったいくつかの属性で、各判断に注釈を付けます。
論文 参考訳(メタデータ) (2021-10-04T04:54:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。