論文の概要: Freeing the Law with LOCUS: A Local Ordinance Corpus for the United States
- arxiv url: http://arxiv.org/abs/2606.19334v1
- Date: Wed, 17 Jun 2026 17:58:22 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-06-18 17:16:51.304349
- Title: Freeing the Law with LOCUS: A Local Ordinance Corpus for the United States
- Title(参考訳): LOCUS 法を解放する -アメリカ合衆国における地方条例コーパス-
- Authors: Denis Peskoff, Joe Barrow, Christopher Vu, Diag Davenport,
- Abstract要約: LOCUSは、アメリカ合衆国の市と郡条例の包括的コーパスと郡調和アクセス層である。
生のコーパスは、公共に利用可能な市と郡の条例のほとんど全てを表現している。
郡を調和させた小さなLOCUSアクセス層は、アメリカ合衆国3,144郡の2,309をカバーしている。
- 参考スコア(独自算出の注目度): 6.582641507599387
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Progress in legal AI increasingly depends on access to authoritative legal text at scale. Yet one of the most consequential layers of American law remains largely absent from existing machine-readable corpora: local ordinances. Local codes govern zoning, housing, business licensing, public health, noise, animal control, and many other domains of everyday regulation, but they are fragmented across vendor platforms designed for human browsing rather than bulk research access. We introduce LOCUS - the Local Ordinance Corpus for the United States - a comprehensive corpus and county-harmonized access layer for U.S. municipal and county ordinance codes. The raw corpus, available for release to researchers, represents nearly all publicly available municipal and county ordinance codes. The resulting raw corpus contains codes from 9,239 cities and counties. A smaller county-harmonized LOCUS access layer provides coverage for the largest 2,309 of 3,144 U.S. counties, accounting for a majority of the population. We use OCR to handle the myriad of document formats that have kept the law from being a public resource. We release the corpus with coverage metadata to support reproducibility, downstream legal AI research, and the incremental expansion of machine-readable access to local law. We train a collection of ModernBERT-based classifiers and scorers to facilitate analyzing U.S. local law among several dimensions, such as opacity and paternalism, that have not previously been studied at this scale. LOCUS-v1 and its derivative models are available at: https://huggingface.co/datasets/LocalLaws/LOCUS-v1
- Abstract(参考訳): 法的AIの進歩は、大規模に権威のある法的テキストへのアクセスにますます依存している。
しかし、アメリカの法律の最も連続した階層の1つが、既存の機械可読コーパス、すなわち地方条例にほとんど欠落している。
地方法典は、地区、住宅、事業免許、公衆衛生、騒音、動物管理など、日常的な規制の多くの領域を管轄しているが、大規模な研究アクセスではなく、人間のブラウジングのために設計されたベンダープラットフォームで断片化されている。
LOCUS - 米国地方条例コーパス - 包括的コーパスと郡調和されたアクセス層で、アメリカ合衆国市町村条例と郡条例を規定する。
生のコーパスは研究者に公開されており、市と郡の条例のほとんど全てを公にしている。
生コーパスには9,239の都市と郡のコードが含まれている。
郡を調和させた小さなLOCUSアクセス層は、人口の大半を占める3,144郡の2,309をカバーしている。
私たちはOCRを使って、法律が公開リソースにならないような、無数のドキュメントフォーマットを扱っています。
我々は、再現性、下流の法的なAI研究、および局所法への機械可読アクセスの漸進的な拡張をサポートするためのカバレッジメタデータを備えたコーパスをリリースする。
我々は、これまでこの規模で研究されていない不透明さや父性主義など、いくつかの次元における米国の地方法の分析を容易にするために、ModernBERTベースの分類器とスコアラーのコレクションを訓練する。
LOCUS-v1とその派生モデルは、https://huggingface.co/datasets/LocalLaws/LOCUS-v1で利用可能である。
関連論文リスト
- Automatic Construction of a Legal Citation Graph from 100 Million Ukrainian Court Decisions: Large-Scale Extraction, Topological Analysis, and Ontology-Driven Clustering [0.0]
ウクライナの裁判所決定から抽出された1070万件の訴訟の端は、司法の引用構造が監督なしで法域の境界をコードしていることを示している。
完全SRレジストリから最初の大規模引用グラフ(9950万全文、1.1TB)を構築する。
論文 参考訳(メタデータ) (2026-05-14T19:42:20Z) - LAMUS: A Large-Scale Corpus for Legal Argument Mining from U.S. Caselaw using LLMs [0.5830619388189558]
本稿は、アメリカ合衆国最高裁判所の決定とテキサス州の刑事法定の意見から構築された、刑期レベルの法的議論採掘コーパスであるLAMUSを紹介する。
データセットは、大規模なケースコレクション、自動アノテーション、ターゲットとする人間のループ品質改善を組み合わせた、データ中心のパイプラインを使用して作成される。
論文 参考訳(メタデータ) (2026-03-09T12:01:42Z) - Place Matters: Comparing LLM Hallucination Rates for Place-Based Legal Queries [8.865671688076574]
本研究は, クローズドソースLPMによる法情報の幻覚の頻度が, 場所と大きく関連していることを示す。
このことは、これらのモデルによって提供される法的な解の質が地理的に均等に分散していないことを示唆している。
論文 参考訳(メタデータ) (2025-11-10T04:42:00Z) - Introducing the A2AJ's Canadian Legal Data: An open-source alternative to CanLII for the era of computational law [0.07994548992827998]
Access to Algorithmic Justice Project (A2AJ) は、Candian Legal Information Institute (CanLII) の代替となるオープンソースのプロジェクトである。
この記事では、CanLIIをその大きな歴史的文脈に置き、カナダの法律データへのアクセスを民主化するための、長く深い努力がいかに長いかを示す。
A2AJのCanadian Legal Dataプロジェクトを紹介します。
論文 参考訳(メタデータ) (2025-09-16T12:51:39Z) - AI for Statutory Simplification: A Comprehensive State Legal Corpus and Labor Benchmark [5.268588811689132]
アメリカ合衆国のある州は、AIを使って州のコードの3分の1を削除したと主張している。
この領域でAI機能を評価するためのベンチマークデータセットであるLaborBenchを紹介します。
論文 参考訳(メタデータ) (2025-08-26T18:53:39Z) - List Decodable Quantum LDPC Codes [49.2205789216734]
我々は、ほぼ最適レート距離のトレードオフを持つ量子低密度パリティチェック(QLDPC)符号の構成を行う。
復号化可能なQLDPCコードとユニークなデコーダを効率よくリストアップする。
論文 参考訳(メタデータ) (2024-11-06T23:08:55Z) - GlotCC: An Open Broad-Coverage CommonCrawl Corpus and Pipeline for Minority Languages [53.56700754408902]
GlotCCは、ClomCrawlから派生した、クリーンでドキュメントレベルの2TBの汎用ドメインコーパスである。
我々はGlotCCと、それを生成するためのシステムを作成し、研究コミュニティに提供します。
論文 参考訳(メタデータ) (2024-10-31T11:14:12Z) - SILO Language Models: Isolating Legal Risk In a Nonparametric Datastore [159.21914121143885]
推論中にこのリスクパフォーマンストレードオフを管理する新しい言語モデルであるSILOを提案する。
SILOは(1)オープンライセンスコーパス(OLC)上でパラメトリックLMをトレーニングすることで構築されます。
データストアへのアクセスはドメインのパフォーマンスを大幅に改善し、PileでトレーニングされたLMでパフォーマンスギャップの90%を閉じる。
論文 参考訳(メタデータ) (2023-08-08T17:58:15Z) - \textit{StateCensusLaws.org}: A Web Application for Consuming and
Annotating Legal Discourse Learning [89.77347919191774]
法律テキストの対話セグメントを解析およびラベル付けするために訓練されたNLPモデルの出力を強調表示するためのWebアプリケーションを作成します。
我々は、米国国勢調査人口を用いて資源を割り当て、政府を組織する州レベルの法律に焦点を当てる。
論文 参考訳(メタデータ) (2021-04-20T22:00:54Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。