論文の概要: Zero- and Few-Shot Named-Entity Recognition: Case Study and Dataset in the Crime Domain (CrimeNER)
- arxiv url: http://arxiv.org/abs/2603.02150v1
- Date: Mon, 02 Mar 2026 18:12:02 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-03 19:50:57.023956
- Title: Zero- and Few-Shot Named-Entity Recognition: Case Study and Dataset in the Crime Domain (CrimeNER)
- Title(参考訳): ゼロショットとFewショットのエンティティ認識:犯罪ドメインにおけるケーススタディとデータセット(CrimeNER)
- Authors: Miguel Lopez-Duran, Julian Fierrez, Aythami Morales, Daniel DeAlcala, Gonzalo Mancera, Javier Irigoyen, Ruben Tolosana, Oscar Delgado, Francisco Jurado, Alvaro Ortigosa,
- Abstract要約: 犯罪関連ゼロ・Few-Shot NERのケーススタディであるCrimNERと一般犯罪関連名前認識データベース(CrimeNERdb)について述べる。
5種類の粗大犯罪と,22種類の微粒犯罪を定義した。
ケーススタディとアノテートデータの品質を,汎用的かつ一般的に使用されている大言語モデルだけでなく,現状NERモデルを用いたZeroおよびFew-Shot設定の実験により論じる。
- 参考スコア(独自算出の注目度): 13.568340126196153
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The extraction of critical information from crime-related documents is a crucial task for law enforcement agencies. Named-Entity Recognition (NER) can perform this task in extracting information about the crime, the criminal, or law enforcement agencies involved. However, there is a considerable lack of adequately annotated data on general real-world crime scenarios. To address this issue, we present CrimeNER, a case-study of Crime-related zero- and Few-Shot NER, and a general Crime-related Named-Entity Recognition database (CrimeNERdb) consisting of more than 1.5k annotated documents for the NER task extracted from public reports on terrorist attacks and the U.S. Department of Justice's press notes. We define 5 types of coarse crime entity and a total of 22 types of fine-grained entity. We address the quality of the case-study and the annotated data with experiments on Zero and Few-Shot settings with State-of-the-Art NER models as well as generalist and commonly used Large Language Models.
- Abstract(参考訳): 犯罪関連文書から重要な情報を抽出することは、法執行機関にとって重要な課題である。
名前付きエンティティ認識(NER)は、犯罪、犯罪者、法執行機関に関する情報を抽出する作業を行うことができる。
しかし、一般的な実世界の犯罪シナリオに関する十分な注釈付きデータが不足している。
この問題に対処するため,犯罪関連ゼロ・Few-Shot NERのケーススタディであるCrimNERと,テロリスト攻撃の公的な報告と米国司法省のプレスリリースから抽出されたNERタスクに関する1.5万件以上の注釈付き文書からなる一般犯罪関連名前付きエンティティ認識データベース(CrimeNERdb)を提示する。
5種類の粗大犯罪と,22種類の微粒犯罪を定義した。
ケーススタディとアノテートデータの品質を,汎用的かつ一般的に使用されている大言語モデルだけでなく,現状NERモデルを用いたZeroおよびFew-Shot設定の実験により論じる。
関連論文リスト
- Assessing Crime Disclosure Patterns in a Large-Scale Cybercrime Forum [0.0]
本研究は,大手サイバー犯罪フォーラムにおける犯罪開示パターンの大規模評価を初めて行った。
初投稿における犯罪情報開示のレベルを測定し、参加者がどのようにレベルを切り替えるかを分析し、犯罪情報開示行動がプライベートコミュニケーションにどのように関係するかを評価する。
論文 参考訳(メタデータ) (2026-03-02T08:59:32Z) - Agents of Chaos [50.53354213047402]
実験室環境に展開する自律言語モデルを用いたエージェントの探索的再チームの研究を報告する。
20人のAI研究者が、良心的および敵対的な条件下でエージェントと対話した。
我々の発見は、現実的なデプロイメント設定におけるセキュリティ、プライバシ、ガバナンスに関連する脆弱性の存在を確立します。
論文 参考訳(メタデータ) (2026-02-23T16:28:48Z) - ClaimGen-CN: A Large-scale Chinese Dataset for Legal Claim Generation [56.79698529022327]
法的な主張は、事件における原告の要求を言及し、法的理由づけと事件解決を導くのに不可欠である。
本稿では,その事例の事実に基づく法的クレーム生成の問題について考察する。
われわれは,中国法定クレーム生成タスクの最初のデータセットであるClaymGen-CNを構築した。
論文 参考訳(メタデータ) (2025-08-24T07:19:25Z) - AnnoCaseLaw: A Richly-Annotated Dataset For Benchmarking Explainable Legal Judgment Prediction [56.797874973414636]
AnnoCaseLawは、アメリカ合衆国控訴裁判所の無視事件を慎重に注釈付けした471のデータセットである。
我々のデータセットは、より人間らしく説明可能な法的な判断予測モデルの基礎となる。
その結果、LJPは依然として厳しい課題であり、法的な前例の適用は特に困難であることが示されている。
論文 参考訳(メタデータ) (2025-02-28T19:14:48Z) - An Exploratory Case Study on Data Breach Journalism [0.19116784879310028]
本稿では、Databreaches.netの事例を通して、データ侵害ジャーナリズムとデータ侵害ニュースの新たな話題について考察する。
伝統的な犯罪ニュースや犯罪ジャーナリズムの問題に触発され、テキストマイニングによって調査される。
論文 参考訳(メタデータ) (2024-05-02T16:31:16Z) - TransCrimeNet: A Transformer-Based Model for Text-Based Crime Prediction
in Criminal Networks [2.7242259996251197]
本稿では,テキストデータから犯罪ネットワークの将来の犯罪を予測するトランスフォーマーモデルであるTransCrimeNetを提案する。
実世界の犯罪ネットワークデータセットの実験では、TransCrimeNetは犯罪予測のためのF1スコアの12.7%で過去の最先端モデルを上回っている。
論文 参考訳(メタデータ) (2023-11-16T03:14:58Z) - MUSER: A Multi-View Similar Case Retrieval Dataset [65.36779942237357]
類似事例検索(SCR)は、司法公正の促進に重要な役割を果たす代表的法的AIアプリケーションである。
既存のSCRデータセットは、ケース間の類似性を判断する際にのみ、事実記述セクションにフォーカスする。
本稿では,多視点類似度測定に基づく類似事例検索データセットMと,文レベル法定要素アノテーションを用いた包括的法定要素を提案する。
論文 参考訳(メタデータ) (2023-10-24T08:17:11Z) - Crime Prediction using Machine Learning with a Novel Crime Dataset [0.0]
バングラデシュは貧困、人口増加、その他多くの社会経済的問題による犯罪率が高い。
法執行機関にとって、将来の犯罪活動を防ぐためには犯罪パターンを理解することが不可欠である。
本稿では,バングラデシュにおける6574件の犯罪事件に関する時間的,地理的,天気,人口統計データを含む新たな犯罪データセットを提案する。
論文 参考訳(メタデータ) (2022-11-03T01:55:52Z) - Spatial-Temporal Sequential Hypergraph Network for Crime Prediction [56.41899180029119]
本稿では,複合犯罪の時空間パターンを包括的に符号化する時空間逐次ハイパーグラフネットワーク(ST-SHN)を提案する。
特に、長距離及びグローバルなコンテキスト下での時空間力学を扱うために、グラフ構造化されたメッセージパッシングアーキテクチャを設計する。
提案するST-SHNフレームワークは予測性能を大幅に向上させることができることを示す。
論文 参考訳(メタデータ) (2022-01-07T12:46:50Z) - The effect of differential victim crime reporting on predictive policing
systems [84.86615754515252]
本研究では, 被害者の犯罪報告率の違いが, 共通犯罪ホットスポット予測モデルにおいて, 結果の相違をもたらすことを示す。
以上の結果から, 犯罪報告率の差は, 高犯罪から低犯罪へ, 高犯罪・中犯罪・高報道へ, 予測ホットスポットの移動につながる可能性が示唆された。
論文 参考訳(メタデータ) (2021-01-30T01:57:22Z) - Extracting Entities and Topics from News and Connecting Criminal Records [6.685013315842082]
本稿では,犯罪記録データベースや新聞データベースからエンティティやトピックを抽出する手法を要約する。
統計モデルは、約30,000のニューヨーク・タイムズの記事のトピックの研究に成功している。
分析的アプローチ、特にホットスポットマッピングは、将来犯罪の場所や状況を予測するためにいくつかの研究で使用された。
論文 参考訳(メタデータ) (2020-05-03T00:06:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。