Fugu-MT 論文翻訳(概要): The Likelihood Ratio Wall: Structural Limits on Accurate Risk Assessment for Rare Violence

論文の概要: The Likelihood Ratio Wall: Structural Limits on Accurate Risk Assessment for Rare Violence

arxiv url: http://arxiv.org/abs/2604.27282v1
Date: Thu, 30 Apr 2026 00:32:52 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-01 16:31:53.851795
Title: The Likelihood Ratio Wall: Structural Limits on Accurate Risk Assessment for Rare Violence
Title（参考訳）: レアバイオレンスの正確なリスクアセスメントに関する構造的限界
Authors: Marco Pollanen,
Abstract要約: 裁判前リスクアセスメントツールは、毎年100万人以上の米国被告に対して使用されている。稀な暴力的再犯を予測するために使用されることは、基本的な統計的障壁に直面している。
参考スコア（独自算出の注目度）: 0.0
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Pretrial risk assessment tools are used on over one million U.S. defendants each year, yet their use for predicting rare violent re-offense faces a basic statistical barrier. We derive a universal precision bound -- the Likelihood Ratio Wall -- showing that when violent re-arrest rates are low (2-5%), achieving even a 50% hit rate among people labeled "high risk" (positive predictive value, or PPV) would require tools far more discriminative than current instruments appear to be. For rare outcomes, a tool can have respectable-looking performance metrics and still be wrong most of the time it flags someone as "high risk for violence." We show that post-hoc score recalibration cannot solve this problem because it does not improve the tool's underlying ability to separate true positives from false positives. We further prove a Surveillance Ceiling: when over-policing inflates recorded "risk factors" among those who would not re-offend, the maximum achievable precision is structurally lower for over-policed groups, even at equal offense rates. We translate these results into the Number Needed to Detain (how many people must be detained to prevent one violent offense), and propose that risk reports should communicate this uncertainty explicitly. Our findings suggest that for rare violent outcomes, debates about fairness metrics alone are incomplete: under current data regimes, the available features may not support high-confidence individualized detention decisions.
Abstract（参考訳）: 毎年100万人以上の米国被告に対して事前リスク評価ツールが使用されているが、希少な暴力的再犯の予測には統計上の障壁が伴う。暴力的な再休息率が低い場合(2-5%)、「高いリスク」(肯定的な予測値、PPV)とラベル付けされた人々の間で50%のヒット率を達成するには、現在の楽器よりもはるかに差別的なツールが必要であることを示しています。まれな結果に対して、ツールには見栄えのよいパフォーマンス指標があり、それでも“暴力のリスクが高い”と宣言する場合がほとんどです。偽陽性から真陽性を分離するツールの根底にある能力は改善されないため,ポストホックスコアの校正ではこの問題は解決できない。再犯しない者の間で「危険因子」が記録されている場合, 同一の犯罪率であっても, 過度の犯罪率においても, 達成可能な最大精度は構造的に低い。これらの結果を留置するために必要な番号(暴力的な犯罪を防ぐために何人が拘束されなければならないのか)に翻訳し、リスクレポートが明確にこの不確実性を伝えるべきだと提案する。我々の研究結果は、稀な暴力的な結果に対して、公正度に関する指標に関する議論は不完全であることを示している。

関連論文リスト

A Coin Flip for Safety: LLM Judges Fail to Reliably Measure Adversarial Robustness [57.510025257780306]
既存の検証プロトコルは、レッドチーム固有の分散シフトを考慮できないことを示す。我々は、より一貫して判断可能な振る舞いのベンチマークであるReliableBenchと、判断失敗を公開するために設計されたデータセットであるJiceStressTestを提案する。
論文参考訳（メタデータ） (2026-02-04T15:13:35Z)
Statistical Estimation of Adversarial Risk in Large Language Models under Best-of-N Sampling [50.872910438715486]
大規模言語モデル(LLM)は、通常、単一ショットまたは低予算の逆のプロンプトの下で安全性を評価する。我々は,Best-of-Nサンプリングの下でのジェイルブレイク脆弱性をモデル化するための,スケーリング対応のリスク推定手法であるSABERを提案する。
論文参考訳（メタデータ） (2026-01-30T06:54:35Z)
COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。 COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文参考訳（メタデータ） (2025-06-25T07:04:49Z)
Criticality and Safety Margins for Reinforcement Learning [53.10194953873209]
我々は,定量化基盤真理とユーザにとっての明確な意義の両面から,批判的枠組みを定めようとしている。エージェントがn連続的ランダム動作に対するポリシーから逸脱した場合の報酬の減少として真臨界を導入する。我々はまた、真の臨界と統計的に単調な関係を持つ低オーバーヘッド計量であるプロキシ臨界の概念も導入する。
論文参考訳（メタデータ） (2024-09-26T21:00:45Z)
The Progression of Disparities within the Criminal Justice System: Differential Enforcement and Risk Assessment Instruments [26.018802058292614]
アルゴリズム的リスク評価手段(RAI)は、刑事司法における意思決定をますます通知する。問題となるのは、逮捕が全体的違反を反映する程度は、その人の性格によって異なる可能性があることである。犯罪と逮捕率の切り離しがRAIとその評価に与える影響について検討する。
論文参考訳（メタデータ） (2023-05-12T16:06:40Z)
Safe Deployment for Counterfactual Learning to Rank with Exposure-Based Risk Minimization [63.93275508300137]
本稿では,安全な配置を理論的に保証する新たなリスク認識型対実学習ランク法を提案する。提案手法の有効性を実験的に検証し,データが少ない場合の動作不良の早期回避に有効であることを示す。
論文参考訳（メタデータ） (2023-04-26T15:54:23Z)
Holdouts set for safe predictive model updating [0.4499833362998489]
リスクスコアによって導かれる介入を受けない集団のサブセットであるホールドアウトセット(holdout set)の使用を提案する。予防接種前の症例数を最小化するためには,約1万件のホールドアウトセットを用いて実施することが最善であることを示す。
論文参考訳（メタデータ） (2022-02-13T18:04:00Z)
A Risk Assessment of a Pretrial Risk Assessment Tool: Tussles, Mitigation Strategies, and Inherent Limits [0.0]
我々は、サンフランシスコやその他の司法管轄区域で使用されているソフトウェアである公衆安全評価(PSA)のリスクアセスメントを実施し、裁判の前に被告を拘留する必要があるかどうかを判断する裁判官を支援する。我々はPSAソリューションの利点と限界を明確にし、緩和戦略を提案する。そして、我々は、デザインによるリスクアセスメントツールの本質的な制限を満たす、新しいアルゴリズムによる事前審理のアプローチであるハンドオフツリーを草案化した。
論文参考訳（メタデータ） (2020-05-14T23:56:57Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。