論文の概要: Gini Score under Ties and Case Weights
- arxiv url: http://arxiv.org/abs/2511.15446v1
- Date: Wed, 19 Nov 2025 14:01:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-20 15:51:28.832834
- Title: Gini Score under Ties and Case Weights
- Title(参考訳): ジニ・スコア、ティーズとケース・ウェイトに-関係者
- Authors: Alexej Brauer, Mario V. Wüthrich,
- Abstract要約: Giniスコアは、リスクランキングを評価することができるランクベースのスコアである。
本稿では,リスクランキングの関連性において,ジニスコアをどのように活用できるかを論じる。
我々はケースウェイトを持つ一般的なアクチュアリな状況にGiniスコアを適応させる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The Gini score is a popular tool in statistical modeling and machine learning for model validation and model selection. It is a purely rank based score that allows one to assess risk rankings. The Gini score for statistical modeling has mainly been used in a binary context, in which it has many equivalent reformulations such as the receiver operating characteristic (ROC) or the area under the curve (AUC). In the actuarial literature, this rank based score for binary responses has been extended to general real-valued random variables using Lorenz curves and concentration curves. While these initial concepts assume that the risk ranking is generated by a continuous distribution function, we discuss in this paper how the Gini score can be used in the case of ties in the risk ranking. Moreover, we adapt the Gini score to the common actuarial situation of having case weights.
- Abstract(参考訳): Giniスコアは、モデル検証とモデル選択のための統計モデリングと機械学習で人気のあるツールである。
純粋にランクに基づくスコアであり、リスクランキングを評価することができる。
統計モデリングのためのジーニスコアは、主に二項文脈で使われており、受信操作特性(ROC)や曲線下領域(AUC)など、多くの等価な修正がなされている。
この階数に基づく二値応答のスコアは、ロレンツ曲線と集中曲線を用いた一般実数値確率変数にまで拡張されている。
これらの初期概念は, リスクランキングが連続分布関数によって生成されることを前提としているが, 本論文では, リスクランキングの関連性において, ジニスコアをどのように活用できるかを論じる。
さらに,ケースウェイトを有する一般的なアクチュアリな状況にGiniスコアを適用した。
関連論文リスト
- Reference-Free Rating of LLM Responses via Latent Information [53.463883683503106]
本研究では,判断モデルに対して,自由テキスト応答にQuattスケールのスコアを割り当てるよう依頼する一般的な実践について検討する。
次に、内部モデル信号からスカラー評価を導出する潜在裁判官を提案し、評価する。
ペアとシングルレーティングのベンチマークの幅広いスイートの中で、潜在メソッドは標準のプロンプトにマッチするか、超えている。
論文 参考訳(メタデータ) (2025-09-29T12:15:52Z) - A Novel Characterization of the Population Area Under the Risk Coverage Curve (AURC) and Rates of Finite Sample Estimators [22.231565523932286]
AURC(Area Under the Risk-Coverage Curve)は、SCシステムの性能を評価するための最前線評価指標として登場した。
有限サンプルシナリオに対する実験的なAURCプラグイン推定器を導出する。
複数のデータセットにまたがる実験により,推定器の有効性を実証的に検証した。
論文 参考訳(メタデータ) (2024-10-20T11:14:51Z) - Controlling Risk of Retrieval-augmented Generation: A Counterfactual Prompting Framework [77.45983464131977]
我々は、RAGモデルの予測が誤りであり、現実のアプリケーションにおいて制御不能なリスクをもたらす可能性がどの程度あるかに焦点を当てる。
本研究は,RAGの予測に影響を及ぼす2つの重要な潜伏要因を明らかにする。
我々は,これらの要因をモデルに誘導し,その応答に与える影響を解析する,反実的プロンプトフレームワークを開発した。
論文 参考訳(メタデータ) (2024-09-24T14:52:14Z) - Leveraging Uncertainty Estimates To Improve Classifier Performance [4.4951754159063295]
バイナリ分類では、正のクラスのモデルスコアが、アプリケーション要求に基づいて選択されたしきい値を超えるかどうかに基づいて、インスタンスのラベルを予測する。
しかし、モデルスコアは真の肯定率と一致しないことが多い。
これは特に、クラス間の差分サンプリングを含むトレーニングや、トレインとテスト設定間の分散ドリフトがある場合に当てはまる。
論文 参考訳(メタデータ) (2023-11-20T12:40:25Z) - Sample Complexity Bounds for Score-Matching: Causal Discovery and
Generative Modeling [82.36856860383291]
我々は,標準深部ReLUニューラルネットワークをトレーニングすることにより,スコア関数の正確な推定が可能であることを実証した。
スコアマッチングに基づく因果発見手法を用いて因果関係の回復の誤差率の限界を確立する。
論文 参考訳(メタデータ) (2023-10-27T13:09:56Z) - Risk Aware Benchmarking of Large Language Models [36.95053112313244]
本稿では,統計的に有意な基礎モデルの社会技術的リスクを定量的に評価するための分布的枠組みを提案する。
本試験における2次統計は,計量学や数理ファイナンスでよく用いられる平均リスクモデルと関連していることを示す。
筆者らは,本フレームワークを用いて,命令からのドリフトや有害なコンテンツの出力に関連するリスクに関する,さまざまな大規模言語モデルを比較した。
論文 参考訳(メタデータ) (2023-10-11T02:08:37Z) - Local Risk Bounds for Statistical Aggregation [5.940699390639279]
我々は、Lung と Barron による指数重み推定器の古典的境界の局所化バージョンと Q-集約推定器の偏差最適境界を証明した。
これらの境界は、固定設計回帰のための Dai, Rigollet と Zhang の結果とランダム設計回帰のための Lecu'e と Rigollet の結果よりも改善されている。
論文 参考訳(メタデータ) (2023-06-29T17:51:42Z) - GREAT Score: Global Robustness Evaluation of Adversarial Perturbation using Generative Models [60.48306899271866]
GREATスコア(GREAT Score)と呼ばれる新しいフレームワークを提案する。
我々は,ロバストベンチにおける攻撃ベースモデルと比較し,高い相関性を示し,GREATスコアのコストを大幅に削減した。
GREAT Scoreは、プライバシーに敏感なブラックボックスモデルのリモート監査に使用することができる。
論文 参考訳(メタデータ) (2023-04-19T14:58:27Z) - Learning Fair Scoring Functions: Bipartite Ranking under ROC-based
Fairness Constraints [2.0263791972068628]
2値ラベル付きデータからスコアリング関数を学習する際の公平性について検討する。
AUC と ROC 曲線に基づくフェアネス定義の一般族を紹介する。
このような制約の下で学習したスコアリング関数の有界一般化を確立する。
論文 参考訳(メタデータ) (2020-02-19T13:17:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。