論文の概要: Causal Label Recovery in Payment Networks
- arxiv url: http://arxiv.org/abs/2605.29272v1
- Date: Thu, 28 May 2026 02:43:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-30 02:45:55.599861
- Title: Causal Label Recovery in Payment Networks
- Title(参考訳): 支払ネットワークにおける因果ラベルの回復
- Authors: Gaurav Dhama,
- Abstract要約: 支払いネットワークにおける不正検出モデルは、体系的にバイアスのあるチャージバックラベルでトレーニングする。
共用紙 [arXiv05:26.27557] は、これらの4つの障害が検出性能に最小限の上限を課すことを示した。
観測パイプラインを3段階, 破損層を有する逐次欠落データ問題として定式化し, 逐次トリプライロバスト推定器を構築した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Fraud detection models in payment networks train on chargeback labels that are systematically biased. Every label must survive three sequential gates: authorization (declined transactions generate no labels), issuer reporting (unreported fraud is invisible), and delay (pending chargebacks are missing at training time). Labels that do arrive may be corrupted by first-party misuse or issuer misclassification. A companion paper [arXiv:2605.27557] proved that these four impairments impose a minimax lower bound on detection performance. This paper asks: can that bound be achieved? We formalize the observation pipeline as a sequential missing-data problem with three propensity stages and a corruption layer, and construct the Sequential Triply Robust (STR) estimator. The STR corrects for all four impairments simultaneously and achieves the semiparametric efficiency bound -- no estimator can have lower asymptotic variance. It is sequentially triply robust: at each gate, consistency requires only that either the propensity model or the outcome regression is correctly specified, not both. We provide corruption correction via noise-rate-adjusted pseudo-labels, empirical Bayes shrinkage to stabilize inverse-propensity weights for small issuers, a plug-in variance estimator yielding valid confidence intervals, and a Bernstein concentration inequality for finite-sample guarantees. On the operational side, we derive the optimal training delay -- the maturity window that minimizes the sum of label-quality loss and model staleness -- and prove that the STR permits training on data that is days old rather than months old, decoupling model freshness from the chargeback maturity cycle. The STR provably dominates naive chargeback-based training in mean squared error for any sample size.
- Abstract(参考訳): 支払いネットワークにおける不正検出モデルは、体系的にバイアスのあるチャージバックラベルでトレーニングする。
すべてのラベルは、認証(削除されたトランザクションはラベルを生成しない)、発行者報告(未報告の不正は見えない)、遅延(トレーニング時にチャージバックが欠落している)の3つのシーケンシャルゲートを存続させなければならない。
到着したラベルは、第三者の誤用や発行者の誤分類によって破損する可能性がある。
共用紙 [arXiv:2605.27557] は、これらの4つの障害が検出性能に最小限の上限を課すことを証明した。
この論文は、次のような質問をしている。
観測パイプラインを3つの確率ステージと破損層を持つ逐次欠落データ問題として定式化し、逐次トリプライロバスト推定器(STR)を構築した。
STRは4つの障害を同時に修正し、半パラメトリック効率境界を達成する。
各ゲートでは、整合性は正当性モデルまたは結果回帰のいずれかが正しく指定されるだけで、両方ではない。
我々は、ノイズレート調整擬似ラベルによる汚損補正、小さな発行者に対する逆正当性重みを安定化するための経験的ベイズ収縮、有効な信頼区間を出力するプラグイン分散推定器、有限サンプル保証のためのバーンスタイン濃度不等式を提供する。
運用面では、ラベル品質の損失とモデルの安定性の合計を最小化する成熟度ウィンドウである最適なトレーニング遅延を導出します。
STRは、任意のサンプルサイズに対して平均2乗誤差で、ナイーブなチャージバックベースのトレーニングを確実に支配する。
関連論文リスト
- When to Trust Confidence Thresholding: Calibration Diagnostics for Pseudo-Labelled Regression [1.14219428942199]
標準的なプラクティスは、信頼性カットオフで校正されたスコアをしきい値にし、ハードラベルを真実として扱うことである。
疑似ラベリングパイプラインのためのキャリブレーション対応診断装置を開発した。
我々は、下流回帰係数において信頼しきい値が誘導する減衰バイアスの閉形式式を導出する。
論文 参考訳(メタデータ) (2026-05-12T21:49:11Z) - Bootstrapping with AI/ML-generated labels [0.0]
推定されたラベルを用いてデータを生成するが、推定において破損したバージョンに依存している、一見自然な固定ラベルブートストラップは、強い独立条件が満たさない限り、一般的には無効であることを示す。
本報告では, 真のラベルとインプットを併用したブートストラップを提案し, この条件を使わずに有効であることを示す。
シミュレーションの手法を概説し、賃金とリモートワークの状況との関係について検討する。
論文 参考訳(メタデータ) (2026-04-26T15:48:03Z) - Self-Calibrating Language Models via Test-Time Discriminative Distillation [18.46710400838861]
大規模言語モデル(LLM)は、しばしば間違って答える質問に対して体系的に過度に信頼されている。
我々は、テスト時間トレーニング(TTT)パイプラインである$textbfSECL$ ($textbfSE$lf-$textbfC$alibrating $textbfL$anguage Modelsを紹介します。
論文 参考訳(メタデータ) (2026-03-18T13:28:50Z) - Online Bayesian Imbalanced Learning with Bregman-Calibrated Deep Networks [0.7106986689736825]
本報告では、クラス優先の仮定から確率比の推定を分離する原則的フレームワークであるOBIL(TextitOnline Bayesian Im Balanced Learning)を提案する。
我々のアプローチは、ブレグマンの発散と適切なスコアリングルールとの確立された接続に基づいて、そのような損失で訓練されたディープネットワークが後続確率推定を生成することを示す。
これらの確率比の推定は、クラス事前およびコスト構造における任意の変化の下でも有効であり、最適なベイズ決定のためのしきい値調整のみを必要とすることを証明している。
論文 参考訳(メタデータ) (2026-02-08T21:23:00Z) - Reliable Active Learning from Unreliable Labels via Neural Collapse Geometry [5.1511135538176]
アクティブラーニング(AL)は、情報的なサンプルを優先順位付けすることでアノテーションのコストを削減することを約束するが、ラベルがうるさい場合やデータ分散がシフトした場合、その信頼性は低下する。
本稿では,深層ネットワークの創発的幾何学的規則性を活用し,信頼できない監視に対処するフレームワークである能動学習(NCAL-R)を提案する。
論文 参考訳(メタデータ) (2025-10-10T17:50:31Z) - Reinforcement Learning with Verifiable yet Noisy Rewards under Imperfect Verifiers [90.50039419576807]
RLVR(Reinforcement Learning with Verifiable Rewards)は、人為的なラベル付けを避けるために、自動検証に対するポリシーを訓練する。
認証ハッキングの脆弱性を軽減するため、多くのRLVRシステムはトレーニング中にバイナリ$0,1$の報酬を破棄する。
この選択にはコストがかかる:textitfalse negatives(正しい回答、FNを拒絶)とtextitfalse positives(間違った回答、FPを受け入れる)を導入する。
論文 参考訳(メタデータ) (2025-10-01T13:56:44Z) - Label Distributionally Robust Losses for Multi-class Classification:
Consistency, Robustness and Adaptivity [55.29408396918968]
多クラス分類のためのラベル分布ロバスト(LDR)損失という損失関数群について検討した。
我々の貢献は、多クラス分類のためのLDR損失のトップ$kの一貫性を確立することによって、一貫性と堅牢性の両方を含んでいる。
本稿では,各インスタンスのクラスラベルの雑音度に個別化温度パラメータを自動的に適応させる適応型LDR損失を提案する。
論文 参考訳(メタデータ) (2021-12-30T00:27:30Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。