論文の概要: Global Sequential Testing for Multi-Stream Auditing
- arxiv url: http://arxiv.org/abs/2602.21479v1
- Date: Wed, 25 Feb 2026 01:10:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-26 18:19:16.663007
- Title: Global Sequential Testing for Multi-Stream Auditing
- Title(参考訳): マルチストリーム監査のためのグローバルシーケンステスト
- Authors: Beepul Bharti, Ambar Pal, Jeremias Sulam,
- Abstract要約: 機械学習システムの性能を継続的に監査し、異常な振る舞いを素早く検出することが重要である。
これは、$k$のデータストリームとグローバルなヌル仮説によるシーケンシャルな仮説テスト問題としてモデル化できる。
実験マーチンガレットとトレードオフの異なるマーチンガレットを、異なる、疎い、あるいは密度の高い代替仮説の下で、期待停止時間にマージングするアイデアを用いて、新しいシーケンシャルテストを構築する。
- 参考スコア(独自算出の注目度): 13.390852646411929
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Across many risk-sensitive areas, it is critical to continuously audit the performance of machine learning systems and detect any unusual behavior quickly. This can be modeled as a sequential hypothesis testing problem with $k$ incoming streams of data and a global null hypothesis that asserts that the system is working as expected across all $k$ streams. The standard global test employs a Bonferroni correction and has an expected stopping time bound of $O\left(\ln\frac{k}α\right)$ when $k$ is large and the significance level of the test, $α$, is small. In this work, we construct new sequential tests by using ideas of merging test martingales with different trade-offs in expected stopping times under different, sparse or dense alternative hypotheses. We further derive a new, balanced test that achieves an improved expected stopping time bound that matches Bonferroni's in the sparse setting but that naturally results in $O\left(\frac{1}{k}\ln\frac{1}α\right)$ under a dense alternative. We empirically demonstrate the effectiveness of our proposed tests on synthetic and real-world data.
- Abstract(参考訳): 多くの危険に敏感な領域において、機械学習システムの性能を継続的に監査し、異常な振る舞いを素早く検出することが重要である。
これは、データストリームの$k$のシーケンシャルな仮説テスト問題と、システムがすべての$k$のストリームで期待どおりに動作していると主張するグローバルなnull仮説とをモデル化することができる。
標準的なグローバルテストではボンフェロニ補正を採用しており、$k$が大きければ$O\left(\ln\frac{k}α\right)$の停止時間制限がある。
本研究では,異なる,疎密な,あるいは密接な代替仮説の下で,期待停止時間に異なるトレードオフを持つテストマーチンガレットをマージングするアイデアを用いて,新しいシーケンシャルテストを構築する。
さらに、スパース設定でボンフェロニの値と一致する改善された停止時間境界を達成するが、自然に$O\left(\frac{1}{k}\ln\frac{1}α\right)$となるような新しいバランスの取れたテストも導出する。
提案手法の有効性を実証的に実証した。
関連論文リスト
- The Good, the Bad, and the Sampled: a No-Regret Approach to Safe Online Classification [25.36548531839979]
本研究は, リスクが未知のロジスティックモデルによって管理される2次性疾患の結果に対して, 個人を順次検査する問題について考察する。
我々のゴールは、必要となるコストのかかるテストの総数を最小限に抑えながら、誤分類のごく一部が予め特定されたエラー耐性を超えないことを保証することです。
これにより、エラー制約のあるロジスティックテストに対する最初のノンレグレット保証が確立され、コストセンシティブな医療スクリーニングに直接適用される。
論文 参考訳(メタデータ) (2025-10-01T15:28:00Z) - Doubly Robust Conditional Independence Testing with Generative Neural Networks [8.323172773256449]
本稿では、第3の確率ベクトル$Z$を与えられた2つのジェネリックランダムベクトル$X$と$Y$の条件独立性をテストする問題に対処する。
条件分布を明示的に推定しない新しい非パラメトリック試験法を提案する。
論文 参考訳(メタデータ) (2024-07-25T01:28:59Z) - Collaborative non-parametric two-sample testing [55.98760097296213]
目標は、null仮説の$p_v = q_v$が拒否されるノードを特定することである。
グラフ構造を効率的に活用する非パラメトリックコラボレーティブ2サンプルテスト(CTST)フレームワークを提案する。
提案手法は,f-divergence Estimation, Kernel Methods, Multitask Learningなどの要素を統合する。
論文 参考訳(メタデータ) (2024-02-08T14:43:56Z) - Testable Learning with Distribution Shift [9.036777309376697]
分散シフトを伴うテスト可能学習と呼ばれる新しいモデルを定義する。
テスト分布上の分類器の性能を証明可能なアルゴリズムを得る。
ハーフスペースやハーフスペースの交点,決定木といった概念クラスを学ぶ上で,いくつかの肯定的な結果が得られる。
論文 参考訳(メタデータ) (2023-11-25T23:57:45Z) - Sequential Kernelized Independence Testing [77.237958592189]
我々は、カーネル化依存度にインスパイアされたシーケンシャルなカーネル化独立試験を設計する。
シミュレーションデータと実データの両方にアプローチのパワーを実証する。
論文 参考訳(メタデータ) (2022-12-14T18:08:42Z) - Adjusted chi-square test for degree-corrected block models [13.122543280692641]
次数補正ブロックモデル(DCSBM)の適合性テストを提案する。
単純な調整により、$d_i$ の調和平均が無限に成長する限り、統計は null の下で分布に収束する。
我々の分布結果は漸近的ではなく、明示的な定数を持ち、目標分布へのコルモゴロフ-スミルノフ距離の有限サンプル境界を与える。
論文 参考訳(メタデータ) (2020-12-30T05:20:59Z) - Optimal Testing of Discrete Distributions with High Probability [49.19942805582874]
高確率状態に着目して離散分布を試験する問題について検討する。
一定の要素でサンプル最適である近接性および独立性テストのための最初のアルゴリズムを提供する。
論文 参考訳(メタデータ) (2020-09-14T16:09:17Z) - Noisy Adaptive Group Testing using Bayesian Sequential Experimental
Design [63.48989885374238]
病気の感染頻度が低い場合、Dorfman氏は80年前に、人のテストグループは個人でテストするよりも効率が良いことを示した。
本研究の目的は,ノイズの多い環境で動作可能な新しいグループテストアルゴリズムを提案することである。
論文 参考訳(メタデータ) (2020-04-26T23:41:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。