論文の概要: Tradeoffs in Streaming Binary Classification under Limited Inspection
Resources
- arxiv url: http://arxiv.org/abs/2110.02403v1
- Date: Tue, 5 Oct 2021 23:23:11 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-07 14:42:55.805851
- Title: Tradeoffs in Streaming Binary Classification under Limited Inspection
Resources
- Title(参考訳): 限定検査資源下におけるストリーミングバイナリ分類のトレードオフ
- Authors: Parisa Hassanzadeh, Danial Dervovic, Samuel Assefa, Prashant Reddy,
Manuela Veloso
- Abstract要約: イベントが順次到着し,疑わしいイベントの数が限られている,不均衡なバイナリ分類問題を考える。
マイノリティクラス検出率と検査能力のトレードオフを解析的に特徴付ける。
本研究では,実際の不正検出データセット上での選択手法を実装し,実験結果と解析的境界を比較検討する。
- 参考スコア(独自算出の注目度): 14.178224954581069
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Institutions are increasingly relying on machine learning models to identify
and alert on abnormal events, such as fraud, cyber attacks and system failures.
These alerts often need to be manually investigated by specialists. Given the
operational cost of manual inspections, the suspicious events are selected by
alerting systems with carefully designed thresholds. In this paper, we consider
an imbalanced binary classification problem, where events arrive sequentially
and only a limited number of suspicious events can be inspected. We model the
event arrivals as a non-homogeneous Poisson process, and compare various
suspicious event selection methods including those based on static and adaptive
thresholds. For each method, we analytically characterize the tradeoff between
the minority-class detection rate and the inspection capacity as a function of
the data class imbalance and the classifier confidence score densities. We
implement the selection methods on a real public fraud detection dataset and
compare the empirical results with analytical bounds. Finally, we investigate
how class imbalance and the choice of classifier impact the tradeoff.
- Abstract(参考訳): 機関は、不正、サイバー攻撃、システム障害などの異常事象を識別し警告するために、機械学習モデルにますます依存している。
これらの警告は、しばしば専門家によって手動で調査される必要がある。
手動検査の運用コストを考えると、不審なイベントは注意深く設計されたしきい値を持つアラートシステムによって選択される。
本稿では,イベントが順次到着し,疑わしいイベントの数が限られている不均衡二分分類問題について考察する。
非均質なpoissonプロセスとしてイベント到着をモデル化し、静的および適応しきい値に基づくものを含む様々な疑わしいイベント選択方法を比較する。
各手法について,少数クラス検出率と検査能力とのトレードオフをデータクラス不均衡と分類器信頼度密度の関数として解析的に特徴付ける。
実際の不正検出データセット上で選択手法を実装し,実験結果と解析的境界値を比較した。
最後に,クラス不均衡と分類器の選択がトレードオフに与える影響について検討する。
関連論文リスト
- Indiscriminate Disruption of Conditional Inference on Multivariate Gaussians [60.22542847840578]
敵対的機械学習の進歩にもかかわらず、敵対者の存在下でのガウスモデルに対する推論は特に過小評価されている。
我々は,意思決定者の条件推論とその後の行動の妨害を希望する自己関心のある攻撃者について,一組の明らかな変数を乱すことで検討する。
検出を避けるため、攻撃者は、破損した証拠の密度によって可否が決定される場合に、攻撃が可否を示すことを望んでいる。
論文 参考訳(メタデータ) (2024-11-21T17:46:55Z) - An Adversarial Approach to Evaluating the Robustness of Event Identification Models [12.862865254507179]
本稿では,事象分類の特徴を抽出する物理に基づくモーダル分解法について考察する。
得られた分類器は、その堅牢性を評価するために、逆アルゴリズムに対してテストされる。
論文 参考訳(メタデータ) (2024-02-19T18:11:37Z) - Explainable Fraud Detection with Deep Symbolic Classification [4.1205832766381985]
分類問題に対するDeep Symbolic Regressionフレームワークの拡張であるDeep Classificationを提案する。
関数は閉形式で簡潔な数学的表現であるため、モデルは1つの分類決定のレベルとモデルの決定過程の両方において本質的に説明可能である。
PaySimデータセットの評価は、最先端のモデルと競合する予測性能を示しながら、説明可能性の観点からそれらを上回っている。
論文 参考訳(メタデータ) (2023-12-01T13:50:55Z) - Probabilistic Safety Regions Via Finite Families of Scalable Classifiers [2.431537995108158]
監視された分類は、データのパターンを認識して、振る舞いのクラスを分離する。
正準解は、機械学習の数値近似の性質に固有の誤分類誤差を含む。
本稿では,確率論的安全性領域の概念を導入し,入力空間のサブセットとして,誤分類されたインスタンスの数を確率論的に制御する手法を提案する。
論文 参考訳(メタデータ) (2023-09-08T22:40:19Z) - How adversarial attacks can disrupt seemingly stable accurate classifiers [76.95145661711514]
敵攻撃は、入力データに不連続な修正を加えることで、非正確な学習システムの出力を劇的に変化させる。
ここでは,これは高次元入力データを扱う分類器の基本的特徴であると考えられる。
実用システムで観測される重要な振る舞いを高い確率で発生させる、単純で汎用的なフレームワークを導入する。
論文 参考訳(メタデータ) (2023-09-07T12:02:00Z) - Anomaly Detection using Ensemble Classification and Evidence Theory [62.997667081978825]
本稿では,アンサンブル分類とエビデンス理論を用いた新しい検出手法を提案する。
固体アンサンブル分類器を構築するためのプール選択戦略が提示される。
我々は異常検出手法の不確実性を利用する。
論文 参考訳(メタデータ) (2022-12-23T00:50:41Z) - Credit card fraud detection - Classifier selection strategy [0.0]
アノテーション付きトランザクションのサンプルを使用して、機械学習の分類アルゴリズムは不正を検出することを学習する。
不正データセットは多種多様で 矛盾した特徴を示します
特徴的不均衡な不正検出データセットに対するデータ駆動型分類器選択手法を提案する。
論文 参考訳(メタデータ) (2022-08-25T07:13:42Z) - Abuse and Fraud Detection in Streaming Services Using Heuristic-Aware
Machine Learning [0.45880283710344055]
本研究は,ユーザのストリーミング動作をモデル化することで,ストリーミングサービスに対する不正・悪用検出フレームワークを提案する。
本研究では,半教師付きアプローチと,異常検出のための教師付きアプローチについて検討する。
私たちの知る限りでは、実世界のストリーミングサービスにおいて、不正行為の検出と不正検出に機械学習を使った最初の論文である。
論文 参考訳(メタデータ) (2022-03-04T03:57:58Z) - Tracking the risk of a deployed model and detecting harmful distribution
shifts [105.27463615756733]
実際には、デプロイされたモデルのパフォーマンスが大幅に低下しないという、良心的なシフトを無視することは理にかなっている。
我々は,警告を発射する有効な方法は,(a)良性な警告を無視しながら有害なシフトを検知し,(b)誤報率を増大させることなく,モデル性能の連続的なモニタリングを可能にすることを論じる。
論文 参考訳(メタデータ) (2021-10-12T17:21:41Z) - Understanding Classifier Mistakes with Generative Models [88.20470690631372]
ディープニューラルネットワークは教師付き学習タスクに有効であるが、脆弱であることが示されている。
本稿では、生成モデルを利用して、分類器が一般化に失敗するインスタンスを特定し、特徴付ける。
我々のアプローチは、トレーニングセットのクラスラベルに依存しないため、半教師付きでトレーニングされたモデルに適用できる。
論文 参考訳(メタデータ) (2020-10-05T22:13:21Z) - Certified Robustness to Label-Flipping Attacks via Randomized Smoothing [105.91827623768724]
機械学習アルゴリズムは、データ中毒攻撃の影響を受けやすい。
任意の関数に対するランダム化スムージングの統一的なビューを示す。
本稿では,一般的なデータ中毒攻撃に対して,ポイントワイズで確実に堅牢な分類器を構築するための新しい戦略を提案する。
論文 参考訳(メタデータ) (2020-02-07T21:28:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。