論文の概要: Interpretable Outlier Summarization
- arxiv url: http://arxiv.org/abs/2303.06261v3
- Date: Fri, 1 Sep 2023 07:49:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-04 17:00:51.069080
- Title: Interpretable Outlier Summarization
- Title(参考訳): 解釈可能なアウトリー・サマリゼーション
- Authors: Yu Wang, Lei Cao, Yizhou Yan, Samuel Madden
- Abstract要約: 外乱検出は、ファイナンシャル不正の防止、ネットワーク侵入の防御、差し迫ったデバイス障害の検出など、実際のアプリケーションにおいて極めて重要である。
本稿では,人間の理解可能なルールのコンパクトな集合を学習し,異常検出結果の要約と説明を行うSTAIRを提案する。
以上の結果から,STAIRは外乱検出結果の要約に要するルールの複雑さを著しく低減することが明らかとなった。
- 参考スコア(独自算出の注目度): 10.41121739124057
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Outlier detection is critical in real applications to prevent financial
fraud, defend network intrusions, or detecting imminent device failures. To
reduce the human effort in evaluating outlier detection results and effectively
turn the outliers into actionable insights, the users often expect a system to
automatically produce interpretable summarizations of subgroups of outlier
detection results. Unfortunately, to date no such systems exist. To fill this
gap, we propose STAIR which learns a compact set of human understandable rules
to summarize and explain the anomaly detection results. Rather than use the
classical decision tree algorithms to produce these rules, STAIR proposes a new
optimization objective to produce a small number of rules with least
complexity, hence strong interpretability, to accurately summarize the
detection results. The learning algorithm of STAIR produces a rule set by
iteratively splitting the large rules and is optimal in maximizing this
objective in each iteration. Moreover, to effectively handle high dimensional,
highly complex data sets which are hard to summarize with simple rules, we
propose a localized STAIR approach, called L-STAIR. Taking data locality into
consideration, it simultaneously partitions data and learns a set of localized
rules for each partition. Our experimental study on many outlier benchmark
datasets shows that STAIR significantly reduces the complexity of the rules
required to summarize the outlier detection results, thus more amenable for
humans to understand and evaluate, compared to the decision tree methods.
- Abstract(参考訳): 異常検出は、金融詐欺の防止、ネットワーク侵入の防御、差し迫ったデバイス障害の検出など、実際のアプリケーションにおいて極めて重要である。
外乱検出結果の評価における人的労力を削減し、効果的に外乱検出結果を実行可能な洞察に変換するため、ユーザは外乱検出結果のサブグループの解釈可能な要約を自動的に生成するシステムをしばしば期待する。
残念ながら、今のところそのようなシステムは存在しない。
このギャップを埋めるために,人間の理解可能なルールのコンパクトな集合を学習し,異常検出結果の要約と説明を行うSTAIRを提案する。
これらのルールを生成するために古典的な決定木アルゴリズムを使用する代わりに、STAIRは最小限の複雑さを持つ少数のルールを生成するために新しい最適化目標を提案する。
階段の学習アルゴリズムは、大きなルールを反復的に分割し、各イテレーションでこの目標を最大化するために最適なルールを生成する。
さらに, 単純な規則で要約し難い高次元, 複雑なデータセットを効果的に扱うために, L-STAIRと呼ばれる局所化STAIRアプローチを提案する。
データ局所性を考慮に入れ、同時にデータを分割し、各パーティションのローカライズされたルールセットを学ぶ。
多くの外れ値ベンチマークデータセットに関する実験により、stairは外れ値検出結果を要約するのに必要となるルールの複雑さを大幅に削減し、決定木法と比較して人間が理解し、評価しやすいことを示した。
関連論文リスト
- Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - DTOR: Decision Tree Outlier Regressor to explain anomalies [37.00322799216377]
Decision Tree Outlier Regressor (DTOR) は、個々のデータポイントに対してルールベースの説明を生成する技術である。
本結果は,多数の特徴を持つデータセットにおいても,DTORの堅牢性を示すものである。
論文 参考訳(メタデータ) (2024-03-16T11:38:31Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - Implicit models, latent compression, intrinsic biases, and cheap lunches
in community detection [0.0]
コミュニティ検出は、ネットワークをノードのクラスタに分割して、その大規模な構造を要約することを目的としている。
いくつかのコミュニティ検出手法は、確率的生成モデルを通じてクラスタリングの目的を明示的に導出する。
他の方法は記述的であり、特定のアプリケーションによって動機付けられた目的に応じてネットワークを分割する。
本稿では,コミュニティ検出対象,推論対象,記述対象とそれに対応する暗黙的ネットワーク生成モデルとを関連付けるソリューションを提案する。
論文 参考訳(メタデータ) (2022-10-17T15:38:41Z) - Diminishing Empirical Risk Minimization for Unsupervised Anomaly
Detection [0.0]
経験的リスク最小化(ERM)は、未知の分布におけるアルゴリズムの性能を、既知のトレーニングセットにおける損失の平均化によって近似できると仮定する。
本稿では,EMMの限界を突破する新しいDimical Risk Minimization(DERM)フレームワークを提案する。
DERMは、よく設計された集約戦略を通じて個々の損失の影響を適応的に調整する。
論文 参考訳(メタデータ) (2022-05-29T14:18:26Z) - Little Help Makes a Big Difference: Leveraging Active Learning to
Improve Unsupervised Time Series Anomaly Detection [2.1684857243537334]
予期せぬネットワークインシデントを検出するために,多数の異常検出アルゴリズムがデプロイされている。
教師なし異常検出アルゴリズムは、しばしば過度の誤報に悩まされる。
本稿では,オペレータのフィードバックの導入とメリットをアクティブな学習に活用することを提案する。
論文 参考訳(メタデータ) (2022-01-25T13:54:19Z) - Unsupervised Learning of Debiased Representations with Pseudo-Attributes [85.5691102676175]
教師なし方式で,単純かつ効果的な脱バイアス手法を提案する。
特徴埋め込み空間上でクラスタリングを行い、クラスタリング結果を利用して疑似属性を識別する。
次に,非偏り表現を学習するために,クラスタベースの新しい重み付け手法を用いる。
論文 参考訳(メタデータ) (2021-08-06T05:20:46Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Learning by Minimizing the Sum of Ranked Range [58.24935359348289]
本稿では,学習目標を定式化するための一般的なアプローチとして,ランキング範囲(SoRR)の和を紹介した。
ランク付き範囲は、実数の集合のソートされた値の連続的なシーケンスである。
我々は,SoRRフレームワークの最小化のための機械学習における2つの応用,すなわち,バイナリ分類のためのAoRR集約損失とマルチラベル/マルチクラス分類のためのTKML個人損失について検討する。
論文 参考訳(メタデータ) (2020-10-05T01:58:32Z) - Interpolation-based semi-supervised learning for object detection [44.37685664440632]
オブジェクト検出のための補間に基づく半教師付き学習手法を提案する。
提案した損失は、半教師付き学習と教師付き学習の性能を劇的に向上させる。
論文 参考訳(メタデータ) (2020-06-03T10:53:44Z) - An Information Bottleneck Approach for Controlling Conciseness in
Rationale Extraction [84.49035467829819]
我々は,情報ボトルネック(IB)の目的を最適化することで,このトレードオフをよりよく管理できることを示す。
我々の完全教師なしのアプローチは、文上のスパース二項マスクを予測する説明器と、抽出された合理性のみを考慮したエンドタスク予測器を共同で学習する。
論文 参考訳(メタデータ) (2020-05-01T23:26:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。