論文の概要: Tax Evasion Risk Management Using a Hybrid Unsupervised Outlier
Detection Method
- arxiv url: http://arxiv.org/abs/2103.01033v1
- Date: Thu, 25 Feb 2021 20:22:20 GMT
- ステータス: 処理完了
- システム内更新日: 2021-04-05 00:47:58.304516
- Title: Tax Evasion Risk Management Using a Hybrid Unsupervised Outlier
Detection Method
- Title(参考訳): ハイブリッド非教師付き異常検出法による脱税リスク管理
- Authors: Milo\v{s} Savi\'c, Jasna Atanasijevi\'c, Du\v{s}an Jakoveti\'c,
Nata\v{s}a Kreji\'c
- Abstract要約: HUNODは脱税リスク管理のための新規なハイブリッド非教師付きアウトリア検出手法である。
HUNOD法の実験評価は,セルビア税務省が収集した個人所得税宣言データベースから得られた2つのデータセットを用いて行った。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Big data methods are becoming an important tool for tax fraud detection
around the world. Unsupervised learning approach is the dominant framework due
to the lack of label and ground truth in corresponding data sets although these
methods suffer from low interpretability. HUNOD, a novel hybrid unsupervised
outlier detection method for tax evasion risk management, is presented in this
paper. In contrast to previous methods proposed in the literature, the HUNOD
method combines two outlier detection approaches based on two different machine
learning designs (i.e, clustering and representational learning) to detect and
internally validate outliers in a given tax dataset. The HUNOD method allows
its users to incorporate relevant domain knowledge into both constituent
outlier detection approaches in order to detect outliers relevant for a given
economic context. The interpretability of obtained outliers is achieved by
training explainable-by-design surrogate models over results of unsupervised
outlier detection methods. The experimental evaluation of the HUNOD method is
conducted on two datasets derived from the database on individual personal
income tax declarations collected by the Tax Administration of Serbia. The
obtained results show that the method indicates between 90% and 98% internally
validated outliers depending on the clustering configuration and employed
regularization mechanisms for representational learning.
- Abstract(参考訳): ビッグデータの手法は、世界中の税金不正検出の重要なツールになりつつある。
教師なし学習(unsupervised learning)アプローチは、対応するデータセットにおけるラベルや根拠の真理が欠如しているため、主要なフレームワークである。
本稿では,脱税リスク管理のためのハイブリッド型非教師なし異常検出手法hunodについて述べる。
文献で提案されている従来の手法とは対照的に、hunod法は2つの異なる機械学習設計(クラスタリングと表現学習)に基づく2つの外れ値検出アプローチを組み合わせて、所定の課税データセットにおける外れ値の検出と内部検証を行う。
hunodメソッドにより、ユーザは、特定の経済状況に関連する外れ値を検出するために、両方の外れ値検出アプローチに関連するドメイン知識を組み込むことができる。
また, 教師なし外乱検出法の結果に対して, 説明可能なサロゲートモデルを訓練することにより, 得られた外乱の解釈可能性を実現する。
HUNOD法の実験評価は,セルビア税務省が収集した個人所得税宣言データベースから得られた2つのデータセットを用いて行った。
その結果,本手法は,クラスタ構成に応じて90%から98%の内部検証された異常値を示し,表現学習に正規化機構を用いた。
関連論文リスト
- Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - Quantile-based Maximum Likelihood Training for Outlier Detection [5.902139925693801]
我々は,推定時の外乱分離を改善するために,不整合分布を学習するための量子化に基づく最大極大目標を提案する。
本手法は, 事前学習した識別特徴に正規化フローを適合させ, 評価されたログ類似度に応じて異常値を検出する。
論文 参考訳(メタデータ) (2023-08-20T22:27:54Z) - Adaptive Negative Evidential Deep Learning for Open-set Semi-supervised Learning [69.81438976273866]
オープンセット半教師付き学習(Open-set SSL)は、ラベル付きデータ(inliers)で観測されない新しいカテゴリ(outliers)を含むラベル付きデータとテストデータを含む、より実践的なシナリオである。
本研究では,様々な不確かさを定量化するための外乱検出器として顕在的深層学習(EDL)を導入し,自己学習と推論のための異なる不確実性指標を設計する。
Inlierとoutlierの両方を含むラベルなしデータセットに適合するように、新しい適応的負の最適化戦略を提案する。
論文 参考訳(メタデータ) (2023-03-21T09:07:15Z) - CoMadOut -- A Robust Outlier Detection Algorithm based on CoMAD [0.3749861135832073]
データセット上の機械学習アルゴリズムの予測を歪める可能性があるため、アウトレーヤは重要な役割を果たす。
この問題に対処するために,ロバストな外乱検出アルゴリズムCoMadOutを提案する。
われわれの手法は、外乱検出タスクの堅牢な代替手段と見なすことができる。
論文 参考訳(メタデータ) (2022-11-23T21:33:34Z) - Leveraging Unlabeled Data to Predict Out-of-Distribution Performance [63.740181251997306]
実世界の機械学習デプロイメントは、ソース(トレーニング)とターゲット(テスト)ディストリビューションのミスマッチによって特徴づけられる。
本研究では,ラベル付きソースデータとラベルなしターゲットデータのみを用いて,対象領域の精度を予測する手法を検討する。
本稿では,モデルの信頼度をしきい値として学習し,精度をラベルなし例のごく一部として予測する実践的手法である平均閾値保持信頼度(ATC)を提案する。
論文 参考訳(メタデータ) (2022-01-11T23:01:12Z) - Learning Bias-Invariant Representation by Cross-Sample Mutual
Information Minimization [77.8735802150511]
対象タスクが誤用したバイアス情報を除去するために,クロスサンプル対逆脱バイアス法(CSAD)を提案する。
相関測定は, 対向的偏り評価において重要な役割を担い, クロスサンプル型相互情報推定器によって行われる。
我々は,提案手法の最先端手法に対する利点を検証するために,公開データセットの徹底的な実験を行った。
論文 参考訳(メタデータ) (2021-08-11T21:17:02Z) - Deep Clustering based Fair Outlier Detection [19.601280507914325]
本稿では,統合深層クラスタリングと外乱検出を強化するために,インスタンスレベルの重み付き表現学習戦略を提案する。
我々のDCFOD法は, 異常検出において, 異常検出の妥当性と2種類のフェアネス概念の両面において, 常に優れた性能を達成している。
論文 参考訳(メタデータ) (2021-06-09T15:12:26Z) - Homophily Outlier Detection in Non-IID Categorical Data [43.51919113927003]
この研究は、新しい外れ値検出フレームワークとその2つのインスタンスを導入し、カテゴリデータの外れ値を特定する。
まず、分布に敏感な外部因子とその相互依存性を値値グラフベースの表現に定義し、組み込む。
学習した値の外れ度は、直接の外れ値検出または特徴選択の除外を可能にする。
論文 参考訳(メタデータ) (2021-03-21T23:29:33Z) - Learning from Similarity-Confidence Data [94.94650350944377]
類似度信頼性(Sconf)データから学習する新しい弱監督学習問題について検討する。
本研究では,Sconfデータのみから計算可能な分類リスクの非バイアス推定器を提案し,推定誤差境界が最適収束率を達成することを示す。
論文 参考訳(メタデータ) (2021-02-13T07:31:16Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。