論文の概要: Enhancement to Training of Bidirectional GAN : An Approach to Demystify
Tax Fraud
- arxiv url: http://arxiv.org/abs/2208.07675v1
- Date: Tue, 16 Aug 2022 11:28:02 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-17 12:42:16.040517
- Title: Enhancement to Training of Bidirectional GAN : An Approach to Demystify
Tax Fraud
- Title(参考訳): 双方向GANの訓練の促進 : 脱マイティフィケーションへのアプローチ
- Authors: Priya Mehta, Sandeep Kumar, Ravi Kumar, Ch. Sobhan Babu
- Abstract要約: 本稿では,2方向GAN(Bidirectional GAN)による異常検出のための新しいトレーニング手法を提案する。
各納税者には,6つの相関パラメータと3つの比パラメータが提出された。
各納税者に対して、自己の基幹データと再生データとのコサイン類似性を計算する。
- 参考スコア(独自算出の注目度): 19.852827313750147
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Outlier detection is a challenging activity. Several machine learning
techniques are proposed in the literature for outlier detection. In this
article, we propose a new training approach for bidirectional GAN (BiGAN) to
detect outliers. To validate the proposed approach, we train a BiGAN with the
proposed training approach to detect taxpayers, who are manipulating their tax
returns. For each taxpayer, we derive six correlation parameters and three
ratio parameters from tax returns submitted by him/her. We train a BiGAN with
the proposed training approach on this nine-dimensional derived ground-truth
data set. Next, we generate the latent representation of this data set using
the $encoder$ (encode this data set using the $encoder$) and regenerate this
data set using the $generator$ (decode back using the $generator$) by giving
this latent representation as the input. For each taxpayer, compute the cosine
similarity between his/her ground-truth data and regenerated data. Taxpayers
with lower cosine similarity measures are potential return manipulators. We
applied our method to analyze the iron and steel taxpayers data set provided by
the Commercial Taxes Department, Government of Telangana, India.
- Abstract(参考訳): 外乱検出は難しい活動です。
異常検出のためのいくつかの機械学習手法が文献に提案されている。
本稿では,双方向gan(bigan)による異常検出のための新しいトレーニング手法を提案する。
提案手法を検証するため,提案手法を用いて,納税申告者(納税申告者)を訓練し,納税申告者(納税者)を検出する。
各納税者には,6つの相関パラメータと3つの比パラメータが提出された。
この9次元導出地中データセットに対して,提案手法を用いてbiganを訓練する。
次に、$encoder$($encoder$を使ってこのデータセットをエンコードする)を使用してこのデータセットの潜在表現を生成し、この潜在表現を入力として与えて、$generator$($generator$を使ってデコードする)を使用してこのデータセットを再生する。
各納税者に対して、自己の基幹データと再生データのコサイン類似性を計算する。
コサインの類似度が低い納税者は、潜在リターンマニピュレータである。
本手法は,インド・テランガナ政府営税局が提供した鉄鋼・鉄鋼の納税者データの解析に応用した。
関連論文リスト
- Exploiting Pre-trained Models for Drug Target Affinity Prediction with Nearest Neighbors [58.661454334877256]
薬物-標的結合親和性(DTA)予測は、薬物発見に不可欠である。
DTA予測へのディープラーニング手法の適用にもかかわらず、達成された精度は依然として準最適である。
事前学習したDTA予測モデルに適用した非表現埋め込みに基づく検索手法である$k$NN-DTAを提案する。
論文 参考訳(メタデータ) (2024-07-21T15:49:05Z) - Fact Checking Beyond Training Set [64.88575826304024]
本稿では,レトリバーリーダが,あるドメインのラベル付きデータに基づいてトレーニングし,別のドメインで使用する場合,性能劣化に悩まされることを示す。
本稿では,レトリバー成分を分散シフトに対して頑健にするための逆アルゴリズムを提案する。
次に、これらのデータセットから8つの事実チェックシナリオを構築し、モデルと強力なベースラインモデルのセットを比較します。
論文 参考訳(メタデータ) (2024-03-27T15:15:14Z) - Scaling laws for learning with real and surrogate data [12.617392961074096]
シュロゲートデータをトレーニングに統合するための重み付き経験的リスク最小化(ERM)アプローチを導入する。
$(i)$ サロゲートデータを統合すれば、元のディストリビューションにおけるテストエラーを大幅に削減できる。
$(ii)$ 代理データの利点を享受するためには、最適な重み付けのERMを使用することが重要です。
論文 参考訳(メタデータ) (2024-02-06T20:30:19Z) - Adversarially Robust Deep Learning with Optimal-Transport-Regularized
Divergences [12.1942837946862]
我々は、ディープラーニングモデルの対角的堅牢性を高めるための新しいアプローチとして、$ARMOR_D$メソッドを紹介した。
マルウェア検出と画像認識における本手法の有効性を実証する。
論文 参考訳(メタデータ) (2023-09-07T15:41:45Z) - Training \beta-VAE by Aggregating a Learned Gaussian Posterior with a
Decoupled Decoder [0.553073476964056]
VAEトレーニングの現在の実践は、しばしば、再構成の忠実さと、潜伏空間の連続性$/$$分散の間のトレードオフをもたらす。
本稿では,2つの損失の対角的機構の直観と注意深い解析を行い,VAEを訓練するための簡易で効果的な2段階法を提案する。
本手法は, 3次元頭蓋骨再建と形状完成を目的とした医療データセットを用いて評価し, 提案手法を用いてトレーニングしたVAEの有望な生成能力を示す。
論文 参考訳(メタデータ) (2022-09-29T13:49:57Z) - Lethal Dose Conjecture on Data Poisoning [122.83280749890078]
データ中毒は、悪意のある目的のために機械学習アルゴリズムのトレーニングセットを歪ませる敵を考える。
本研究は, 致死線量導出法(Lethal Dose Conjecture)とよばれるデータ中毒の基礎について, 1つの予想を立証するものである。
論文 参考訳(メタデータ) (2022-08-05T17:53:59Z) - The Power and Limitation of Pretraining-Finetuning for Linear Regression
under Covariate Shift [127.21287240963859]
本研究では,対象データに基づく事前学習と微調整を併用した伝達学習手法について検討する。
大規模な線形回帰インスタンスの場合、$O(N2)$ソースデータによる転送学習は、$N$ターゲットデータによる教師あり学習と同じくらい効果的である。
論文 参考訳(メタデータ) (2022-08-03T05:59:49Z) - How to Leverage Unlabeled Data in Offline Reinforcement Learning [125.72601809192365]
オフライン強化学習(RL)は、静的データセットから制御ポリシーを学ぶことができるが、標準のRLメソッドと同様に、移行毎に報酬アノテーションを必要とする。
1つの自然な解決策は、ラベル付けされたデータから報酬関数を学習し、ラベル付けされていないデータをラベル付けすることである。
ラベルのないデータに単純に報酬をゼロにする方が、効果的なデータ共有につながる。
論文 参考訳(メタデータ) (2022-02-03T18:04:54Z) - Linear Contextual Bandits with Adversarial Corruptions [91.38793800392108]
本稿では,敵対的腐敗の存在下での線形文脈的包帯問題について検討する。
逆汚染レベルに適応する分散認識アルゴリズムをC$で提案する。
論文 参考訳(メタデータ) (2021-10-25T02:53:24Z) - Tax Evasion Risk Management Using a Hybrid Unsupervised Outlier
Detection Method [0.0]
HUNODは脱税リスク管理のための新規なハイブリッド非教師付きアウトリア検出手法である。
HUNOD法の実験評価は,セルビア税務省が収集した個人所得税宣言データベースから得られた2つのデータセットを用いて行った。
論文 参考訳(メタデータ) (2021-02-25T20:22:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。