論文の概要: Unsupervised Outlier Detection in Audit Analytics: A Case Study Using USA Spending Data
- arxiv url: http://arxiv.org/abs/2509.19366v1
- Date: Fri, 19 Sep 2025 01:27:18 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 20:53:19.516192
- Title: Unsupervised Outlier Detection in Audit Analytics: A Case Study Using USA Spending Data
- Title(参考訳): 監査分析における教師なし外乱検出:USAスペンディングデータを用いた事例研究
- Authors: Buhe Li, Berkay Kaplan, Maksym Lazirko, Aleksandr Kogan,
- Abstract要約: 我々は、連邦支出パターンの異常を識別するために、複数の外れ値検出アルゴリズムを採用し、比較する。
その結果,複数の検出戦略を組み合わせるハイブリッドアプローチにより,外乱検出の堅牢性と精度が向上することがわかった。
- 参考スコア(独自算出の注目度): 39.44036223885694
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This study investigates the effectiveness of unsupervised outlier detection methods in audit analytics, utilizing USA spending data from the U.S. Department of Health and Human Services (DHHS) as a case example. We employ and compare multiple outlier detection algorithms, including Histogram-based Outlier Score (HBOS), Robust Principal Component Analysis (PCA), Minimum Covariance Determinant (MCD), and K-Nearest Neighbors (KNN) to identify anomalies in federal spending patterns. The research addresses the growing need for efficient and accurate anomaly detection in large-scale governmental datasets, where traditional auditing methods may fall short. Our methodology involves data preparation, algorithm implementation, and performance evaluation using precision, recall, and F1 scores. Results indicate that a hybrid approach, combining multiple detection strategies, enhances the robustness and accuracy of outlier identification in complex financial data. This study contributes to the field of audit analytics by providing insights into the comparative effectiveness of various outlier detection models and demonstrating the potential of unsupervised learning techniques in improving audit quality and efficiency. The findings have implications for auditors, policymakers, and researchers seeking to leverage advanced analytics in governmental financial oversight and risk management.
- Abstract(参考訳): 本研究では、米国保健福祉省(DHHS)の米国支出データを事例として、監査分析における教師なしアウトリア検出手法の有効性について検討した。
我々は,HBOS(Histogram-based Outlier Score),PCA(Robust principal Component Analysis),MCD(Minimum Covariance Determinant),K-Nearest Neighbors(KNN)など,複数の外乱検出アルゴリズムを用いて,連邦政府の消費パターンの異常を識別する。
この研究は、従来の監査手法が不足している大規模政府のデータセットにおいて、効率的で正確な異常検出の必要性が高まっていることに対処する。
本手法では,精度,リコール,F1スコアを用いたデータ準備,アルゴリズムの実装,性能評価を行う。
以上の結果から,複数の検出戦略を組み合わせたハイブリッド手法は,複雑な財務データにおける外れ値同定の堅牢性と精度を高めることが示唆された。
本研究は, 各種外乱検出モデルの比較有効性に関する知見を提供することにより, 監査分析の分野に寄与し, 監査品質と効率性を向上させるための教師なし学習手法の可能性を示す。
この発見は、監査人、政策立案者、そして政府の金融監督とリスク管理における高度な分析の活用を目指す研究者に影響を及ぼす。
関連論文リスト
- A Comparative Analysis of Statistical and Machine Learning Models for Outlier Detection in Bitcoin Limit Order Books [0.0]
本研究は,暗号通貨制限順序書(LOB)における実時間異常識別のための頑健な統計手法と高度な機械学習手法の比較分析を行う。
我々は13の多様なモデルの有効性を評価し、どのアプローチが潜在的にマニピュティブな取引行動を検出するのに最も適しているかを同定する。
主要な取引所から26,204レコードのデータセットをバックテストして実施した経験的評価は、最高性能のモデルであるEmpirical Covariance (EC)が6.70%向上し、標準のBuy-and-Holdベンチマークを大幅に上回ったことを示している。
論文 参考訳(メタデータ) (2025-07-20T13:42:36Z) - DATABench: Evaluating Dataset Auditing in Deep Learning from an Adversarial Perspective [70.77570343385928]
内的特徴(IF)と外的特徴(EF)(監査のための技術導入)に依存した既存手法の分類を新たに導入する。
回避攻撃(evasion attack)は、データセットの使用を隠蔽するために設計されたもので、偽造攻撃(forgery attack)は、未使用のデータセットを誤って含んでいることを意図している。
さらに,既存手法の理解と攻撃目標に基づいて,回避のための分離・除去・検出,偽造の逆例に基づく攻撃方法など,系統的な攻撃戦略を提案する。
私たちのベンチマークであるData dataBenchは、17の回避攻撃、5の偽攻撃、9の攻撃で構成されています。
論文 参考訳(メタデータ) (2025-07-08T03:07:15Z) - The role of data partitioning on the performance of EEG-based deep learning models in supervised cross-subject analysis: a preliminary study [37.69303106863453]
ディープラーニングは、非常に非線形なパターンを効果的に発見することによって、脳波(EEG)データの解析を進めています。
ドメイン内に適切なデータパーティショニングとクロスバリデーションのための包括的なガイドラインは存在しない。
本稿では,脳波深層学習モデルの評価におけるデータ分割とクロスバリデーションの役割について,徹底的に検討する。
論文 参考訳(メタデータ) (2025-05-19T12:05:28Z) - Access Denied: Meaningful Data Access for Quantitative Algorithm Audits [4.182284365432724]
第三者監査はしばしばアクセス制限によって妨げられ、監査人は制限された低品質のデータに頼らざるを得ない。
本研究は,リシディズムと医療カバレッジ予測のための2つの現実的なケーススタディの監査シミュレーションを行う。
データの最小化と匿名化のプラクティスは、個々のレベルのデータのエラー率を強く向上させ、信頼性の低い評価につながることが分かっています。
論文 参考訳(メタデータ) (2025-02-01T13:33:45Z) - A Computational Method for Measuring "Open Codes" in Qualitative Analysis [44.39424825305388]
本稿では,人間と生成AI(GAI)による帰納的符号化結果を測定するための理論インフォームド計算手法を提案する。
これは、各コーダのコントリビューションを、Coverage、Overlap、Noverety、Divergenceの4つの新しいメトリクスを使用して、マージした結果に対して測定する。
本研究は,人間とAIの質的分析における方法論的厳密性を確保するための信頼性の高い経路を提供する。
論文 参考訳(メタデータ) (2024-11-19T00:44:56Z) - A Review of Global Sensitivity Analysis Methods and a comparative case study on Digit Classification [5.458813674116228]
グローバル感度分析(GSA)は、ある決定を下すモデルにつながる影響のある入力要素を検出することを目的としている。
本稿では,グローバルな感度分析手法に関する総合的なレビューと比較を行う。
論文 参考訳(メタデータ) (2024-06-23T00:38:19Z) - Applied Machine Learning to Anomaly Detection in Enterprise Purchase Processes [0.0]
本研究は、実データから2つの大きな購入データセットから検出された事例を優先的に調査する手法を提案する。
目的は、企業の管理努力の有効性に寄与し、その実施実績を高めることである。
論文 参考訳(メタデータ) (2024-05-23T16:21:51Z) - Weakly Supervised Anomaly Detection: A Survey [75.26180038443462]
異常検出(AD)は、さまざまなアプリケーションによる機械学習において重要なタスクである。
弱教師付き異常検出法(WSAD)の総合的な調査を行った。
各設定に対して、正式な定義、鍵アルゴリズム、潜在的な将来の方向性を提供する。
論文 参考訳(メタデータ) (2023-02-09T10:27:21Z) - PULL: Reactive Log Anomaly Detection Based On Iterative PU Learning [58.85063149619348]
本稿では,推定故障時間ウィンドウに基づくリアクティブ異常検出のための反復ログ解析手法PULLを提案する。
我々の評価では、PULLは3つの異なるデータセットで10のベンチマークベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2023-01-25T16:34:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。