論文の概要: Machine Learning based Enterprise Financial Audit Framework and High Risk Identification
- arxiv url: http://arxiv.org/abs/2507.06266v1
- Date: Tue, 08 Jul 2025 00:22:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 17:37:43.33262
- Title: Machine Learning based Enterprise Financial Audit Framework and High Risk Identification
- Title(参考訳): 機械学習に基づく企業財務監査フレームワークとリスク同定
- Authors: Tingyu Yuan, Xi Zhang, Xuanjing Chen,
- Abstract要約: 本研究では,企業財務監査とハイリスク識別のためのAI駆動型フレームワークを提案する。
2020年から2025年にかけて、ビッグフォー会計会社(EY、PwC、Deloitte、KPMG)のデータセットを使用して、リスク評価、コンプライアンス違反、不正検出の傾向を調査した。
調査では、Random Forestをコアモデルとして採用し、エンジニアリングによる機能拡張、リアルタイムリスク監視の実装を推奨している。
- 参考スコア(独自算出の注目度): 6.433444278723668
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In the face of global economic uncertainty, financial auditing has become essential for regulatory compliance and risk mitigation. Traditional manual auditing methods are increasingly limited by large data volumes, complex business structures, and evolving fraud tactics. This study proposes an AI-driven framework for enterprise financial audits and high-risk identification, leveraging machine learning to improve efficiency and accuracy. Using a dataset from the Big Four accounting firms (EY, PwC, Deloitte, KPMG) from 2020 to 2025, the research examines trends in risk assessment, compliance violations, and fraud detection. The dataset includes key indicators such as audit project counts, high-risk cases, fraud instances, compliance breaches, employee workload, and client satisfaction, capturing both audit behaviors and AI's impact on operations. To build a robust risk prediction model, three algorithms - Support Vector Machine (SVM), Random Forest (RF), and K-Nearest Neighbors (KNN) - are evaluated. SVM uses hyperplane optimization for complex classification, RF combines decision trees to manage high-dimensional, nonlinear data with resistance to overfitting, and KNN applies distance-based learning for flexible performance. Through hierarchical K-fold cross-validation and evaluation using F1-score, accuracy, and recall, Random Forest achieves the best performance, with an F1-score of 0.9012, excelling in identifying fraud and compliance anomalies. Feature importance analysis reveals audit frequency, past violations, employee workload, and client ratings as key predictors. The study recommends adopting Random Forest as a core model, enhancing features via engineering, and implementing real-time risk monitoring. This research contributes valuable insights into using machine learning for intelligent auditing and risk management in modern enterprises.
- Abstract(参考訳): 世界経済の不確実性に直面している中で、金融監査は規制の遵守とリスク軽減に欠かせないものとなっている。
従来の手作業による監査手法は、大規模なデータボリューム、複雑なビジネス構造、詐欺戦術の進化によってますます制限されている。
本研究では,企業財務監査とハイリスク識別のためのAI駆動型フレームワークを提案する。
2020年から2025年にかけて、ビッグフォー会計会社(EY、PwC、Deloitte、KPMG)のデータセットを使用して、リスク評価、コンプライアンス違反、不正検出の傾向を調査した。
このデータセットには、監査プロジェクトカウント、リスクの高いケース、不正なインスタンス、コンプライアンス違反、従業員のワークロード、クライアント満足度といった重要な指標が含まれており、監査行動とAIの操作への影響の両方をキャプチャする。
頑健なリスク予測モデルを構築するために、SVM(Support Vector Machine)、RF(Random Forest)、K-Nearest Neighbors(KNN)の3つのアルゴリズムを評価した。
SVMは複雑な分類のために超平面最適化を使用し、RFは高次元非線形データとオーバーフィッティングに対する耐性を管理するために決定木を結合し、KNNはフレキシブルな性能のために距離ベース学習を適用する。
F1スコア、精度、リコールを用いた階層的なKフォールドのクロスバリデーションと評価により、ランダムフォレストはF1スコアの0.9012で最高のパフォーマンスを達成し、不正やコンプライアンスの異常を識別できる。
特徴重要度分析は、監査頻度、過去の違反、従業員の作業負荷、クライアントのレーティングを重要な予測要因として明らかにする。
調査では、Random Forestをコアモデルとして採用し、エンジニアリングによる機能拡張、リアルタイムリスク監視の実装を推奨している。
この研究は、現代の企業におけるインテリジェントな監査とリスク管理に機械学習を使うことに関する貴重な洞察に貢献する。
関連論文リスト
- Does Machine Unlearning Truly Remove Model Knowledge? A Framework for Auditing Unlearning in LLMs [58.24692529185971]
本研究では,3つのベンチマークデータセット,6つのアンラーニングアルゴリズム,および5つのプロンプトベースの監査手法からなる,アンラーニング評価のための総合的な監査フレームワークを提案する。
異なるアンラーニング戦略の有効性とロバスト性を評価する。
論文 参考訳(メタデータ) (2025-05-29T09:19:07Z) - Evaluating Supervised Learning Models for Fraud Detection: A Comparative Study of Classical and Deep Architectures on Imbalanced Transaction Data [2.5670390559986442]
不正検出は金融や電子商取引といった高額な分野において依然として重要な課題である。
大規模かつ高度に不均衡なオンライントランザクションデータセット上で、4つの教師付き学習モデルの性能を体系的に比較する。
論文 参考訳(メタデータ) (2025-05-28T16:08:04Z) - PredictaBoard: Benchmarking LLM Score Predictability [50.47497036981544]
大きな言語モデル(LLM)は予測不能に失敗することが多い。
これは、安全なデプロイメントを保証する上で、大きな課題となる。
PredictaBoardは,新しいベンチマークフレームワークである。
論文 参考訳(メタデータ) (2025-02-20T10:52:38Z) - AILuminate: Introducing v1.0 of the AI Risk and Reliability Benchmark from MLCommons [62.374792825813394]
本稿ではAI製品リスクと信頼性を評価するための業界標準ベンチマークとして,AIluminate v1.0を紹介する。
このベンチマークは、危険、違法、または望ましくない行動を12の危険カテゴリーで引き起こすように設計されたプロンプトに対するAIシステムの抵抗を評価する。
論文 参考訳(メタデータ) (2025-02-19T05:58:52Z) - Explainable AI for Fraud Detection: An Attention-Based Ensemble of CNNs, GNNs, and A Confidence-Driven Gating Mechanism [5.486205584465161]
本研究は,通常の分類プロセスに2つの余分な層を追加することにより,CCF検出のための新たな積み重ねに基づくアプローチを提案する。
注意層では、畳み込みニューラルネットワーク(CNN)とリカレントニューラルネットワーク(RNN)のソフトアウトプットを、依存重み付け平均化(DOWA)演算子を用いて組み合わせる。
信頼層では,どのアグリゲーション(DOWAまたはIOWA)でも,メタラーナーへのフィードの不確実性が低いかを選択する。
3つのデータセットに対する実験により,提案手法は高精度かつ堅牢な一般化を実現し,CCF検出に有効であることが示された。
論文 参考訳(メタデータ) (2024-10-01T09:56:23Z) - EARBench: Towards Evaluating Physical Risk Awareness for Task Planning of Foundation Model-based Embodied AI Agents [53.717918131568936]
EAI(Embodied AI)は、高度なAIモデルを現実世界のインタラクションのための物理的なエンティティに統合する。
高レベルのタスク計画のためのEAIエージェントの"脳"としてのファンデーションモデルは、有望な結果を示している。
しかし、これらのエージェントの物理的環境への展開は、重大な安全性上の課題を呈している。
本研究では,EAIシナリオにおける身体的リスクの自動評価のための新しいフレームワークEARBenchを紹介する。
論文 参考訳(メタデータ) (2024-08-08T13:19:37Z) - A Customer Level Fraudulent Activity Detection Benchmark for Enhancing Machine Learning Model Research and Evaluation [0.4681661603096334]
本研究では,顧客レベルの不正検出に特化して設計された構造化データセットを含むベンチマークを提案する。
このベンチマークは、ユーザの機密性を確保するために厳格なプライバシーガイドラインに準拠しているだけでなく、顧客中心の機能をカプセル化することによって、豊富な情報ソースを提供する。
論文 参考訳(メタデータ) (2024-04-23T04:57:44Z) - TrustFed: A Reliable Federated Learning Framework with Malicious-Attack
Resistance [8.924352407824566]
フェデレートラーニング(FL)は、個々のデータのプライバシを確保しながら、複数のクライアント間で協調的な学習を可能にする。
本稿では,階層型監査に基づくFL(HiAudit-FL)フレームワークを提案する。
シミュレーションの結果、HiAudit-FLは、システムオーバーヘッドを小さくして、潜在的悪意のあるユーザを効果的に識別し、対処できることが示されている。
論文 参考訳(メタデータ) (2023-12-06T13:56:45Z) - Empirical study of Machine Learning Classifier Evaluation Metrics
behavior in Massively Imbalanced and Noisy data [0.0]
我々は、実世界の不正検出データセットに典型的な人間のアノテーションエラーと極端な不均衡をモデル化するための理論的基盤を開発する。
我々は、F1スコアとg平均の組み合わせが、典型的な不均衡不正検出モデル分類における最良の評価指標であることを実証した。
論文 参考訳(メタデータ) (2022-08-25T07:30:31Z) - Explanations of Machine Learning predictions: a mandatory step for its
application to Operational Processes [61.20223338508952]
信用リスクモデリングは重要な役割を果たす。
近年,機械学習や深層学習の手法が採用されている。
この分野における説明可能性問題に LIME 手法を適用することを提案する。
論文 参考訳(メタデータ) (2020-12-30T10:27:59Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。