Fugu-MT 論文翻訳(概要): Automated Population-Level Audit Assurance via AI-Based Document Intelligence

論文の概要: Automated Population-Level Audit Assurance via AI-Based Document Intelligence

arxiv url: http://arxiv.org/abs/2605.05252v1
Date: Tue, 05 May 2026 19:17:18 GMT
ステータス: 翻訳完了
システム内更新日: 2026-05-08 22:27:11.316692
Title: Automated Population-Level Audit Assurance via AI-Based Document Intelligence
Title（参考訳）: AIベースのドキュメントインテリジェンスによる人口レベル監査の自動化
Authors: Santosh Vasudevan, Velu Natarajan,
Abstract要約: 監査トランザクションテストは、内部記録システムに対する顧客向けステートメントの正確性と完全性を検証する。従来の手作業による、非構造化PDFステートメントのサンプルベースのレビューは、労働集約的であり、数百万のトランザクションにスケールしない。本稿では,AIを用いた文書インテリジェンスを用いた大規模監査トランザクションテストの自動フレームワークを提案する。
参考スコア（独自算出の注目度）: 0.0
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: Audit transaction testing validates accuracy and completeness of customer-facing statements against internal systems of record. Traditional manual, sample-based review of unstructured PDF statements is labor-intensive and does not scale to millions of transactions. This paper presents an automated framework for large-scale audit transaction testing using AI-based document intelligence. The solution leverages Snowflake Document AI to extract structured data from unstructured PDF statements using a small labeled corpus (approximately 20 documents). Extracted data are reconciled against authoritative source-of-truth datasets to identify discrepancies at scale. Results are surfaced through interactive dashboards and automated reports. The framework enables population-level testing rather than sampling-based approaches, improving audit coverage and supporting continuous assurance objectives. Recent advances in document intelligence and analytics-driven audit frameworks enable scalable, near real-time risk identification and continuous assurance.
Abstract（参考訳）: 監査トランザクションテストは、内部記録システムに対する顧客向けステートメントの正確性と完全性を検証する。従来の手作業による、非構造化PDFステートメントのサンプルベースのレビューは、労働集約的であり、数百万のトランザクションにスケールしない。本稿では,AIを用いた文書インテリジェンスを用いた大規模監査トランザクションテストの自動フレームワークを提案する。このソリューションはSnowflake Document AIを利用して、小さなラベル付きコーパス(約20のドキュメント)を使用して、構造化されていないPDF文から構造化されたデータを抽出する。抽出されたデータは、信頼性の高いソース・オブ・トゥルース・データセットと照合され、大規模に差異を識別する。結果はインタラクティブなダッシュボードと自動レポートを通じて表示される。このフレームワークは、サンプリングベースのアプローチではなく、人口レベルのテストを可能にし、監査カバレッジを改善し、継続的な保証目標をサポートする。ドキュメントインテリジェンスと分析駆動型監査フレームワークの最近の進歩は、スケーラブルでほぼリアルタイムなリスク識別と継続的保証を可能にしている。

関連論文リスト

AJ-Bench: Benchmarking Agent-as-a-Judge for Environment-Aware Evaluation [71.49152943451328]
我々は,AJ-Benchベンチマークを導入し,ドメイン検索,データシステム,グラフィカルユーザインタフェースの3つの領域にまたがるエージェント・アズ・ア・Judgeを評価する。実験ではLLM-as-a-Judgeベースラインよりも一貫したパフォーマンス向上を示し、エージェントベースの検証においてかなりオープンな課題を明らかにした。
論文参考訳（メタデータ） (2026-04-20T13:23:38Z)
AutoVerifier: An Agentic Automated Verification Framework Using Large Language Models [8.006071608749648]
AutoVerifierは、技術的クレームのエンドツーエンド検証を自動化するエージェントフレームワークである。すべての技術的主張を形式の構造的クレームトリプルに分解する。新興技術の妥当性と成熟度を確実に評価することができる。
論文参考訳（メタデータ） (2026-04-03T01:11:43Z)
Dynamic analysis enhances issue resolution [53.50448142467294]
DAIRA(Dynamic Analysis-enhanced Issue Resolution Agent)は、エージェントの推論サイクルに動的解析を組み込む自動修復フレームワークである。テストトレース駆動の方法論によって駆動されるDAIRAは、軽量モニタを使用して重要なランタイムデータを抽出する。 Gemini 3 Flash Previewを使用すると、DAIRAは新たな最先端(SOTA)パフォーマンスを確立し、SWE-bench Verifiedデータセットで79.4%の解像度を達成する。
論文参考訳（メタデータ） (2026-03-23T14:48:54Z)
PaperAudit-Bench: Benchmarking Error Detection in Research Papers for Critical Automated Peer Review [54.141490756509306]
本稿では、エラーデータセットであるPaperAudit-Datasetと、自動レビューフレームワークであるPaperAudit-Reviewの2つのコンポーネントからなるPaperAudit-Benchを紹介する。 PaperAudit-Benchの実験では、モデルと検出深さの誤差検出可能性に大きなばらつきが示された。本研究では,SFTおよびRLによる軽量LLM検出器のトレーニングをサポートし,計算コストの削減による効率的な誤り検出を実現する。
論文参考訳（メタデータ） (2026-01-07T04:26:12Z)
AutoMalDesc: Large-Scale Script Analysis for Cyber Threat Research [81.04845910798387]
脅威検出のための自然言語の説明を生成することは、サイバーセキュリティ研究において未解決の問題である。本稿では,大規模に独立して動作する自動静的解析要約フレームワークAutoMalDescを紹介する。アノテーション付きシード(0.9K)データセットや方法論,評価フレームワークなど,100万以上のスクリプトサンプルの完全なデータセットを公開しています。
論文参考訳（メタデータ） (2025-11-17T13:05:25Z)
Transparent, Evaluable, and Accessible Data Agents: A Proof-of-Concept Framework [0.0]
本稿では、AIエージェントの開発と評価のためのモジュール型コンポーネントベースのアーキテクチャについて述べる。このシステムは、技術的でないユーザが複雑なデータウェアハウスと対話できるようにすることによって、データアクセシビリティにおける中核的な課題に対処する。設計の要点は、多層推論フレームワークを通じて達成される透明な意思決定へのコミットメントである。
論文参考訳（メタデータ） (2025-09-28T23:54:41Z)
ReliabilityRAG: Effective and Provably Robust Defense for RAG-based Web-Search [69.60882125603133]
本稿では,検索した文書の信頼性情報を明確に活用する,敵対的堅牢性のためのフレームワークであるReliabilityRAGを提案する。我々の研究は、RAGの回収されたコーパスの腐敗に対するより効果的で確実に堅牢な防御に向けた重要な一歩である。
論文参考訳（メタデータ） (2025-09-27T22:36:42Z)
AI Agents-as-Judge: Automated Assessment of Accuracy, Consistency, Completeness and Clarity for Enterprise Documents [0.0]
本研究では,AIエージェントを用いた高度に構造化された企業文書の自動レビューのためのモジュール型マルチエージェントシステムを提案する。 LangChain、CrewAI、TruLens、Guidanceといった現代的なオーケストレーションツールを使用して、文書のセクション単位での評価を可能にする。 99%の情報一貫性(人間の場合は92%)を実現し、エラーとバイアス率を半減させ、1文書あたりの平均レビュー時間を30分から2.5分に短縮する。
論文参考訳（メタデータ） (2025-06-23T17:46:15Z)
Towards Robust Fact-Checking: A Multi-Agent System with Advanced Evidence Retrieval [1.515687944002438]
デジタル時代における誤報の急速な拡散は、世論に重大な課題をもたらす。従来の人間主導のファクトチェック手法は信頼できるが、オンラインコンテンツの量と速度に苦慮している。本稿では, 精度, 効率, 説明性を向上する自動ファクトチェックのための新しいマルチエージェントシステムを提案する。
論文参考訳（メタデータ） (2025-06-22T02:39:27Z)
OpenFactCheck: Building, Benchmarking Customized Fact-Checking Systems and Evaluating the Factuality of Claims and LLMs [59.836774258359945]
OpenFactCheckは、カスタマイズされたファクトチェックシステムを構築するためのフレームワークである。ユーザーは自動的にファクトチェッカーをカスタマイズし、文書やクレームの事実的正当性を検証できる。 CheckerEVALは、人間の注釈付きデータセットを使用して、自動ファクトチェッカーの検証結果の信頼性を高めるソリューションである。
論文参考訳（メタデータ） (2024-05-09T07:15:19Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。