論文の概要: VERAFI: Verified Agentic Financial Intelligence through Neurosymbolic Policy Generation
- arxiv url: http://arxiv.org/abs/2512.14744v1
- Date: Fri, 12 Dec 2025 17:17:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-12-18 17:06:26.709517
- Title: VERAFI: Verified Agentic Financial Intelligence through Neurosymbolic Policy Generation
- Title(参考訳): VERAFI:ニューロシンボリック・ポリシー・ジェネレーションによるエージェント・ファイナンシャル・インテリジェンス検証
- Authors: Adewale Akinfaderin, Shreyas Subramanian,
- Abstract要約: VERAFIは、検証された金融インテリジェンスのためのニューロシンボリックポリシー生成のためのエージェントフレームワークである。
VERAFIは最先端の高密度検索とクロスエンコーダを、金融ツール対応エージェントと自動推論ポリシーと組み合わせている。
- 参考スコア(独自算出の注目度): 2.43679682660038
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Financial AI systems suffer from a critical blind spot: while Retrieval-Augmented Generation (RAG) excels at finding relevant documents, language models still generate calculation errors and regulatory violations during reasoning, even with perfect retrieval. This paper introduces VERAFI (Verified Agentic Financial Intelligence), an agentic framework with neurosymbolic policy generation for verified financial intelligence. VERAFI combines state-of-the-art dense retrieval and cross-encoder reranking with financial tool-enabled agents and automated reasoning policies covering GAAP compliance, SEC requirements, and mathematical validation. Our comprehensive evaluation on FinanceBench demonstrates remarkable improvements: while traditional dense retrieval with reranking achieves only 52.4\% factual correctness, VERAFI's integrated approach reaches 94.7\%, an 81\% relative improvement. The neurosymbolic policy layer alone contributes a 4.3 percentage point gain over pure agentic processing, specifically targeting persistent mathematical and logical errors. By integrating financial domain expertise directly into the reasoning process, VERAFI offers a practical pathway toward trustworthy financial AI that meets the stringent accuracy demands of regulatory compliance, investment decisions, and risk management.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG)は関連文書の発見に長けているが、言語モデルは推論中に計算エラーや規制違反を発生させる。
本稿では、検証された金融インテリジェンスのためのニューロシンボリックポリシー生成のためのエージェントフレームワークであるVERAFI(Verified Agentic Financial Intelligence)を紹介する。
VERAFIは、最先端の密集検索とクロスエンコーダを、金融ツール対応エージェントと組み合わせ、GAAPコンプライアンス、SEC要件、数学的検証を含む自動推論ポリシーを組み合わせる。
ファイナンスベンチに関する包括的評価は, 従来の高密度検索では52.4\%の事実正当性しか得られなかったが, VERAFIの総合的アプローチは94.7\%に達し, 81\%の相対的改善が得られた。
ニューロシンボリック・ポリシー・レイヤだけでも純粋なエージェント処理よりも4.3パーセントのポイントゲインをもたらしており、特に永続的な数学的および論理的エラーをターゲットとしている。
金融分野の専門知識を直接推論プロセスに統合することにより、VERAFIは、規制コンプライアンス、投資決定、リスク管理の厳格な精度要求を満たす、信頼できる金融AIへの実践的な経路を提供する。
関連論文リスト
- FinAgentBench: A Benchmark Dataset for Agentic Retrieval in Financial Question Answering [57.18367828883773]
FinAgentBenchは、ファイナンスにおける多段階推論によるエージェント検索を評価するためのベンチマークである。
このベンチマークは、S&P-500上場企業に関する26Kのエキスパートアノテート例から成っている。
我々は,最先端モデルの集合を評価し,対象の微調整がエージェント検索性能を大幅に向上することを示す。
論文 参考訳(メタデータ) (2025-08-07T22:15:22Z) - Agentar-Fin-R1: Enhancing Financial Intelligence through Domain Expertise, Training Efficiency, and Advanced Reasoning [12.548390779247987]
本稿では,Agensar-Fin-R1シリーズを紹介する。
我々の最適化手法は、高品質で体系的な金融タスクラベルシステムを統合する。
われわれのモデルは、主要な金融指標を総合的に評価している。
論文 参考訳(メタデータ) (2025-07-22T17:52:16Z) - FinHEAR: Human Expertise and Adaptive Risk-Aware Temporal Reasoning for Financial Decision-Making [58.04602111184477]
FinHEARは、人間の専門知識と適応的リスク認識推論のためのフレームワークである。
専門のエージェントを編成し、過去の傾向を分析し、現在の出来事を解釈し、専門家にインフォームドされた前例を検索する。
金融データセットの実証的な結果から、FinHEARはトレンド予測やトレーディングタスクにおいて、一貫して強いベースラインを上回ります。
論文 参考訳(メタデータ) (2025-06-10T04:06:51Z) - FinChain: A Symbolic Benchmark for Verifiable Chain-of-Thought Financial Reasoning [82.7292329605713]
FinChainは、ファイナンスにおける検証可能なChain-of-Thought評価のために特別に設計された最初のベンチマークである。
12の金融ドメインに58のトピックがあり、それぞれがパラメータ化されたシンボリックテンプレートと実行可能なPythonトレースで表現されている。
FinChainは、多段階の財務推論における永続的な弱点を明らかにし、信頼できる、解釈可能な、検証可能な金融AIを開発するための基盤を提供する。
論文 参考訳(メタデータ) (2025-06-03T06:44:42Z) - AI for Climate Finance: Agentic Retrieval and Multi-Step Reasoning for Early Warning System Investments [1.3192560874022086]
本研究は、気候リスク・早期警戒システム(CREWS)ファンドにおけるEWS投資の追跡という現実的な応用に焦点を当てる。
我々は25のMDBプロジェクト文書を分析し、ゼロショット学習や少数ショット学習を含む複数のAI駆動型分類手法を評価する。
以上の結果より, エージェントベースRAGアプローチは, 87%の精度, 89%の精度, 83%のリコールを達成し, 他の手法よりも優れていた。
論文 参考訳(メタデータ) (2025-04-07T14:11:11Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z) - FinBen: A Holistic Financial Benchmark for Large Language Models [75.09474986283394]
FinBenは、24の財務タスクにまたがる36のデータセットを含む、最初の大規模なオープンソース評価ベンチマークである。
FinBenは、幅広いタスクとデータセット、ストックトレーディングの最初の評価、新しいエージェントと検索可能な生成(RAG)の評価、およびテキスト要約、質問応答、株式トレーディングのための3つの新しいオープンソース評価データセットを提供する。
論文 参考訳(メタデータ) (2024-02-20T02:16:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。