論文の概要: MimirRAG: A Multi-Agent RAG Framework for Financial Data Retrieval with Metadata Integration
- arxiv url: http://arxiv.org/abs/2605.25030v1
- Date: Sun, 24 May 2026 12:15:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.663673
- Title: MimirRAG: A Multi-Agent RAG Framework for Financial Data Retrieval with Metadata Integration
- Title(参考訳): MimirRAG: メタデータ統合による財務データ検索のためのマルチエージェントRAGフレームワーク
- Authors: Magnus Samuelsen, Wilmer Nyström, Somnath Mazumdar, Mansoor Hussain, Mikkel Strange,
- Abstract要約: Retrieval-augmented Generation (RAG) システムは、大型言語モデル(LLM)における幻覚の低減と解答精度の向上に有望なアプローチを提供する。
本稿では,これらの課題に対処するために反復的に開発されたマルチエージェントパイプラインシステムであるMimirRAGを紹介する。
MimicRAGは、PDFファイルの構造保存構文解析、テーブル対応チャンキング、メタデータ抽出、クエリ計画を伴うエージェントベースの検索、ハイブリッド検索、バリデーション、数値推論をサポートするコンテキスト認識生成を含むモジュラーパイプラインを備えている。
- 参考スコア(独自算出の注目度): 0.29360071145551064
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Retrieval-augmented generation (RAG) systems offer a promising approach to reduce hallucinations and improve answer accuracy in large language models (LLMs), a requirement for reliable, financial analysis where answers must be grounded in verifiable evidence from filings rather than generated from model priors. However, designing RAG systems that extract meaningful insights from mixed financial documents and integrate into analyst workflows remains challenging. This paper introduces MimirRAG (Metadata-Integrated Multi-Agent Information Retrieval), a multi-agent RAG system developed iteratively to address these challenges. MimirRAG features a modular pipeline encompassing structure-preserving parsing of PDF filings, table-aware chunking, metadata extraction, agent-based retrieval with query planning and hybrid search, validation, and context-aware generation with numerical reasoning support. Our ablation study identifies three key technical enablers for effective financial RAG: metadata integration, table-aware chunking, and an agentic workflow. MimirRAG was evaluated quantitatively using FinanceBench and qualitatively through expert validation with four financial analysts. The system achieved 89.3% accuracy on FinanceBench, outperforming the original benchmark baselines. Expert feedback highlighted that successful deployment also requires calibrated trust, comprehensive data integration, and user personalization. We conclude that combining multi-agent RAG architecture with human-centric design principles can improve the extraction of meaningful insights in financial analysis.
- Abstract(参考訳): Retrieval-augmented Generation (RAG) システムは、大規模言語モデル(LLM)における幻覚の低減と解答精度向上のための有望なアプローチを提供する。
しかし、混合財務文書から有意義な洞察を抽出し、分析ワークフローに統合するRAGシステムを設計することは依然として困難である。
本稿では,これらの課題に対して反復的に開発したマルチエージェントRAGシステムであるMimirRAG(Metadata-Integrated Multi-Agent Information Retrieval)を紹介する。
MimirRAGは、PDFファイルの構造保存構文解析、テーブル対応チャンキング、メタデータ抽出、クエリ計画を伴うエージェントベースの検索、ハイブリッド検索、バリデーション、数値推論をサポートするコンテキスト認識生成を含むモジュラーパイプラインを備えている。
我々のアブレーション調査では、メタデータの統合、テーブル対応チャンキング、エージェントワークフローという、効果的な金融RAGのための3つの重要な技術的実現要因を特定しました。
ミミルラグはファイナンスベンチを用いて定量的に評価され、4人の金融アナリストと専門家による検証を通じて質的に評価された。
このシステムはファイナンスベンチで89.3%の精度を達成し、当初のベンチマークベースラインを上回った。
専門家のフィードバックでは、デプロイメントを成功させるためには、キャリブレーションされた信頼、包括的なデータ統合、ユーザのパーソナライゼーションも必要だ、と強調されている。
我々は、マルチエージェントRAGアーキテクチャと人間中心の設計原則を組み合わせることで、財務分析における有意義な洞察の抽出を改善することができると結論付けた。
関連論文リスト
- FinSight: Towards Real-World Financial Deep Research [68.31086471310773]
FinSightは、高品質でマルチモーダルな財務報告を作成するための新しいフレームワークである。
プロフェッショナルグレードの可視化を確保するため,反復視覚強調機構を提案する。
2段階のBinging Frameworkは、簡潔な分析セグメントをコヒーレント、引用認識、マルチモーダルレポートに拡張する。
論文 参考訳(メタデータ) (2025-10-19T14:05:35Z) - Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。
現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。
Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文 参考訳(メタデータ) (2025-10-17T02:33:16Z) - Enhancing Financial RAG with Agentic AI and Multi-HyDE: A Novel Approach to Knowledge Retrieval and Hallucination Reduction [0.5814806132299305]
我々は、金融レトリヴァル強化世代(RAG)のための枠組みを導入する。
RAGは、大規模で構造化された財務コーパスからの検索の有効性とカバレッジを高めるために、複数の無意味なクエリを生成する。
私たちのパイプラインはトークン効率と多段階の財務推論に最適化されています。
論文 参考訳(メタデータ) (2025-09-19T19:24:30Z) - FinAgentBench: A Benchmark Dataset for Agentic Retrieval in Financial Question Answering [57.18367828883773]
FinAgentBenchは、ファイナンスにおける多段階推論によるエージェント検索を評価するためのベンチマークである。
このベンチマークは、S&P-500上場企業に関する26Kのエキスパートアノテート例から成っている。
我々は,最先端モデルの集合を評価し,対象の微調整がエージェント検索性能を大幅に向上することを示す。
論文 参考訳(メタデータ) (2025-08-07T22:15:22Z) - FinSage: A Multi-aspect RAG System for Financial Filings Question Answering [10.953520766530005]
FinSageはマルチモーダルな事前処理パイプラインで、多様なデータフォーマットを統一し、メタデータの要約を生成する。
実験の結果、FinSageは75人の専門家による質問に対して92.51%の印象的なリコールを達成した。
FinSageは、すでに1200人以上が利用しているオンラインミーティングにおいて、財務的な質問応答エージェントとして成功している。
論文 参考訳(メタデータ) (2025-04-20T04:58:14Z) - Advancing Anomaly Detection: Non-Semantic Financial Data Encoding with LLMs [49.57641083688934]
本稿では,Large Language Models (LLM) 埋め込みを用いた財務データにおける異常検出の新しい手法を提案する。
実験により,LLMが異常検出に有用な情報をもたらし,モデルがベースラインを上回っていることが確認された。
論文 参考訳(メタデータ) (2024-06-05T20:19:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。