論文の概要: VeritasFi: An Adaptable, Multi-tiered RAG Framework for Multi-modal Financial Question Answering
- arxiv url: http://arxiv.org/abs/2510.10828v1
- Date: Sun, 12 Oct 2025 22:45:24 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-14 18:06:30.123901
- Title: VeritasFi: An Adaptable, Multi-tiered RAG Framework for Multi-modal Financial Question Answering
- Title(参考訳): VeritasFi: マルチモーダル財務質問応答のための適応型多層RAGフレームワーク
- Authors: Zhenghan Tai, Hanwei Wu, Qingchen Hu, Jijun Chi, Hailin He, Lei Ding, Tung Sum Thomas Kwok, Bohuai Xiao, Yuchen Hua, Suyuchen Wang, Peng Lu, Muzhi Li, Yihong Wu, Liheng Ma, Jerry Huang, Jiayi Zhang, Gonghao Zhang, Chaolong Jiang, Jingrui Tian, Sicheng Lyu, Zeyu Li, Boyu Han, Fengran Mo, Xinyue Yu, Yufei Cui, Ling Zhou, Xinyu Wang,
- Abstract要約: 金融セクターにおける質問回答 (QA) には, RAG (Retrieval-Augmented Generation) がますます重要になっている。
We present VeritasFi, a innovative hybrid RAG framework that with a multi-modal preprocessing pipeline。
提案した設計を統合することで、VeritasFiは金融RAGシステムの適応性と堅牢性を大幅に向上する画期的なフレームワークを提供する。
- 参考スコア(独自算出の注目度): 31.334698403426245
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) is becoming increasingly essential for Question Answering (QA) in the financial sector, where accurate and contextually grounded insights from complex public disclosures are crucial. However, existing financial RAG systems face two significant challenges: (1) they struggle to process heterogeneous data formats, such as text, tables, and figures; and (2) they encounter difficulties in balancing general-domain applicability with company-specific adaptation. To overcome these challenges, we present VeritasFi, an innovative hybrid RAG framework that incorporates a multi-modal preprocessing pipeline alongside a cutting-edge two-stage training strategy for its re-ranking component. VeritasFi enhances financial QA through three key innovations: (1) A multi-modal preprocessing pipeline that seamlessly transforms heterogeneous data into a coherent, machine-readable format. (2) A tripartite hybrid retrieval engine that operates in parallel, combining deep multi-path retrieval over a semantically indexed document corpus, real-time data acquisition through tool utilization, and an expert-curated memory bank for high-frequency questions, ensuring comprehensive scope, accuracy, and efficiency. (3) A two-stage training strategy for the document re-ranker, which initially constructs a general, domain-specific model using anonymized data, followed by rapid fine-tuning on company-specific data for targeted applications. By integrating our proposed designs, VeritasFi presents a groundbreaking framework that greatly enhances the adaptability and robustness of financial RAG systems, providing a scalable solution for both general-domain and company-specific QA tasks. Code accompanying this work is available at https://github.com/simplew4y/VeritasFi.git.
- Abstract(参考訳): 複雑な公開情報からの正確かつ文脈的に根ざした洞察が不可欠である金融セクターにおける質問回答(QA)には、レトリーバル強化世代(RAG)が欠かせないものになりつつある。
しかし,既存の金融RAGシステムでは,(1)テキスト,表,図などの異種データフォーマットの処理に苦慮し,(2)企業固有の適応と一般ドメイン適用性のバランスをとるのが困難である,という2つの大きな課題に直面している。
これらの課題を克服するために、私たちはVeritasFiという革新的なハイブリッドなRAGフレームワークを紹介します。
VeritasFiは、1)異種データをシームレスにコヒーレントでマシン可読なフォーマットに変換するマルチモーダル前処理パイプライン。
2) セマンティックインデックス化された文書コーパス上での深いマルチパス検索, ツール利用によるリアルタイムデータ取得, および高頻度質問のための専門家計算メモリバンクを併用し, 包括的範囲, 精度, 効率の確保を図る。
(3) 匿名化データを用いた汎用ドメイン固有モデルの構築と,対象アプリケーションを対象とした企業固有データの迅速な微調整を行う文書再ランカの2段階トレーニング戦略について検討した。
提案した設計を統合することで、VeritasFiは、金融RAGシステムの適応性と堅牢性を大幅に向上し、汎用ドメインと企業固有のQAタスクの両方にスケーラブルなソリューションを提供する、画期的なフレームワークを提供する。
この作業に伴うコードはhttps://github.com/simplew4y/VeritasFi.git.comで公開されている。
関連論文リスト
- Learning to Route: A Rule-Driven Agent Framework for Hybrid-Source Retrieval-Augmented Generation [55.47971671635531]
大言語モデル(LLM)は、一般質問回答(QA)において顕著な性能を示した。
Retrieval-Augmented Generation (RAG)は、LLMを外部知識で強化することで、この制限に対処する。
既存のシステムは、主に構造化されていないドキュメントに依存しているが、主にリレーショナルデータベースを見下ろしている。
論文 参考訳(メタデータ) (2025-09-30T22:19:44Z) - MMESGBench: Pioneering Multimodal Understanding and Complex Reasoning Benchmark for ESG Tasks [56.350173737493215]
環境・社会・ガバナンス(ESG)報告は、持続可能性の実践の評価、規制コンプライアンスの確保、財務透明性の促進に不可欠である。
MMESGBenchは、マルチモーダル理解と複雑な推論を、構造的に多種多様なマルチソースESG文書間で評価するための、最初のベンチマークデータセットである。
MMESGBenchは、45のESG文書から得られた933の検証済みQAペアで構成され、7つの異なるドキュメントタイプと3つの主要なESGソースカテゴリにまたがる。
論文 参考訳(メタデータ) (2025-07-25T03:58:07Z) - SMARTFinRAG: Interactive Modularized Financial RAG Benchmark [0.0]
金融セクターは、言語モデル技術を急速に採用しているが、この領域で専門的なRAGシステムを評価することは依然として困難である。
本稿では、SMARTFinRAGについて、1)実行時に動的にコンポーネントを交換できる完全にモジュール化されたアーキテクチャ、2)新たに摂取した財務文書からドメイン固有のQAペアを生成する文書中心評価パラダイム、3)調査実装の分割を記述した直感的なインターフェース、の3つの重要なギャップに対処する。
論文 参考訳(メタデータ) (2025-04-25T02:29:56Z) - FinDER: Financial Dataset for Question Answering and Evaluating Retrieval-Augmented Generation [65.04104723843264]
ファイナンスにおけるRetrieval-Augmented Generation(RAG)に適したエキスパート生成データセットであるFinDERを提案する。
FinDERは、ドメインの専門家による検索関連証拠の注釈付けに重点を置いており、5,703のクエリ・エビデンス・アンサー・トリプルを提供している。
大きなコーパスから関連する情報を取得するためにモデルに挑戦することで、FinDERはRAGシステムを評価するためのより現実的なベンチマークを提供する。
論文 参考訳(メタデータ) (2025-04-22T11:30:13Z) - FinSage: A Multi-aspect RAG System for Financial Filings Question Answering [10.953520766530005]
FinSageはマルチモーダルな事前処理パイプラインで、多様なデータフォーマットを統一し、メタデータの要約を生成する。
実験の結果、FinSageは75人の専門家による質問に対して92.51%の印象的なリコールを達成した。
FinSageは、すでに1200人以上が利用しているオンラインミーティングにおいて、財務的な質問応答エージェントとして成功している。
論文 参考訳(メタデータ) (2025-04-20T04:58:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。