論文の概要: FinRAGBench-V: A Benchmark for Multimodal RAG with Visual Citation in the Financial Domain
- arxiv url: http://arxiv.org/abs/2505.17471v1
- Date: Fri, 23 May 2025 04:51:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-26 18:08:33.822167
- Title: FinRAGBench-V: A Benchmark for Multimodal RAG with Visual Citation in the Financial Domain
- Title(参考訳): FinRAGBench-V:金融ドメインにおける視覚刺激付きマルチモーダルRAGのベンチマーク
- Authors: Suifeng Zhao, Zhuoran Jin, Sujian Li, Jun Gao,
- Abstract要約: FinRAGBench-Vは金融用に最適化された総合的なビジュアルRAGベンチマークである。
マルチモーダルデータを統合し、トレーサビリティを確保するために視覚的引用を提供する。
RGenCiteは、視覚的引用と生成をシームレスに統合するRAGベースラインである。
- 参考スコア(独自算出の注目度): 17.149559760539344
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Retrieval-Augmented Generation (RAG) plays a vital role in the financial domain, powering applications such as real-time market analysis, trend forecasting, and interest rate computation. However, most existing RAG research in finance focuses predominantly on textual data, overlooking the rich visual content in financial documents, resulting in the loss of key analytical insights. To bridge this gap, we present FinRAGBench-V, a comprehensive visual RAG benchmark tailored for finance which effectively integrates multimodal data and provides visual citation to ensure traceability. It includes a bilingual retrieval corpus with 60,780 Chinese and 51,219 English pages, along with a high-quality, human-annotated question-answering (QA) dataset spanning heterogeneous data types and seven question categories. Moreover, we introduce RGenCite, an RAG baseline that seamlessly integrates visual citation with generation. Furthermore, we propose an automatic citation evaluation method to systematically assess the visual citation capabilities of Multimodal Large Language Models (MLLMs). Extensive experiments on RGenCite underscore the challenging nature of FinRAGBench-V, providing valuable insights for the development of multimodal RAG systems in finance.
- Abstract(参考訳): Retrieval-Augmented Generation (RAG) は、リアルタイム市場分析、トレンド予測、金利計算など、金融分野において重要な役割を担っている。
しかしながら、既存の金融におけるRAG研究のほとんどは、主にテキストデータに焦点を当てており、財務文書の豊富な視覚的内容を見渡すことで、重要な分析的洞察が失われている。
このギャップを埋めるためにFinRAGBench-Vを提案する。FinRAGBench-Vは、マルチモーダルデータを効果的に統合し、トレーサビリティを確保するために視覚的引用を提供する金融のための総合的なビジュアルRAGベンチマークである。
中国語60,780ページと英語51,219ページのバイリンガル検索コーパスと、異種データタイプと7つの質問カテゴリにまたがる高品質な人手による質問回答(QA)データセットが含まれている。
さらに,視覚刺激と生成をシームレスに統合するRAGベースラインであるRGenCiteを紹介する。
さらに,MLLM(Multimodal Large Language Models)の視覚的引用能力を体系的に評価する自動引用評価手法を提案する。
RGenCiteの大規模な実験はFinRAGBench-Vの挑戦的な性質を強調し、金融におけるマルチモーダルRAGシステムの開発に貴重な洞察を与えている。
関連論文リスト
- FinDER: Financial Dataset for Question Answering and Evaluating Retrieval-Augmented Generation [63.55583665003167]
ファイナンスにおけるRetrieval-Augmented Generation(RAG)に適したエキスパート生成データセットであるFinDERを提案する。
FinDERは、ドメインの専門家による検索関連証拠の注釈付けに重点を置いており、5,703のクエリ・エビデンス・アンサー・トリプルを提供している。
大きなコーパスから関連する情報を取得するためにモデルに挑戦することで、FinDERはRAGシステムを評価するためのより現実的なベンチマークを提供する。
論文 参考訳(メタデータ) (2025-04-22T11:30:13Z) - Optimizing Retrieval Strategies for Financial Question Answering Documents in Retrieval-Augmented Generation Systems [5.712288463584192]
Retrieval-Augmented Generation (RAG)は、大規模言語モデル(LLM)における幻覚を緩和するための有望なフレームワークとして登場した。
本研究では,財務文書の検索を効率化する,効率的なエンドツーエンドRAGパイプラインを提案する。
論文 参考訳(メタデータ) (2025-03-19T13:21:49Z) - Enhancing Financial Time-Series Forecasting with Retrieval-Augmented Large Language Models [29.769616823587594]
金融時系列予測に特化して設計された最初の検索拡張世代(RAG)フレームワークを提案する。
フレームワークには3つの重要なイノベーションが含まれている: 微調整された1B大言語モデル(StockLLM)をバックボーンとし、LSMフィードバックによって拡張された新しい候補選択方法と、クエリと歴史的に重要なシーケンスとの類似性を最大化するトレーニング目標である。
論文 参考訳(メタデータ) (2025-02-09T12:26:05Z) - VisDoM: Multi-Document QA with Visually Rich Elements Using Multimodal Retrieval-Augmented Generation [100.06122876025063]
本稿では,マルチドキュメント設定でQAシステムを評価するために設計された,初の総合ベンチマークであるVisDoMBenchを紹介する。
視覚とテキストのRAGを同時に利用する新しいマルチモーダル検索拡張生成(RAG)手法であるVisDoMRAGを提案する。
論文 参考訳(メタデータ) (2024-12-14T06:24:55Z) - Multi-modal Retrieval Augmented Multi-modal Generation: Datasets, Evaluation Metrics and Strong Baselines [64.61315565501681]
M$2$RAG(Multi-modal Retrieval Augmented Multi-modal Generation)は、基礎モデルのマルチモーダルWebコンテンツ処理を可能にする新しいタスクである。
潜在的な影響にもかかわらず、M$2$RAGは、包括的な分析と高品質なデータリソースを欠いている。
論文 参考訳(メタデータ) (2024-11-25T13:20:19Z) - Multi-Reranker: Maximizing performance of retrieval-augmented generation in the FinanceRAG challenge [5.279257531335345]
本稿では,ACM-ICAIF '24 FinanceRAGコンペティションのための,高性能で財務特化度の高いRetrieval-Augmented Generation(RAG)システムの開発について述べる。
我々は,検索前段階におけるクエリ拡張とコーパスの洗練に関するアブレーション研究を通じて,性能を最適化した。
特に,生成フェーズの長いコンテキストサイズを管理するための効率的な手法を導入し,性能を犠牲にすることなく応答品質を大幅に改善した。
論文 参考訳(メタデータ) (2024-11-23T09:56:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。