論文の概要: Structure First, Reason Next: Enhancing a Large Language Model using Knowledge Graph for Numerical Reasoning in Financial Documents
- arxiv url: http://arxiv.org/abs/2601.07754v1
- Date: Mon, 12 Jan 2026 17:39:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-13 19:08:01.697884
- Title: Structure First, Reason Next: Enhancing a Large Language Model using Knowledge Graph for Numerical Reasoning in Financial Documents
- Title(参考訳): 構造第一、次は推論:財務文書における数値推論のための知識グラフを用いた大規模言語モデルの強化
- Authors: Aryan Mishra, Akash Anil,
- Abstract要約: 大規模言語モデル(LLM)は、複数のQ-Aシステムにおいて有望な結果を示している。
知識グラフ(KG)のような構造化データ拡張は、LSMの予測を著しく改善した。
本稿では,KGを用いた構造化情報と,数値推論タスクのためのLLM予測を併用するフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.21485350418225244
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Numerical reasoning is an important task in the analysis of financial documents. It helps in understanding and performing numerical predictions with logical conclusions for the given query seeking answers from financial texts. Recently, Large Language Models (LLMs) have shown promising results in multiple Question-Answering (Q-A) systems with the capability of logical reasoning. As documents related to finance often consist of long and complex financial contexts, LLMs appear well-suited for building high-quality automated financial question-answering systems. However, LLMs often face challenges in accurately processing the various numbers within financial reports. Extracting numerical data from unstructured text and semi-structured tables, and reliably performing accurate calculations, remains a significant bottleneck for numerical reasoning in most state-of-the-art LLMs. Recent studies have shown that structured data augmentations, such as Knowledge Graphs (KGs), have notably improved the predictions of LLMs along with logical explanations. Thus, it is an important requirement to consider inherent structured information in financial reports while using LLMs for various financial analytics. This paper proposes a framework to incorporate structured information using KGs along with LLM predictions for numerical reasoning tasks. The KGs are extracted using a proposed schema inherently from the document under processing. We evaluated our proposed framework over the benchmark data FinQA, using an open-source LLM, namely Llama 3.1 8B Instruct. We observed that the proposed framework improved execution accuracy by approximately 12% relative to the vanilla LLM.
- Abstract(参考訳): 数値推論は、財務文書の分析において重要な課題である。
これは、財務文書から回答を求めるクエリに対して、論理的な結論を伴う数値予測を理解し、実行するのに役立ちます。
近年,Large Language Models (LLMs) は,論理的推論能力を備えた複数のQ-Aシステムにおいて,有望な結果を示している。
金融に関する文書は、しばしば長く複雑な財務状況から成り立っているため、LLMは高品質の財務質問応答システムを構築するのに適しているように見える。
しかし、LLMは財務報告の中で様々な数字を正確に処理する上で、しばしば課題に直面している。
構造化されていないテキストや半構造化されたテーブルから数値データを抽出し、正確な計算を確実に行うことは、ほとんどの最先端のLCMにおいて数値推論において重要なボトルネックとなっている。
近年の研究では、知識グラフ(KG)のような構造化されたデータ拡張が、論理的説明とともにLLMの予測を著しく改善していることが示されている。
したがって、様々な財務分析にLLMを使用しながら、財務報告に固有の構造化情報を検討することが重要である。
本稿では,KGを用いた構造化情報と,数値推論タスクのためのLLM予測を併用するフレームワークを提案する。
KGは、本来は処理中の文書から提案されたスキーマを用いて抽出される。
我々は,Llama 3.1 8B InstructというオープンソースのLLMを用いて,ベンチマークデータFinQAに対して提案したフレームワークを評価した。
提案手法により,バニラLLMと比較して約12%の精度で実行精度が向上した。
関連論文リスト
- FinAuditing: A Financial Taxonomy-Structured Multi-Document Benchmark for Evaluating LLMs [40.216867348210265]
FinAuditingは、財務監査タスクを評価するための最初の分類基準であり、構造を意識したマルチドキュメントのベンチマークである。
本物のアメリカ製である。
FinAuditingは3つの補完的なサブタスク、セマンティック一貫性のためのFinSM、リレーショナル一貫性のためのFinRE、数値一貫性のためのFinMRを定義している。
13の最先端のLCMに関する大規模なゼロショット実験は、現在のモデルが意味論、関係論、数学的次元で矛盾なく機能することを明らかにする。
論文 参考訳(メタデータ) (2025-10-10T00:41:55Z) - FinAgentBench: A Benchmark Dataset for Agentic Retrieval in Financial Question Answering [57.18367828883773]
FinAgentBenchは、ファイナンスにおける多段階推論によるエージェント検索を評価するためのベンチマークである。
このベンチマークは、S&P-500上場企業に関する26Kのエキスパートアノテート例から成っている。
我々は,最先端モデルの集合を評価し,対象の微調整がエージェント検索性能を大幅に向上することを示す。
論文 参考訳(メタデータ) (2025-08-07T22:15:22Z) - FAITH: A Framework for Assessing Intrinsic Tabular Hallucinations in Finance [3.565466729914703]
金融に大規模言語モデル(LLM)をデプロイする上で、幻覚は依然として重要な課題である。
金融LLMにおける内因性幻覚を評価するための厳密でスケーラブルなフレームワークを開発する。
私たちの仕事は、より信頼性が高く信頼性の高い財務生成AIシステムを構築するための重要なステップとして役立ちます。
論文 参考訳(メタデータ) (2025-08-07T09:37:14Z) - RAG-IT: Retrieval-Augmented Instruction Tuning for Automated Financial Analysis [1.2891210250935148]
RAG-IT(Retrieval-Augmented Instruction Tuning)は、業績報告の自動作成を目的とした新しいフレームワークである。
提案手法は,検索強化と命令ベースファインチューニングを統合し,現実的精度,文脈的妥当性,ドメイン適応性を向上する。
論文 参考訳(メタデータ) (2024-12-11T08:09:42Z) - Evaluating LLMs' Mathematical Reasoning in Financial Document Question Answering [54.486757407849915]
本研究では,大言語モデルによる4つの財務質問応答データセットの数学的推論について検討する。
数理推論のステップの数が増えるにつれて、テーブルの複雑さや性能の変化に対する感度に焦点をあてる。
半構造化文書に適した新しいプロンプト技術を導入する。
論文 参考訳(メタデータ) (2024-02-17T05:10:18Z) - PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark
for Finance [63.51545277822702]
PIXIUは、命令データ付き微調整LLaMAに基づく最初の金融大規模言語モデル(LLM)を含む包括的なフレームワークである。
我々はLLaMAを細調整してFinMAを提案する。
我々は、FinMAと既存のLLMを詳細に分析し、重要な財政課題に対処する際の長所と短所を明らかにする。
論文 参考訳(メタデータ) (2023-06-08T14:20:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。