論文の概要: FINCH: Financial Intelligence using Natural language for Contextualized SQL Handling
- arxiv url: http://arxiv.org/abs/2510.01887v1
- Date: Thu, 02 Oct 2025 10:55:11 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-03 16:59:21.094148
- Title: FINCH: Financial Intelligence using Natural language for Contextualized SQL Handling
- Title(参考訳): FINCH: コンテキスト化されたSQL処理のための自然言語を用いた金融情報
- Authors: Avinash Kumar Singh, Bhaskarjit Sarmah, Stefano Pasquali,
- Abstract要約: 我々は、292のテーブルと75,725の自然言語ベースのペアからなる金融データベース(FINCH)を導入する。
様々なスケールの推論モデルと言語モデルをベンチマークし、その強みと限界を体系的に分析する。
最後に,既存の測度で見過ごされるニュアンスを捉える金融指向評価指標(FINCHスコア)を提案する。
- 参考スコア(独自算出の注目度): 1.8679829796354372
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Text-to-SQL, the task of translating natural language questions into SQL queries, has long been a central challenge in NLP. While progress has been significant, applying it to the financial domain remains especially difficult due to complex schema, domain-specific terminology, and high stakes of error. Despite this, there is no dedicated large-scale financial dataset to advance research, creating a critical gap. To address this, we introduce a curated financial dataset (FINCH) comprising 292 tables and 75,725 natural language-SQL pairs, enabling both fine-tuning and rigorous evaluation. Building on this resource, we benchmark reasoning models and language models of varying scales, providing a systematic analysis of their strengths and limitations in financial Text-to-SQL tasks. Finally, we propose a finance-oriented evaluation metric (FINCH Score) that captures nuances overlooked by existing measures, offering a more faithful assessment of model performance.
- Abstract(参考訳): 自然言語の質問をSQLクエリに変換するタスクであるText-to-SQLは、長い間、NLPにおいて中心的な課題だった。
進展は大きいが、複雑なスキーマ、ドメイン固有の用語、エラーのリスクが高いため、金融分野に適用することは特に困難である。
それにもかかわらず、研究を進めるための大規模な財務データセットは存在せず、重大なギャップを形成している。
これを解決するために、292のテーブルと75,725の自然言語-SQLペアからなる金融データベース(FINCH)を導入し、微調整と厳密な評価を可能にした。
このリソースに基づいて、さまざまなスケールの推論モデルと言語モデルをベンチマークし、財務的なテキスト-SQLタスクの長所と短所を体系的に分析する。
最後に、既存の尺度で見過ごされるニュアンスを捉え、モデル性能をより忠実に評価する金融指向評価指標(FINCHスコア)を提案する。
関連論文リスト
- The CLEF-2026 FinMMEval Lab: Multilingual and Multimodal Evaluation of Financial AI Systems [54.12165004393043]
FinMMEval 2026は、財務的理解、推論、意思決定にまたがる3つの相互接続タスクを提供する。
このラボは、堅牢で透明でグローバルに包括的な金融AIシステムの開発を促進することを目的としている。
論文 参考訳(メタデータ) (2026-02-11T14:14:06Z) - FinSight: Towards Real-World Financial Deep Research [68.31086471310773]
FinSightは、高品質でマルチモーダルな財務報告を作成するための新しいフレームワークである。
プロフェッショナルグレードの可視化を確保するため,反復視覚強調機構を提案する。
2段階のBinging Frameworkは、簡潔な分析セグメントをコヒーレント、引用認識、マルチモーダルレポートに拡張する。
論文 参考訳(メタデータ) (2025-10-19T14:05:35Z) - Exploring Large Language Models for Financial Applications: Techniques, Performance, and Challenges with FinMA [0.0]
PIXIUフレームワークで作成されたモデルであるFinMAは、専門的な財務業務におけるパフォーマンスを評価する。
調査の結果,FinMAは感情分析や分類に優れていたが,数値推論,実体認識,要約といったタスクにおいて顕著な課題に直面していることがわかった。
論文 参考訳(メタデータ) (2025-10-02T11:19:59Z) - FinStat2SQL: A Text2SQL Pipeline for Financial Statement Analysis [0.0]
FinStat2は、財務上の自然言語クエリを可能にする軽量のtext2sqlパイプラインである。
ドメイン固有のデータベースを構築し、合成QAに基づいてモデルを評価する。
微調整された7Bモデルは、コンシューマハードウェア上でのサブ-4秒の応答時間で61.33%の精度を達成する。
論文 参考訳(メタデータ) (2025-06-29T14:55:21Z) - MultiFinBen: A Multilingual, Multimodal, and Difficulty-Aware Benchmark for Financial LLM Evaluation [89.73542209537148]
MultiFinBenは、グローバルファイナンシャルドメインに合わせた最初のマルチリンガルおよびマルチモーダルベンチマークである。
我々は,最初のOCR組み込み財務QAタスクである EnglishOCR と SpanishOCR の2つの新しいタスクを紹介する。
本稿では,動的で難易度の高い選択機構を提案し,コンパクトでバランスの取れたベンチマークをキュレートする。
論文 参考訳(メタデータ) (2025-06-16T22:01:49Z) - Structuring the Unstructured: A Multi-Agent System for Extracting and Querying Financial KPIs and Guidance [54.25184684077833]
構造化されていない財務文書から定量的な洞察を抽出する,効率的でスケーラブルな手法を提案する。
提案システムは,emphExtraction AgentとemphText-to-Agentの2つの特殊エージェントから構成される。
論文 参考訳(メタデータ) (2025-05-25T15:45:46Z) - FinDER: Financial Dataset for Question Answering and Evaluating Retrieval-Augmented Generation [65.04104723843264]
ファイナンスにおけるRetrieval-Augmented Generation(RAG)に適したエキスパート生成データセットであるFinDERを提案する。
FinDERは、ドメインの専門家による検索関連証拠の注釈付けに重点を置いており、5,703のクエリ・エビデンス・アンサー・トリプルを提供している。
大きなコーパスから関連する情報を取得するためにモデルに挑戦することで、FinDERはRAGシステムを評価するためのより現実的なベンチマークを提供する。
論文 参考訳(メタデータ) (2025-04-22T11:30:13Z) - SNFinLLM: Systematic and Nuanced Financial Domain Adaptation of Chinese Large Language Models [6.639972934967109]
大規模言語モデル (LLM) は、金融業界において自然言語処理を推進するための強力なツールとなっている。
SNFinLLMという中国の金融ドメイン向けに設計された新しい大規模言語モデルを提案する。
SNFinLLMは、質問への回答、財務調査レポートの要約、感情の分析、財務計算の実行など、ドメイン固有のタスクに優れています。
論文 参考訳(メタデータ) (2024-08-05T08:24:24Z) - FinSQL: Model-Agnostic LLMs-based Text-to-SQL Framework for Financial
Analysis [28.514754357658482]
財務分析のための実用的なText-to-ベンチマークデータセットはありません。
財務分析のためのモデルに依存しない大規模言語モデル(LLM)を提案する。
論文 参考訳(メタデータ) (2024-01-19T05:48:07Z) - Is ChatGPT a Financial Expert? Evaluating Language Models on Financial
Natural Language Processing [22.754757518792395]
FinLMEvalは金融言語モデル評価のためのフレームワークである。
本研究では,エンコーダのみの言語モデルとデコーダのみの言語モデルの性能を比較した。
論文 参考訳(メタデータ) (2023-10-19T11:43:15Z) - Chinese Fine-Grained Financial Sentiment Analysis with Large Language
Models [4.993565079216378]
そこで我々は,企業早期警戒のための,中国の財務感情分析データセットFinChina SAを提案する。
われわれのデータセットは、現実の財務感情分析タスクの探索を進めるための貴重なリソースとして役立ちます。
論文 参考訳(メタデータ) (2023-06-25T02:24:30Z) - PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark
for Finance [63.51545277822702]
PIXIUは、命令データ付き微調整LLaMAに基づく最初の金融大規模言語モデル(LLM)を含む包括的なフレームワークである。
我々はLLaMAを細調整してFinMAを提案する。
我々は、FinMAと既存のLLMを詳細に分析し、重要な財政課題に対処する際の長所と短所を明らかにする。
論文 参考訳(メタデータ) (2023-06-08T14:20:29Z) - FinQA: A Dataset of Numerical Reasoning over Financial Data [52.7249610894623]
我々は、大量の財務文書の分析を自動化することを目的として、財務データに関する深い質問に答えることに重点を置いている。
我々は,金融専門家が作成した財務報告に対して質問回答のペアを用いた,新たな大規模データセットFinQAを提案する。
その結果、人気があり、大規模で、事前訓練されたモデルは、金融知識を得るための専門的な人間には程遠いことが示される。
論文 参考訳(メタデータ) (2021-09-01T00:08:14Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。