論文の概要: FinStat2SQL: A Text2SQL Pipeline for Financial Statement Analysis
- arxiv url: http://arxiv.org/abs/2506.23273v1
- Date: Sun, 29 Jun 2025 14:55:21 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-01 21:27:53.799967
- Title: FinStat2SQL: A Text2SQL Pipeline for Financial Statement Analysis
- Title(参考訳): FinStat2SQL: 財務文書分析のためのText2SQLパイプライン
- Authors: Quang Hung Nguyen, Phuong Anh Trinh, Phan Quoc Hung Mai, Tuan Phong Trinh,
- Abstract要約: FinStat2は、財務上の自然言語クエリを可能にする軽量のtext2sqlパイプラインである。
ドメイン固有のデータベースを構築し、合成QAに基づいてモデルを評価する。
微調整された7Bモデルは、コンシューマハードウェア上でのサブ-4秒の応答時間で61.33%の精度を達成する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Despite the advancements of large language models, text2sql still faces many challenges, particularly with complex and domain-specific queries. In finance, database designs and financial reporting layouts vary widely between financial entities and countries, making text2sql even more challenging. We present FinStat2SQL, a lightweight text2sql pipeline enabling natural language queries over financial statements. Tailored to local standards like VAS, it combines large and small language models in a multi-agent setup for entity extraction, SQL generation, and self-correction. We build a domain-specific database and evaluate models on a synthetic QA dataset. A fine-tuned 7B model achieves 61.33\% accuracy with sub-4-second response times on consumer hardware, outperforming GPT-4o-mini. FinStat2SQL offers a scalable, cost-efficient solution for financial analysis, making AI-powered querying accessible to Vietnamese enterprises.
- Abstract(参考訳): 大規模な言語モデルの進歩にもかかわらず、text2sqlは、特に複雑でドメイン固有のクエリにおいて、多くの課題に直面している。
金融分野では、データベースの設計や財務報告のレイアウトは金融企業と国によって大きく異なり、text2sqlはより困難である。
ファイナンシャルステートメント上で自然言語クエリを可能にする軽量なtext2sqlパイプラインであるFinStat2SQLを提案する。
VASのようなローカル標準に合わせて、エンティティ抽出、SQL生成、自己補正のためのマルチエージェント設定で、大小の言語モデルを組み合わせる。
ドメイン固有のデータベースを構築し、合成QAデータセット上でモデルを評価する。
微調整 7B モデルは、コンシューマハードウェア上でのサブ-4秒応答時間で 61.33 % の精度を実現し、GPT-4o-mini を上回っている。
FinStat2SQLは、財務分析のためのスケーラブルで費用効率のよいソリューションを提供する。
関連論文リスト
- MultiFinBen: A Multilingual, Multimodal, and Difficulty-Aware Benchmark for Financial LLM Evaluation [89.73542209537148]
MultiFinBenは、グローバルファイナンシャルドメインに合わせた最初のマルチリンガルおよびマルチモーダルベンチマークである。
我々は,最初のOCR組み込み財務QAタスクである EnglishOCR と SpanishOCR の2つの新しいタスクを紹介する。
本稿では,動的で難易度の高い選択機構を提案し,コンパクトでバランスの取れたベンチマークをキュレートする。
論文 参考訳(メタデータ) (2025-06-16T22:01:49Z) - Structuring the Unstructured: A Multi-Agent System for Extracting and Querying Financial KPIs and Guidance [54.25184684077833]
構造化されていない財務文書から定量的な洞察を抽出する,効率的でスケーラブルな手法を提案する。
提案システムは,emphExtraction AgentとemphText-to-Agentの2つの特殊エージェントから構成される。
論文 参考訳(メタデータ) (2025-05-25T15:45:46Z) - BookSQL: A Large Scale Text-to-SQL Dataset for Accounting Domain [4.671854744910768]
会計・金融分野を対象とした大規模テキスト・ツー・データセットを提案する。
データセットは1万の自然言語クエリーペアで構成され、100万レコードのデータベースを会計する。
論文 参考訳(メタデータ) (2024-06-12T04:22:27Z) - CHESS: Contextual Harnessing for Efficient SQL Synthesis [1.9506402593665235]
効率的でスケーラブルなテキスト・ツー・クエリのためのフレームワークであるCHESSを紹介します。
特殊エージェントは4つあり、それぞれが上記の課題の1つをターゲットにしている。
私たちのフレームワークは、さまざまなデプロイメント制約に適応する機能を提供する。
論文 参考訳(メタデータ) (2024-05-27T01:54:16Z) - TrustSQL: Benchmarking Text-to-SQL Reliability with Penalty-Based Scoring [11.78795632771211]
本稿では,任意の入力質問を正しく処理するモデルとして,テキスト・ツー・信頼性を評価するための新しいベンチマークを提案する。
2つのモデリング手法を用いて,新たなペナルティに基づく評価基準を用いた既存手法の評価を行った。
論文 参考訳(メタデータ) (2024-03-23T16:12:52Z) - FinSQL: Model-Agnostic LLMs-based Text-to-SQL Framework for Financial
Analysis [28.514754357658482]
財務分析のための実用的なText-to-ベンチマークデータセットはありません。
財務分析のためのモデルに依存しない大規模言語モデル(LLM)を提案する。
論文 参考訳(メタデータ) (2024-01-19T05:48:07Z) - Text2Analysis: A Benchmark of Table Question Answering with Advanced
Data Analysis and Unclear Queries [67.0083902913112]
高度な解析タスクを取り入れたText2Analysisベンチマークを開発した。
また,5つのイノベーティブかつ効果的なアノテーション手法を開発した。
3つの異なる指標を用いて5つの最先端モデルを評価する。
論文 参考訳(メタデータ) (2023-12-21T08:50:41Z) - SQL-PaLM: Improved Large Language Model Adaptation for Text-to-SQL (extended) [53.95151604061761]
本稿では,大規模言語モデル(LLM)を用いたテキスト・ツー・フィルタリングのフレームワークを提案する。
数発のプロンプトで、実行ベースのエラー解析による一貫性復号化の有効性について検討する。
命令の微調整により、チューニングされたLLMの性能に影響を及ぼす重要なパラダイムの理解を深める。
論文 参考訳(メタデータ) (2023-05-26T21:39:05Z) - SPSQL: Step-by-step Parsing Based Framework for Text-to-SQL Generation [13.196264569882777]
現在の主流のエンド・ツー・エンドのText2モデルは、複雑な構造とトレーニングデータに対する高い要求のために構築が困難であるだけでなく、大量のパラメータのために調整も困難である。
本稿では,所望の結果を得るために,SP実験というパイプライン手法を提案する。
我々は,中国のステートグリッドコーポレーションのマーケティングビジネスデータに基づくデータセットを構築した。
論文 参考訳(メタデータ) (2023-05-10T10:01:36Z) - A Survey on Text-to-SQL Parsing: Concepts, Methods, and Future
Directions [102.8606542189429]
テキストからコーパスへのパースの目的は、自然言語(NL)質問をデータベースが提供するエビデンスに基づいて、対応する構造化クエリ言語()に変換することである。
ディープニューラルネットワークは、入力NL質問から出力クエリへのマッピング関数を自動的に学習するニューラルジェネレーションモデルによって、このタスクを大幅に進歩させた。
論文 参考訳(メタデータ) (2022-08-29T14:24:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。