Fugu-MT 論文翻訳(概要): FinQA: A Dataset of Numerical Reasoning over Financial Data

論文の概要: FinQA: A Dataset of Numerical Reasoning over Financial Data

arxiv url: http://arxiv.org/abs/2109.00122v1
Date: Wed, 1 Sep 2021 00:08:14 GMT
ステータス: 翻訳完了
システム内更新日: 2021-09-02 14:26:50.487002
Title: FinQA: A Dataset of Numerical Reasoning over Financial Data
Title（参考訳）: FinQA:財務データに対する数値推論のデータセット
Authors: Zhiyu Chen, Wenhu Chen, Charese Smiley, Sameena Shah, Iana Borova, Dylan Langdon, Reema Moussa, Matt Beane, Ting-Hao Huang, Bryan Routledge, William Yang Wang
Abstract要約: 我々は、大量の財務文書の分析を自動化することを目的として、財務データに関する深い質問に答えることに重点を置いている。我々は,金融専門家が作成した財務報告に対して質問回答のペアを用いた,新たな大規模データセットFinQAを提案する。その結果、人気があり、大規模で、事前訓練されたモデルは、金融知識を得るための専門的な人間には程遠いことが示される。
参考スコア（独自算出の注目度）: 52.7249610894623
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: The sheer volume of financial statements makes it difficult for humans to access and analyze a business's financials. Robust numerical reasoning likewise faces unique challenges in this domain. In this work, we focus on answering deep questions over financial data, aiming to automate the analysis of a large corpus of financial documents. In contrast to existing tasks on general domain, the finance domain includes complex numerical reasoning and understanding of heterogeneous representations. To facilitate analytical progress, we propose a new large-scale dataset, FinQA, with Question-Answering pairs over Financial reports, written by financial experts. We also annotate the gold reasoning programs to ensure full explainability. We further introduce baselines and conduct comprehensive experiments in our dataset. The results demonstrate that popular, large, pre-trained models fall far short of expert humans in acquiring finance knowledge and in complex multi-step numerical reasoning on that knowledge. Our dataset -- the first of its kind -- should therefore enable significant, new community research into complex application domains. The dataset and code are publicly available\url{https://github.com/czyssrs/FinQA}.
Abstract（参考訳）: 財務報告の量が多ければ多いほど、人間のビジネスの財務情報へのアクセスや分析が困難になる。ロバストな数値推論も同様に、この分野のユニークな課題に直面している。本研究は,金融データに対する深い質問への回答に焦点をあて,大量の財務文書の分析を自動化することを目的とする。一般的なドメインにおける既存のタスクとは対照的に、ファイナンス領域は複雑な数値推論と異種表現の理解を含んでいる。分析の進展を促進するため,金融専門家が作成した財務報告に対して質問回答ペアを用いた大規模データセットFinQAを提案する。また、ゴールドの推論プログラムに注釈を付け、完全な説明可能性を確保します。さらに,データセットにベースラインを導入し,総合的な実験を行う。その結果、金融知識の取得や、その知識に基づく複雑な多段階の数値推論において、人気があり、大規模で、事前訓練されたモデルは、専門家の手に負えないことがわかった。したがって、私たちのデータセット -- この種の最初の -- は、複雑なアプリケーションドメインに対する重要な新しいコミュニティ調査を可能にするべきです。データセットとコードは公開されており、https://github.com/czyssrs/FinQA} である。

関連論文リスト

FinSight: Towards Real-World Financial Deep Research [68.31086471310773]
FinSightは、高品質でマルチモーダルな財務報告を作成するための新しいフレームワークである。プロフェッショナルグレードの可視化を確保するため,反復視覚強調機構を提案する。 2段階のBinging Frameworkは、簡潔な分析セグメントをコヒーレント、引用認識、マルチモーダルレポートに拡張する。
論文参考訳（メタデータ） (2025-10-19T14:05:35Z)
FINCH: Financial Intelligence using Natural language for Contextualized SQL Handling [1.8679829796354372]
我々は、292のテーブルと75,725の自然言語ベースのペアからなる金融データベース(FINCH)を導入する。様々なスケールの推論モデルと言語モデルをベンチマークし、その強みと限界を体系的に分析する。最後に,既存の測度で見過ごされるニュアンスを捉える金融指向評価指標(FINCHスコア)を提案する。
論文参考訳（メタデータ） (2025-10-02T10:55:11Z)
FinSearchComp: Towards a Realistic, Expert-Level Evaluation of Financial Search and Reasoning [30.252244345152956]
FinSearchCompは、現実的でオープンドメインの財務検索と推論のための、初めての完全なオープンソースベンチマークである。このベンチマークには、世界および大中国市場にわたる635の質問が含まれている。 Grok 4(Web)は、専門家レベルの精度に近づき、グローバルサブセットのトップである。
論文参考訳（メタデータ） (2025-09-16T15:13:13Z)
FinDER: Financial Dataset for Question Answering and Evaluating Retrieval-Augmented Generation [63.55583665003167]
ファイナンスにおけるRetrieval-Augmented Generation(RAG)に適したエキスパート生成データセットであるFinDERを提案する。 FinDERは、ドメインの専門家による検索関連証拠の注釈付けに重点を置いており、5,703のクエリ・エビデンス・アンサー・トリプルを提供している。大きなコーパスから関連する情報を取得するためにモデルに挑戦することで、FinDERはRAGシステムを評価するためのより現実的なベンチマークを提供する。
論文参考訳（メタデータ） (2025-04-22T11:30:13Z)
Towards Temporal-Aware Multi-Modal Retrieval Augmented Generation in Finance [79.78247299859656]
FinTMMBenchは、ファイナンスにおける時間対応マルチモーダル検索・拡張生成システムを評価するための、最初の包括的なベンチマークである。 NASDAQ 100社の異種データから構築されたFinTMMBenchには,3つの大きなメリットがある。
論文参考訳（メタデータ） (2025-03-07T07:13:59Z)
Fino1: On the Transferability of Reasoning Enhanced LLMs to Finance [32.516564836540745]
大規模言語モデル(LLM)は、強力な一般的な推論能力を示しているが、財務的推論におけるその効果はいまだに解明されていない。我々は,4つの複雑な財務推論タスクにおいて,24の最先端の一般および推論に焦点を当てたLCMを評価した。本稿では,Fino1-8BとFinoBの2つのドメイン適応モデルを提案する。
論文参考訳（メタデータ） (2025-02-12T05:13:04Z)
SEC-QA: A Systematic Evaluation Corpus for Financial QA [12.279234447220155]
既存のデータセットは、多くの場合、サイズ、コンテキスト、実用的なアプリケーションとの関連性によって制約される。 2つの重要な特徴を持つ継続的データセット生成フレームワークであるSEC-QAを提案する。本稿では,複雑な情報検索と定量的推論パイプラインの実行能力を向上させるプログラム・オブ・思想に基づくQAシステムを提案する。
論文参考訳（メタデータ） (2024-06-20T15:12:41Z)
A Survey of Large Language Models for Financial Applications: Progress, Prospects and Challenges [60.546677053091685]
大規模言語モデル(LLM)は金融分野における機械学習アプリケーションに新たな機会を開放した。我々は、従来のプラクティスを変革し、イノベーションを促進する可能性に焦点を当て、様々な金融業務におけるLLMの適用について検討する。本稿では,既存の文献を言語タスク,感情分析,財務時系列,財務推論,エージェントベースモデリング,その他の応用分野に分類するための調査を紹介する。
論文参考訳（メタデータ） (2024-06-15T16:11:35Z)
AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework [48.3060010653088]
我々はAlphaFinデータセットをリリースし、従来の研究データセット、リアルタイム財務データ、手書きのチェーン・オブ・プリート(CoT)データを組み合わせています。次に、AlphaFinデータセットを使用して、金融分析タスクを効果的に処理するために、Stock-Chainと呼ばれる最先端の手法をベンチマークします。
論文参考訳（メタデータ） (2024-03-19T09:45:33Z)
FinBen: A Holistic Financial Benchmark for Large Language Models [75.09474986283394]
FinBenは、24の財務タスクにまたがる36のデータセットを含む、最初の大規模なオープンソース評価ベンチマークである。 FinBenは、幅広いタスクとデータセット、ストックトレーディングの最初の評価、新しいエージェントと検索可能な生成(RAG)の評価、およびテキスト要約、質問応答、株式トレーディングのための3つの新しいオープンソース評価データセットを提供する。
論文参考訳（メタデータ） (2024-02-20T02:16:16Z)
FinLLMs: A Framework for Financial Reasoning Dataset Generation with Large Language Models [12.367548338910744]
FinLLMs は,大規模言語モデルを用いた共通財務式に基づく財務質問応答データを生成する手法である。本研究では、FinLLMsによって生成された合成データが、金融分野における大規模数値推論モデルの性能を効果的に向上することを示した。
論文参考訳（メタデータ） (2024-01-19T15:09:39Z)
BizBench: A Quantitative Reasoning Benchmark for Business and Finance [7.4673182865000225]
BizBenchは、現実的な金融問題を推論するモデルの能力を評価するためのベンチマークである。新たに収集および拡張されたQAデータから、財務的にテーマ化された3つのコード生成タスクを含む。これらのタスクは、モデルの財務的背景の知識、財務文書を解析する能力、およびコードの問題を解決する能力を評価する。
論文参考訳（メタデータ） (2023-11-11T16:16:11Z)
PIXIU: A Large Language Model, Instruction Data and Evaluation Benchmark for Finance [63.51545277822702]
PIXIUは、命令データ付き微調整LLaMAに基づく最初の金融大規模言語モデル(LLM)を含む包括的なフレームワークである。我々はLLaMAを細調整してFinMAを提案する。我々は、FinMAと既存のLLMを詳細に分析し、重要な財政課題に対処する際の長所と短所を明らかにする。
論文参考訳（メタデータ） (2023-06-08T14:20:29Z)
REFinD: Relation Extraction Financial Dataset [7.207699035400335]
提案するREFinDは,$sim$29Kのインスタンスと8種類のエンティティペア間の22のリレーションを持つ,最初の大規模アノテートされた関係データセットである。様々な最先端ディープラーニングモデルが,数値推論,関係性,方向性のあいまいさに悩まされていることを観察した。
論文参考訳（メタデータ） (2023-05-22T22:40:11Z)
ConvFinQA: Exploring the Chain of Numerical Reasoning in Conversational Finance Question Answering [70.6359636116848]
本稿では,対話型質問応答における数値推論の連鎖を研究するために,新しい大規模データセットConvFinQAを提案する。我々のデータセットは、現実世界の会話において、長距離で複雑な数値推論パスをモデル化する上で大きな課題となる。
論文参考訳（メタデータ） (2022-10-07T23:48:50Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。