論文の概要: FinSphere, a Real-Time Stock Analysis Agent Powered by Instruction-Tuned LLMs and Domain Tools
- arxiv url: http://arxiv.org/abs/2501.12399v2
- Date: Wed, 09 Jul 2025 03:59:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-10 15:30:52.002141
- Title: FinSphere, a Real-Time Stock Analysis Agent Powered by Instruction-Tuned LLMs and Domain Tools
- Title(参考訳): インストラクション調整LDMとドメインツールを用いたリアルタイムストック分析エージェントFinSphere
- Authors: Shijie Han, Jingshu Zhang, Yiqing Shen, Kaiyuan Yan, Hongguang Li,
- Abstract要約: 現在の金融大規模言語モデル(FinLLM)は2つの限界に悩まされている。
株価分析レポートの品質評価のための客観的評価指標の欠如と、株価分析の深みの欠如は、彼らのプロフェッショナルグレードの洞察を生み出す能力を妨げている。
本稿では、ストック分析エージェントであるFinSphereと3つの主要な貢献について紹介する。
- 参考スコア(独自算出の注目度): 7.6993069412225905
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Current financial large language models (FinLLMs) struggle with two critical limitations: the absence of objective evaluation metrics to assess the quality of stock analysis reports and a lack of depth in stock analysis, which impedes their ability to generate professional-grade insights. To address these challenges, this paper introduces FinSphere, a stock analysis agent, along with three major contributions: (1) AnalyScore, a systematic evaluation framework for assessing stock analysis quality, (2) Stocksis, a dataset curated by industry experts to enhance LLMs' stock analysis capabilities, and (3) FinSphere, an AI agent that can generate high-quality stock analysis reports in response to user queries. Experiments demonstrate that FinSphere achieves superior performance compared to both general and domain-specific LLMs, as well as existing agent-based systems, even when they are enhanced with real-time data access and few-shot guidance. The integrated framework, which combines real-time data feeds, quantitative tools, and an instruction-tuned LLM, yields substantial improvements in both analytical quality and practical applicability for real-world stock analysis.
- Abstract(参考訳): 現在の金融大言語モデル(FinLLMs)は、ストック分析レポートの品質を評価する客観的評価指標の欠如と、ストック分析の深さの欠如という2つの重要な制限に悩まされている。
これらの課題に対処するために,ストック分析エージェントであるFinSphereと,ストック分析品質を評価するための体系的評価フレームワークであるAnalyScoreと,LCMのストック分析能力を高めるために業界の専門家がキュレートしたデータセットであるStocksisと,ユーザクエリに応じて高品質なストック分析レポートを生成するAIエージェントであるFinSphereを紹介した。
実験により、FinSphereは、実時間データアクセスと少数ショットガイダンスによって拡張された場合でも、汎用およびドメイン固有のLLMと既存のエージェントベースシステムの両方と比較して優れた性能を発揮することが示された。
リアルタイムデータフィード、定量的ツール、および命令調整型LDMを組み合わせた統合フレームワークは、実世界の株式分析における分析品質と実用性の両方に大きな改善をもたらす。
関連論文リスト
- Advanced Deep Learning Techniques for Analyzing Earnings Call Transcripts: Methodologies and Applications [0.0]
本研究の目的は,大規模財務文書から感情を抽出するために自然言語処理をどのように活用できるかを検討することである。
金融感情分析の文脈における各モデルの強みと限界について検討する。
厳密な実験を通じて、精度、精度、リコール、F1スコアなどの重要な指標を用いて、それらの性能を評価する。
論文 参考訳(メタデータ) (2025-02-27T00:28:43Z) - Learning to Align Multi-Faceted Evaluation: A Unified and Robust Framework [61.38174427966444]
大規模言語モデル(LLM)は、様々なシナリオにおける自動評価のために、より広く使われている。
従来の研究では、強力なプロプライエタリモデルの評価と判断を再現するために、オープンソースのLLMを微調整しようと試みてきた。
本稿では,評価基準を適応的に定式化し,テキストベースとコード駆動分析の両方を合成する新しい評価フレームワークARJudgeを提案する。
論文 参考訳(メタデータ) (2025-02-26T06:31:45Z) - InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.09622602860703]
3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文 参考訳(メタデータ) (2024-07-08T22:06:09Z) - AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework [48.3060010653088]
我々はAlphaFinデータセットをリリースし、従来の研究データセット、リアルタイム財務データ、手書きのチェーン・オブ・プリート(CoT)データを組み合わせています。
次に、AlphaFinデータセットを使用して、金融分析タスクを効果的に処理するために、Stock-Chainと呼ばれる最先端の手法をベンチマークします。
論文 参考訳(メタデータ) (2024-03-19T09:45:33Z) - FinBen: A Holistic Financial Benchmark for Large Language Models [75.09474986283394]
FinBenは、24の財務タスクにまたがる36のデータセットを含む、最初の大規模なオープンソース評価ベンチマークである。
FinBenは、幅広いタスクとデータセット、ストックトレーディングの最初の評価、新しいエージェントと検索可能な生成(RAG)の評価、およびテキスト要約、質問応答、株式トレーディングのための3つの新しいオープンソース評価データセットを提供する。
論文 参考訳(メタデータ) (2024-02-20T02:16:16Z) - AgentBoard: An Analytical Evaluation Board of Multi-turn LLM Agents [74.16170899755281]
本稿では,LLMエージェントの分析的評価に適したオープンソース評価フレームワークであるAgentBoardを紹介する。
AgentBoardは、インクリメンタルな進歩と包括的な評価ツールキットをキャプチャする、きめ細かい進捗率のメトリクスを提供する。
これはLLMエージェントの能力と限界に光を当てるだけでなく、その性能の解釈可能性も最前線に広める。
論文 参考訳(メタデータ) (2024-01-24T01:51:00Z) - FinDABench: Benchmarking Financial Data Analysis Ability of Large Language Models [26.99936434072108]
textttFinDABenchは、大規模言語モデルの財務データ分析能力を評価するために設計されたベンチマークである。
textttFinDABenchは、LLM能力の詳細な分析のための指標を提供することを目的としている。
論文 参考訳(メタデータ) (2024-01-01T15:26:23Z) - Enhancing Financial Sentiment Analysis via Retrieval Augmented Large
Language Models [11.154814189699735]
大規模な言語モデル (LLM) は様々なNLPタスクにおいて優れた性能を示した。
本稿では,金融感情分析のためのLLMフレームワークを提案する。
提案手法の精度は15%から48%向上し,F1得点を得た。
論文 参考訳(メタデータ) (2023-10-06T05:40:23Z) - Sentiment Analysis in the Era of Large Language Models: A Reality Check [69.97942065617664]
本稿では,大規模言語モデル(LLM)の様々な感情分析タスクの実行能力について検討する。
26のデータセット上の13のタスクのパフォーマンスを評価し、ドメイン固有のデータセットに基づいて訓練された小言語モデル(SLM)と比較した。
論文 参考訳(メタデータ) (2023-05-24T10:45:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。