論文の概要: A Scalable Data-Driven Framework for Systematic Analysis of SEC 10-K Filings Using Large Language Models
- arxiv url: http://arxiv.org/abs/2409.17581v1
- Date: Thu, 26 Sep 2024 06:57:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-09-28 22:46:14.710894
- Title: A Scalable Data-Driven Framework for Systematic Analysis of SEC 10-K Filings Using Large Language Models
- Title(参考訳): 大規模言語モデルを用いたSEC10-Kファイリングの系統解析のためのスケーラブルなデータ駆動フレームワーク
- Authors: Syed Affan Daimi, Asma Iqbal,
- Abstract要約: SEC10-Kの申請に基づいて企業の業績を分析し,評価する,新たなデータ駆動型アプローチを提案する。
提案手法は、データパイプラインを実行して視覚化を作成するためのノーコードソリューションとして、対話型GUI上に実装される。
このアプリケーションは評価結果を示し、企業業績の年次比較を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The number of companies listed on the NYSE has been growing exponentially, creating a significant challenge for market analysts, traders, and stockholders who must monitor and assess the performance and strategic shifts of a large number of companies regularly. There is an increasing need for a fast, cost-effective, and comprehensive method to evaluate the performance and detect and compare many companies' strategy changes efficiently. We propose a novel data-driven approach that leverages large language models (LLMs) to systematically analyze and rate the performance of companies based on their SEC 10-K filings. These filings, which provide detailed annual reports on a company's financial performance and strategic direction, serve as a rich source of data for evaluating various aspects of corporate health, including confidence, environmental sustainability, innovation, and workforce management. We also introduce an automated system for extracting and preprocessing 10-K filings. This system accurately identifies and segments the required sections as outlined by the SEC, while also isolating key textual content that contains critical information about the company. This curated data is then fed into Cohere's Command-R+ LLM to generate quantitative ratings across various performance metrics. These ratings are subsequently processed and visualized to provide actionable insights. The proposed scheme is then implemented on an interactive GUI as a no-code solution for running the data pipeline and creating the visualizations. The application showcases the rating results and provides year-on-year comparisons of company performance.
- Abstract(参考訳): NYSEに上場する企業の数は指数関数的に増加しており、多数の企業の業績や戦略の変化を定期的に監視し評価しなければならない市場アナリスト、トレーダー、株主にとって大きな課題となっている。
パフォーマンスを評価し,多くの企業の戦略変化を効率的に検出し,比較する,迅速で費用効率のよい包括的手法の必要性が高まっている。
我々は,大規模言語モデル(LLM)を活用して,SEC 10-Kの申請に基づいて企業の業績を体系的に分析し,評価する,新たなデータ駆動型アプローチを提案する。
これらの申請書は、会社の業績と戦略的な方向性に関する詳細な年次報告書を提供しており、信頼、環境持続可能性、革新、労働管理など、企業の健康の様々な側面を評価するための豊富なデータ源となっている。
また,10-Kファイルの抽出と前処理のための自動処理システムも導入する。
このシステムは、SECが概説しているように、必要なセクションを正確に識別し、分割すると同時に、企業に関する重要な情報を含む重要なテキストコンテンツを分離する。
このキュレートされたデータは、CohereのCommand-R+ LLMに送られ、さまざまなパフォーマンス指標の定量的評価を生成する。
これらの評価はその後処理され、実行可能な洞察を提供するために視覚化される。
提案手法は,データパイプラインの実行と視覚化のためのノーコードソリューションとして,対話型GUI上に実装される。
このアプリケーションは評価結果を示し、企業業績の年次比較を提供する。
関連論文リスト
- AI in Investment Analysis: LLMs for Equity Stock Ratings [0.2916558661202724]
本稿では,Large Language Models (LLMs) のマルチ水平ストックレーティングへの適用について検討する。
本研究は、LLMを活用して株価評価の精度と一貫性を向上させることで、これらの課題に対処する。
提案手法は,フォワードリターンで評価した場合,従来の株価評価手法よりも優れていることを示す。
論文 参考訳(メタデータ) (2024-10-30T15:06:57Z) - Blockchain-Enabled Accountability in Data Supply Chain: A Data Bill of Materials Approach [16.31469678670097]
データ請求書(Data Bill of Materials, DataBOM)は、特定のメタデータを格納することで、異なるデータセットと利害関係者間の依存関係関係をキャプチャする。
ブロックチェーンベースのDataBOMサービスを提供するためのプラットフォームアーキテクチャを実証し、利害関係者のためのインタラクションプロトコルを提示し、DataBOMメタデータの最小要件について議論する。
論文 参考訳(メタデータ) (2024-08-16T05:34:50Z) - Extracting Structured Insights from Financial News: An Augmented LLM Driven Approach [0.0]
本稿では,Large Language Models(LLMs)を活用した財務情報処理手法を提案する。
本稿では,関連企業チッカーを生のニュース記事コンテンツから抽出し,企業レベルで感情分析を行い,要約を生成するシステムを提案する。
当社は、ニュース記事から詳細な企業ごとの感情分析を提供し、市場参加者に利用可能な情報の深みを高めた最初のデータ提供者です。
論文 参考訳(メタデータ) (2024-07-22T16:47:31Z) - InsightBench: Evaluating Business Analytics Agents Through Multi-Step Insight Generation [79.09622602860703]
3つの重要な特徴を持つベンチマークデータセットであるInsightBenchを紹介します。
財務やインシデント管理といったさまざまなビジネスユースケースを表す100のデータセットで構成されている。
単一のクエリに回答することに焦点を当てた既存のベンチマークとは異なり、InsightBenchは、エンドツーエンドのデータ分析を実行する能力に基づいてエージェントを評価する。
論文 参考訳(メタデータ) (2024-07-08T22:06:09Z) - A Bargaining-based Approach for Feature Trading in Vertical Federated
Learning [54.51890573369637]
本稿では,垂直的フェデレートラーニング(VFL)において,経済的に効率的な取引を促進するための交渉型特徴取引手法を提案する。
当社のモデルでは,収益ベース最適化の目的を考慮し,パフォーマンスゲインベースの価格設定を取り入れている。
論文 参考訳(メタデータ) (2024-02-23T10:21:07Z) - Glitter or Gold? Deriving Structured Insights from Sustainability
Reports via Large Language Models [16.231171704561714]
本研究では,企業のサステナビリティレポートからESGに関する構造化された洞察を抽出するために,情報抽出(IE)手法を用いる。
次に、グラフに基づく表現を活用して、抽出された洞察に関する統計的分析を行う。
論文 参考訳(メタデータ) (2023-10-09T11:34:41Z) - Harnessing the Web and Knowledge Graphs for Automated Impact Investing
Scoring [2.4107880640624706]
持続可能な開発目標のフレームワークを作成するプロセスを自動化するための,データ駆動システムについて説明する。
本稿では,異なるWebソースからテキストのデータセットを収集・フィルタリングする新しい手法と,企業の集合に関連する知識グラフを提案する。
以上の結果から,我々の最高性能モデルでは,マイクロ平均F1スコア0.89でSDGスコアを正確に予測できることがわかった。
論文 参考訳(メタデータ) (2023-08-04T15:14:16Z) - Dynamic Datasets and Market Environments for Financial Reinforcement
Learning [68.11692837240756]
FinRL-Metaは、現実世界の市場からジムスタイルの市場環境へ動的データセットを処理するライブラリである。
我々は,ユーザが新しい取引戦略を設計するための足場として,人気のある研究論文を例示し,再現する。
また、ユーザが自身の結果を視覚化し、相対的なパフォーマンスを評価するために、このライブラリをクラウドプラットフォームにデプロイします。
論文 参考訳(メタデータ) (2023-04-25T22:17:31Z) - An Informative Tracking Benchmark [133.0931262969931]
既存のデータセットと新たに収集されたデータセットの1.2Mフレームのうち7%が、小型かつ情報的追跡ベンチマーク(ITB)である。
1) 課題レベル, 2) 識別力, 3) 外観変化の密度を考慮し, 既存のベンチマークから最も有意義なシーケンスを選択する。
同一データ上で再学習した15の最先端トラッカーの結果を解析することにより,各シナリオ下でのロバストなトラッカーの効果的な手法を決定できる。
論文 参考訳(メタデータ) (2021-12-13T07:56:16Z) - TTRS: Tinkoff Transactions Recommender System benchmark [62.997667081978825]
TTRS - Tinkoff Transactions Recommender Systemベンチマークを示す。
この金融取引ベンチマークには、約1万人のユーザーと、14ヶ月で1000以上の商業ブランドの間で200万以上のインタラクションが含まれている。
また,現在普及しているRecSys手法を次の期間の推薦タスクで総合的に比較し,その性能を様々な指標や推奨目標に対して詳細に分析する。
論文 参考訳(メタデータ) (2021-10-11T20:04:07Z) - MARS-Gym: A Gym framework to model, train, and evaluate Recommender
Systems for Marketplaces [51.123916699062384]
MARS-Gymは、市場におけるレコメンデーションのための強化学習エージェントの構築と評価を行うオープンソースフレームワークである。
本稿では,Trivagoマーケットプレースデータセットにおいて,さまざまなベースラインエージェントの実装とメトリクス駆動による分析を行う。
学術研究と生産システムとのギャップを埋め、新しいアルゴリズムやアプリケーションの設計を容易にしたいと考えている。
論文 参考訳(メタデータ) (2020-09-30T16:39:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。