論文の概要: FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing
- arxiv url: http://arxiv.org/abs/2603.02702v2
- Date: Tue, 10 Mar 2026 06:53:09 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-11 12:59:12.843478
- Title: FinTexTS: Financial Text-Paired Time-Series Dataset via Semantic-Based and Multi-Level Pairing
- Title(参考訳): FinTexTS: セマンティックとマルチレベルペアリングによる財務テキストペアリング時系列データセット
- Authors: Jaehoon Lee, Suhwan Park, Tae Yoon Lim, Seunghan Lee, Jun Seo, Dongwan Kang, Hwanil Choi, Minjae Kim, Sungdong Yoo, SoonYoung Lee, Yongjae Lee, Wonbin Ahn,
- Abstract要約: テキストと財務時系列データをペアリングするための意味に基づく多段階ペアリングフレームワークを提案する。
本手法をプロプライエタリかつ慎重にキュレートしたニュースソースに適用すると,高品質なペアリングデータとなり,株価予測性能が向上することを示す。
- 参考スコア(独自算出の注目度): 33.23601503890859
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: The financial domain involves a variety of important time-series problems. Recently, time-series analysis methods that jointly leverage textual and numerical information have gained increasing attention. Accordingly, numerous efforts have been made to construct text-paired time-series datasets in the financial domain. However, financial markets are characterized by complex interdependencies, in which a company's stock price is influenced not only by company-specific events but also by events in other companies and broader macroeconomic factors. Existing approaches that pair text with financial time-series data based on simple keyword matching often fail to capture such complex relationships. To address this limitation, we propose a semantic-based and multi-level pairing framework. Specifically, we extract company-specific context for the target company from SEC filings and apply an embedding-based matching mechanism to retrieve semantically relevant news articles based on this context. Furthermore, we classify news articles into four levels (macro-level, sector-level, related company-level, and target-company level) using large language models (LLMs), enabling multi-level pairing of news articles with the target company. Applying this framework to publicly-available news datasets, we construct \textbf{FinTexTS}, a new large-scale text-paired stock price dataset. Experimental results on \textbf{FinTexTS} demonstrate the effectiveness of our semantic-based and multi-level pairing strategy in stock price forecasting. In addition to publicly-available news underlying \textbf{FinTexTS}, we show that applying our method to proprietary yet carefully curated news sources leads to higher-quality paired data and improved stock price forecasting performance.
- Abstract(参考訳): 金融分野には、さまざまな重要な時系列問題がある。
近年,テキスト情報と数値情報を併用した時系列分析手法が注目されている。
そのため、金融分野においてテキストペアリングされた時系列データセットを構築するための多くの取り組みがなされている。
しかし、金融市場は複雑な相互依存が特徴であり、企業の株価は企業固有のイベントだけでなく、他社のイベントやより広範なマクロ経済要因の影響も受けている。
単純なキーワードマッチングに基づく財務時系列データとテキストをペアリングする既存のアプローチは、そのような複雑な関係を捉えるのに失敗することが多い。
この制限に対処するため,セマンティック・ベースおよびマルチレベル・ペアリング・フレームワークを提案する。
具体的には、SECの提出書類から企業固有のコンテキストを抽出し、埋め込み型マッチング機構を適用して、このコンテキストに基づいてセマンティック関連ニュース記事の検索を行う。
さらに,大言語モデル(LLM)を用いて,ニュース記事の4つのレベル(マクロレベル,セクターレベル,関連企業レベル,ターゲット企業レベル)に分類し,ターゲット企業と複数レベルのニュース記事のペアリングを可能にする。
このフレームワークを公開可能なニュースデータセットに適用し、新しい大規模テキストペアの株価データセットである \textbf{FinTexTS} を構築する。
textbf{FinTexTS} の実験結果から, 株価予測におけるセマンティック・ベースとマルチレベル・ペアリング・ストラテジーの有効性が示された。
本手法をプロプライエタリかつ慎重にキュレートしたニュースソースに適用することで,高品質なペアリングデータと株価予測性能が向上することを示す。
関連論文リスト
- Enhancing Business Analytics through Hybrid Summarization of Financial Reports [0.152292571922932]
財務報告と決算報告には大量の構造化情報と半構造化情報が含まれている。
本稿では,抽出的および抽象的手法を組み合わせて,簡潔かつ現実的に信頼性の高い要約を生成するハイブリッド要約フレームワークを提案する。
これらの知見は、長い財務文書を有効活用できるビジネスインテリジェンスに蒸留する実用的な要約システムの開発を支援するものである。
論文 参考訳(メタデータ) (2025-12-28T16:25:12Z) - FinSight: Towards Real-World Financial Deep Research [68.31086471310773]
FinSightは、高品質でマルチモーダルな財務報告を作成するための新しいフレームワークである。
プロフェッショナルグレードの可視化を確保するため,反復視覚強調機構を提案する。
2段階のBinging Frameworkは、簡潔な分析セグメントをコヒーレント、引用認識、マルチモーダルレポートに拡張する。
論文 参考訳(メタデータ) (2025-10-19T14:05:35Z) - When Does Multimodality Lead to Better Time Series Forecasting? [96.26052272121615]
このようなマルチモーダルな統合が常に利益をもたらすかどうか、どのような条件で検討する。
その結果,マルチモーダリティの利点は条件に依存していることが判明した。
我々の研究は、マルチモーダリティが予測タスクに役立つことをいつ予測できるかを理解するための厳密で定量的な基礎を提供する。
論文 参考訳(メタデータ) (2025-06-20T23:55:56Z) - MTBench: A Multimodal Time Series Benchmark for Temporal Reasoning and Question Answering [21.064096256892686]
マルチモーダル時系列データセットは、クロスモーダル推論と複雑な質問応答の評価において不足している。
時系列およびテキスト理解における大規模言語モデル(LLM)を評価するベンチマークであるMTBench(Multimodal Time Series Benchmark)を紹介する。
MTbench 上での最先端 LLM の評価を行い,ニュース物語と時間パターンの複雑な関係をモデル化する上での有効性を分析した。
論文 参考訳(メタデータ) (2025-03-21T05:04:53Z) - Towards Temporal-Aware Multi-Modal Retrieval Augmented Generation in Finance [79.78247299859656]
FinTMMBenchは、ファイナンスにおける時間対応マルチモーダル検索・拡張生成システムを評価するための、最初の包括的なベンチマークである。
NASDAQ 100社の異種データから構築されたFinTMMBenchには,3つの大きなメリットがある。
論文 参考訳(メタデータ) (2025-03-07T07:13:59Z) - Quantifying Qualitative Insights: Leveraging LLMs to Market Predict [0.0]
本研究は、証券会社からの日々の報告を活用して高品質な文脈情報を作成することによる課題に対処する。
レポートはテキストベースのキーファクタにセグメント化され、価格情報などの数値データと組み合わせてコンテキストセットを形成する。
工芸的なプロンプトは重要な要素にスコアを割り当て、質的な洞察を定量的な結果に変換するように設計されている。
論文 参考訳(メタデータ) (2024-11-13T07:45:40Z) - Context is Key: A Benchmark for Forecasting with Essential Textual Information [87.3175915185287]
コンテキスト is Key" (CiK) は、数値データを多種多様なテキストコンテキストと組み合わせた予測ベンチマークである。
我々は,統計モデル,時系列基礎モデル,LLMに基づく予測モデルなど,さまざまなアプローチを評価する。
提案手法は,提案するベンチマークにおいて,他の試験手法よりも優れる簡易かつ効果的なLCMプロンプト法である。
論文 参考訳(メタデータ) (2024-10-24T17:56:08Z) - Context Matters: Leveraging Contextual Features for Time Series Forecasting [2.9687381456164004]
既存の予測モデルにマルチモーダルなコンテキスト情報を外科的に統合する新しいプラグイン・アンド・プレイ手法であるContextFormerを導入する。
ContextFormerは、カテゴリ、連続、時間変化、さらにはテキスト情報を含む、リッチなマルチモーダルコンテキストから予測固有の情報を効果的に蒸留する。
エネルギー、交通、環境、金融ドメインにまたがるさまざまな実世界のデータセットにおいて、SOTA予測モデルを最大30%上回ります。
論文 参考訳(メタデータ) (2024-10-16T15:36:13Z) - Extracting Structured Insights from Financial News: An Augmented LLM Driven Approach [0.0]
本稿では,Large Language Models(LLMs)を活用した財務情報処理手法を提案する。
本稿では,関連企業チッカーを生のニュース記事コンテンツから抽出し,企業レベルで感情分析を行い,要約を生成するシステムを提案する。
当社は、ニュース記事から詳細な企業ごとの感情分析を提供し、市場参加者に利用可能な情報の深みを高めた最初のデータ提供者です。
論文 参考訳(メタデータ) (2024-07-22T16:47:31Z) - AlphaFin: Benchmarking Financial Analysis with Retrieval-Augmented Stock-Chain Framework [48.3060010653088]
我々はAlphaFinデータセットをリリースし、従来の研究データセット、リアルタイム財務データ、手書きのチェーン・オブ・プリート(CoT)データを組み合わせています。
次に、AlphaFinデータセットを使用して、金融分析タスクを効果的に処理するために、Stock-Chainと呼ばれる最先端の手法をベンチマークします。
論文 参考訳(メタデータ) (2024-03-19T09:45:33Z) - Financial data analysis application via multi-strategy text processing [0.2741266294612776]
本稿では、主に中国A株会社の株価取引データとニュースに焦点を当てる。
本稿では,自然言語処理(NLP)と知識グラフ(KG)技術を用いた金融テキスト処理アプリケーションシナリオの深層学習に向けた取り組みと計画について述べる。
論文 参考訳(メタデータ) (2022-04-25T01:56:36Z) - Gaussian process imputation of multiple financial series [71.08576457371433]
金融指標、株価、為替レートなどの複数の時系列は、市場が潜んでいる状態に依存しているため、強く結びついている。
金融時系列間の関係を多出力ガウスプロセスでモデル化することで学習することに注力する。
論文 参考訳(メタデータ) (2020-02-11T19:18:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。