論文の概要: Industry Classification Using a Novel Financial Time-Series Case
Representation
- arxiv url: http://arxiv.org/abs/2305.00245v1
- Date: Sat, 29 Apr 2023 12:06:57 GMT
- ステータス: 処理完了
- システム内更新日: 2023-05-02 16:22:37.807356
- Title: Industry Classification Using a Novel Financial Time-Series Case
Representation
- Title(参考訳): 新しい金融時系列事例表現を用いた産業分類
- Authors: Rian Dolphin, Barry Smyth, Ruihai Dong
- Abstract要約: 本稿では,この領域における重要な課題に対するケースベース推論の活用を,業界分類における過去の株価リターン時系列データを用いて検討する。
本稿では,ストックリターンデータから簡単に計算可能な,ストックリターン埋め込みに基づく新しい表現を提案する。
この表現はケースベースの推論に適しており、我々のアプローチを大規模な公開データセットを用いて評価する。
- 参考スコア(独自算出の注目度): 11.67728795230542
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The financial domain has proven to be a fertile source of challenging machine
learning problems across a variety of tasks including prediction, clustering,
and classification. Researchers can access an abundance of time-series data and
even modest performance improvements can be translated into significant
additional value. In this work, we consider the use of case-based reasoning for
an important task in this domain, by using historical stock returns time-series
data for industry sector classification. We discuss why time-series data can
present some significant representational challenges for conventional
case-based reasoning approaches, and in response, we propose a novel
representation based on stock returns embeddings, which can be readily
calculated from raw stock returns data. We argue that this representation is
well suited to case-based reasoning and evaluate our approach using a
large-scale public dataset for the industry sector classification task,
demonstrating substantial performance improvements over several baselines using
more conventional representations.
- Abstract(参考訳): 金融分野は、予測、クラスタリング、分類など、さまざまなタスクにまたがる、機械学習の課題の肥大した源泉であることが証明されている。
研究者は大量の時系列データにアクセスでき、微妙なパフォーマンス改善さえも大きな付加価値に変換できる。
本研究では,この領域における重要な課題に対するケースベース推論の活用を,業界分類における過去の株価リターン時系列データを用いて検討する。
本稿では,従来のケースベース推論手法において,時系列データが重要な表象的課題を呈する理由を考察し,それに対応するために,ストックリターン埋め込みに基づく新しい表現を提案し,生のストックリターンデータから容易に計算できることを示す。
この表現は、事例に基づく推論に適しており、業界セクターの分類タスクに大規模な公開データセットを使用することで、従来の表現を用いた複数のベースラインのパフォーマンス向上を実証する。
関連論文リスト
- Enhancing Legal Case Retrieval via Scaling High-quality Synthetic Query-Candidate Pairs [67.54302101989542]
判例検索は、ある事実記述の参照として類似した事例を提供することを目的としている。
既存の作業は主に、長いクエリを使ったケース・ツー・ケースの検索に重点を置いている。
データスケールは、既存のデータハングリーニューラルネットワークのトレーニング要件を満たすには不十分である。
論文 参考訳(メタデータ) (2024-10-09T06:26:39Z) - UniCL: A Universal Contrastive Learning Framework for Large Time Series Models [18.005358506435847]
時系列分析は、金融から医療まで、さまざまな重要なアプリケーションにおいて重要な役割を果たす。
従来の教師付き学習手法は、まず各タスクにおける時系列データの広範なラベルを注釈付けする。
本稿では,時系列基礎モデルの事前学習を目的とした,普遍的でスケーラブルなコントラスト学習フレームワークUniCLを紹介する。
論文 参考訳(メタデータ) (2024-05-17T07:47:11Z) - Review of Data-centric Time Series Analysis from Sample, Feature, and Period [37.33135447969283]
優れた時系列データセットは、モデルの正確性、堅牢性、収束性に有利である。
データ中心AIの出現は、モデルの改良からデータ品質の優先順位付けへの展望の変化を表している。
時系列分析において,様々なデータ中心の手法を体系的に検討し,幅広い研究トピックを取り上げている。
論文 参考訳(メタデータ) (2024-04-24T00:34:44Z) - Capture the Flag: Uncovering Data Insights with Large Language Models [90.47038584812925]
本研究では,Large Language Models (LLMs) を用いてデータの洞察の発見を自動化する可能性について検討する。
そこで本稿では,データセット内の意味的かつ関連する情報(フラグ)を識別する能力を測定するために,フラグを捕捉する原理に基づく新しい評価手法を提案する。
論文 参考訳(メタデータ) (2023-12-21T14:20:06Z) - Exploring the Limits of Historical Information for Temporal Knowledge
Graph Extrapolation [59.417443739208146]
本稿では,歴史的コントラスト学習の新しい学習枠組みに基づくイベント予測モデルを提案する。
CENETは、最も潜在的なエンティティを識別するために、歴史的および非歴史的依存関係の両方を学ぶ。
提案したモデルを5つのベンチマークグラフで評価する。
論文 参考訳(メタデータ) (2023-08-29T03:26:38Z) - NumHTML: Numeric-Oriented Hierarchical Transformer Model for Multi-task
Financial Forecasting [17.691653056521904]
本稿では,マルチモーダル・アライン・ファイナンス・コールデータを用いて,株価リターンと金融リスクを予測する数値指向階層型トランスフォーマーモデルについて述べる。
実世界の公開データセットを用いて,いくつかの最先端ベースラインに対するNum HTMLの総合的な評価結果を示す。
論文 参考訳(メタデータ) (2022-01-05T10:17:02Z) - Interpretable Feature Construction for Time Series Extrinsic Regression [0.028675177318965035]
一部のアプリケーション領域では、対象変数が数値であり、その問題は時系列外部回帰(TSER)として知られている。
TSERの文脈における頑健で解釈可能な特徴構築と選択のためのベイズ法の拡張を提案する。
私たちのアプローチは、TSERに取り組むためのリレーショナルな方法を利用します:(i)、リレーショナルデータスキームに格納されている時系列の多様で単純な表現を構築し、(ii)二次テーブルからデータを「フラット化」するために解釈可能な機能を構築するためにプロポジション化技術を適用します。
論文 参考訳(メタデータ) (2021-03-15T08:12:19Z) - Time-Series Imputation with Wasserstein Interpolation for Optimal
Look-Ahead-Bias and Variance Tradeoff [66.59869239999459]
ファイナンスでは、ポートフォリオ最適化モデルをトレーニングする前に、損失の計算を適用することができる。
インキュベーションのために全データセットを使用するルックアヘッドバイアスと、トレーニングデータのみを使用することによるインキュベーションの大きなばらつきとの間には、本質的にトレードオフがある。
提案手法は,提案法における差分とルックアヘッドバイアスのトレードオフを最適に制御するベイズ後部コンセンサス分布である。
論文 参考訳(メタデータ) (2021-02-25T09:05:35Z) - Machine Learning for Temporal Data in Finance: Challenges and
Opportunities [0.0]
一時データは金融サービス(FS)業界で広く使われている。
しかし、機械学習の取り組みは、これらのデータの時間的豊かさを説明できないことが多い。
論文 参考訳(メタデータ) (2020-09-11T19:39:27Z) - Topology-based Clusterwise Regression for User Segmentation and Demand
Forecasting [63.78344280962136]
本研究は,パブリックおよび新規な商用データ集合を用いて,アナリストがユーザベースをクラスタリングし,詳細なレベルで需要を計画できることを示す。
本研究は,TDAに基づく時系列クラスタリングと行列因数分解法によるクラスタ回帰を実践者にとって実行可能なツールとして導入することを目的とする。
論文 参考訳(メタデータ) (2020-09-08T12:10:10Z) - DeGAN : Data-Enriching GAN for Retrieving Representative Samples from a
Trained Classifier [58.979104709647295]
我々は、トレーニングされたネットワークの将来の学習タスクのために、利用可能なデータの豊富さと関連するデータの欠如の間のギャップを埋める。
利用可能なデータは、元のトレーニングデータセットまたは関連するドメインデータセットの不均衡なサブセットである可能性があるため、代表サンプルを検索するために使用します。
関連ドメインからのデータを活用して最先端のパフォーマンスを実現することを実証する。
論文 参考訳(メタデータ) (2019-12-27T02:05:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。