論文の概要: THEME: Enhancing Thematic Investing with Semantic Stock Representations and Temporal Dynamics
- arxiv url: http://arxiv.org/abs/2508.16936v2
- Date: Fri, 29 Aug 2025 08:56:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 13:41:09.924655
- Title: THEME: Enhancing Thematic Investing with Semantic Stock Representations and Temporal Dynamics
- Title(参考訳): テーマ:セマンティックストック表現とテンポラルダイナミクスによるテーマ投資の促進
- Authors: Hoyoung Lee, Wonbin Ahn, Suhwan Park, Jaehoon Lee, Minjae Kim, Sungdong Yoo, Taeyoon Lim, Woohyung Lim, Yongjae Lee,
- Abstract要約: テーマ投資は、構造的トレンドに沿ったポートフォリオを構築することを目的としています。
階層的コントラスト学習を用いた埋め込みを微調整するフレームワークであるTheMEを紹介する。
テキストと市場ダイナミクスのテーマ関係をリターンからモデリングすることで、TheMEは幅広い実践的投資用途に特化してストック埋め込みを生成する。
- 参考スコア(独自算出の注目度): 30.94860968271092
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Thematic investing, which aims to construct portfolios aligned with structural trends, remains a challenging endeavor due to overlapping sector boundaries and evolving market dynamics. A promising direction is to build semantic representations of investment themes from textual data. However, despite their power, general-purpose LLM embedding models are not well-suited to capture the nuanced characteristics of financial assets, since the semantic representation of investment assets may differ fundamentally from that of general financial text. To address this, we introduce THEME, a framework that fine-tunes embeddings using hierarchical contrastive learning. THEME aligns themes and their constituent stocks using their hierarchical relationship, and subsequently refines these embeddings by incorporating stock returns. This process yields representations effective for retrieving thematically aligned assets with strong return potential. Empirical results demonstrate that THEME excels in two key areas. For thematic asset retrieval, it significantly outperforms leading large language models. Furthermore, its constructed portfolios demonstrate compelling performance. By jointly modeling thematic relationships from text and market dynamics from returns, THEME generates stock embeddings specifically tailored for a wide range of practical investment applications.
- Abstract(参考訳): 構造的トレンドに沿ったポートフォリオを構築することを目的としたセマティック投資は、セクター境界の重複と市場のダイナミクスの進化により、依然として困難な取り組みである。
有望な方向性は、テキストデータから投資テーマのセマンティック表現を構築することである。
しかし、投資資産のセマンティックな表現は、一般的な財務資料と根本的に異なる可能性があるため、金融資産の微妙な特徴を捉えるのに汎用LLM埋め込みモデルは適していない。
これを解決するために,階層的コントラスト学習を用いて埋め込みを微調整するフレームワークTheMEを紹介する。
TheMEは、その階層的関係を利用してテーマとその構成銘柄を整列させ、その後、ストックリターンを取り入れてこれらの埋め込みを洗練させる。
このプロセスは、強力な戻りポテンシャルを持つ数学的に整合した資産を取得するのに効果的な表現を与える。
実証実験の結果,TheMEは2つの重要な領域で優れていた。
セマンティック・アセット検索では、主要な大きな言語モデルよりも顕著に優れている。
さらに、その構築されたポートフォリオは、魅力的なパフォーマンスを示している。
テキストと市場ダイナミクスのテーマ関係をリターンからモデリングすることで、TheMEは幅広い実践的投資用途に特化してストック埋め込みを生成する。
関連論文リスト
- Leveraging Foundation Models for Multimodal Graph-Based Action Recognition [1.533133219129073]
動的視覚符号化のためのビデオMAEとコンテキストテキスト埋め込みのためのBERTを統合したグラフベースのフレームワークを提案する。
提案手法は,多様なベンチマークデータセット上で,最先端のベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2025-05-21T07:15:14Z) - SAFT: Structure-aware Transformers for Textual Interaction Classification [15.022958096869734]
テキスト・インタラクション・ネットワーク(英語: Textual Interaction Network, TIN)は、Eコマースのウェブサイトやソーシャルネットワークなどにおけるユーザとアイテム間のインタラクションをモデル化するためのデータ構造である。
対話の表現学習において,テキストおよび構造的意味論を効果的に融合するために,言語およびグラフベースのモジュールを統合する新しいアーキテクチャであるSAFTを提案する。
論文 参考訳(メタデータ) (2025-04-07T09:19:12Z) - GridMind: A Multi-Agent NLP Framework for Unified, Cross-Modal NFL Data Insights [0.0]
本稿では,Retrieval-Augmented Generation (RAG) と大規模言語モデル (LLM) を通じて構造化,半構造化,非構造化データを統一するフレームワークであるGridMindを紹介する。
このアプローチはマルチモーダル表現学習の進化する分野と一致する。
論文 参考訳(メタデータ) (2025-03-24T18:33:36Z) - Unifying Text Semantics and Graph Structures for Temporal Text-attributed Graphs with Large Language Models [19.710059031046377]
時間グラフニューラルネットワーク(TGNN)は時間グラフモデリングにおいて顕著な性能を示した。
TTAGモデリングのための既存のTGNNをシームレスに拡張するフレキシブルなフレームワークである textbfCROSS を提案する。
論文 参考訳(メタデータ) (2025-03-18T16:50:10Z) - A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文 参考訳(メタデータ) (2025-03-08T05:41:42Z) - Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly lexically) で合成され, 凍結パッチワイド特徴抽出器として, 事前学習された視覚言語モデル (VLM) を用いたフレームワークである。
本研究では,本手法の有効性を,行動クローンによる訓練を実世界のシーンに応用した,四重項フライ・トゥ・ターゲットタスクに適用した。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-modal
Structured Representations [70.41385310930846]
マルチモーダルな構造表現を強化するためのエンドツーエンドフレームワークであるStructure-CLIPを提案する。
シーングラフを用いてセマンティックなネガティブな例の構築をガイドし、その結果、構造化された表現の学習に重点を置いている。
知識エンハンス(KEE)は、SGKを入力として活用し、構造化表現をさらに強化するために提案される。
論文 参考訳(メタデータ) (2023-05-06T03:57:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。