論文の概要: THEME: Enhancing Thematic Investing with Semantic Stock Representations and Temporal Dynamics
- arxiv url: http://arxiv.org/abs/2508.16936v2
- Date: Fri, 29 Aug 2025 08:56:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-01 13:41:09.924655
- Title: THEME: Enhancing Thematic Investing with Semantic Stock Representations and Temporal Dynamics
- Title(参考訳): テーマ:セマンティックストック表現とテンポラルダイナミクスによるテーマ投資の促進
- Authors: Hoyoung Lee, Wonbin Ahn, Suhwan Park, Jaehoon Lee, Minjae Kim, Sungdong Yoo, Taeyoon Lim, Woohyung Lim, Yongjae Lee,
- Abstract要約: テーマ投資は、構造的トレンドに沿ったポートフォリオを構築することを目的としています。
階層的コントラスト学習を用いた埋め込みを微調整するフレームワークであるTheMEを紹介する。
テキストと市場ダイナミクスのテーマ関係をリターンからモデリングすることで、TheMEは幅広い実践的投資用途に特化してストック埋め込みを生成する。
- 参考スコア(独自算出の注目度): 30.94860968271092
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Thematic investing, which aims to construct portfolios aligned with structural trends, remains a challenging endeavor due to overlapping sector boundaries and evolving market dynamics. A promising direction is to build semantic representations of investment themes from textual data. However, despite their power, general-purpose LLM embedding models are not well-suited to capture the nuanced characteristics of financial assets, since the semantic representation of investment assets may differ fundamentally from that of general financial text. To address this, we introduce THEME, a framework that fine-tunes embeddings using hierarchical contrastive learning. THEME aligns themes and their constituent stocks using their hierarchical relationship, and subsequently refines these embeddings by incorporating stock returns. This process yields representations effective for retrieving thematically aligned assets with strong return potential. Empirical results demonstrate that THEME excels in two key areas. For thematic asset retrieval, it significantly outperforms leading large language models. Furthermore, its constructed portfolios demonstrate compelling performance. By jointly modeling thematic relationships from text and market dynamics from returns, THEME generates stock embeddings specifically tailored for a wide range of practical investment applications.
- Abstract(参考訳): 構造的トレンドに沿ったポートフォリオを構築することを目的としたセマティック投資は、セクター境界の重複と市場のダイナミクスの進化により、依然として困難な取り組みである。
有望な方向性は、テキストデータから投資テーマのセマンティック表現を構築することである。
しかし、投資資産のセマンティックな表現は、一般的な財務資料と根本的に異なる可能性があるため、金融資産の微妙な特徴を捉えるのに汎用LLM埋め込みモデルは適していない。
これを解決するために,階層的コントラスト学習を用いて埋め込みを微調整するフレームワークTheMEを紹介する。
TheMEは、その階層的関係を利用してテーマとその構成銘柄を整列させ、その後、ストックリターンを取り入れてこれらの埋め込みを洗練させる。
このプロセスは、強力な戻りポテンシャルを持つ数学的に整合した資産を取得するのに効果的な表現を与える。
実証実験の結果,TheMEは2つの重要な領域で優れていた。
セマンティック・アセット検索では、主要な大きな言語モデルよりも顕著に優れている。
さらに、その構築されたポートフォリオは、魅力的なパフォーマンスを示している。
テキストと市場ダイナミクスのテーマ関係をリターンからモデリングすることで、TheMEは幅広い実践的投資用途に特化してストック埋め込みを生成する。
関連論文リスト
- Reconstructing Content via Collaborative Attention to Improve Multimodal Embedding Quality [59.651410243721045]
CoCoAは、マルチモーダル埋め込み最適化のための協調注意に基づくコンテンツ再構成事前学習パラダイムである。
EOSをベースとした再構築タスクを導入し、対応するEOS>埋め込みからの入力を再構成するようモデルに促す。
MMEB-V1の実験では、Qwen2-VLとQwen2.5-VLをベースにしたCoCoAが埋め込み品質を著しく向上することを示した。
論文 参考訳(メタデータ) (2026-03-02T05:34:45Z) - CREM: Compression-Driven Representation Enhancement for Multimodal Retrieval and Comprehension [49.6969505536365]
生成能力を保ちつつ、検索のためのマルチモーダル表現を強化する統一的なフレームワークであるCREMを提案する。
CREMはMMEB上での最先端検索性能を達成し,複数の理解ベンチマーク上での強力な生成性能を維持する。
論文 参考訳(メタデータ) (2026-02-22T08:09:51Z) - Beyond Unimodal Shortcuts: MLLMs as Cross-Modal Reasoners for Grounded Named Entity Recognition [51.68340973140949]
GMNER(Multimodal Named Entity Recognition)は、テキストベースのエンティティを抽出し、セマンティックカテゴリを割り当て、それらを対応する視覚領域に接地することを目的としている。
MLLMは、視覚バイアスやテキストバイアスを含む$textbfmodality bias$を示す。
本稿では,モダリティを考慮した一貫性推論(bfMCR$)を提案する。
論文 参考訳(メタデータ) (2026-02-04T12:12:49Z) - Learning to Manage Investment Portfolios beyond Simple Utility Functions [0.9999629695552193]
本稿では,明示的なユーティリティ仕様を必要とせずに,資金運用戦略の潜在的表現を学習する生成フレームワークを提案する。
当社の枠組みを、米国の株式相互資金1436のデータセットで検証する。
我々のフレームワークは、市場シミュレーション、戦略属性、規制監督におけるアプリケーションの投資戦略を特徴付けるためのデータ駆動型アプローチを提供する。
論文 参考訳(メタデータ) (2025-10-30T06:01:20Z) - Scaling Beyond Context: A Survey of Multimodal Retrieval-Augmented Generation for Document Understanding [61.36285696607487]
文書理解は、財務分析から科学的発見への応用に不可欠である。
現在のアプローチでは、OCRベースのパイプラインがLarge Language Models(LLM)やネイティブのMultimodal LLMs(MLLM)に制限されている。
Retrieval-Augmented Generation (RAG)は、外部データの基底モデルを支援するが、文書のマルチモーダルな性質は、テキスト、テーブル、チャート、レイアウトを組み合わせることで、より高度なパラダイムを必要とする。
論文 参考訳(メタデータ) (2025-10-17T02:33:16Z) - Explaining multimodal LLMs via intra-modal token interactions [55.27436637894534]
MLLM(Multimodal Large Language Models)は、様々な視覚言語タスクにおいて顕著な成功を収めているが、その内部決定機構は十分に理解されていない。
モーダル内相互作用を利用した解釈可能性の向上を提案する。
論文 参考訳(メタデータ) (2025-09-26T14:39:13Z) - Leveraging Foundation Models for Multimodal Graph-Based Action Recognition [1.533133219129073]
動的視覚符号化のためのビデオMAEとコンテキストテキスト埋め込みのためのBERTを統合したグラフベースのフレームワークを提案する。
提案手法は,多様なベンチマークデータセット上で,最先端のベースラインを一貫して上回ることを示す。
論文 参考訳(メタデータ) (2025-05-21T07:15:14Z) - SAFT: Structure-aware Transformers for Textual Interaction Classification [15.022958096869734]
テキスト・インタラクション・ネットワーク(英語: Textual Interaction Network, TIN)は、Eコマースのウェブサイトやソーシャルネットワークなどにおけるユーザとアイテム間のインタラクションをモデル化するためのデータ構造である。
対話の表現学習において,テキストおよび構造的意味論を効果的に融合するために,言語およびグラフベースのモジュールを統合する新しいアーキテクチャであるSAFTを提案する。
論文 参考訳(メタデータ) (2025-04-07T09:19:12Z) - GridMind: A Multi-Agent NLP Framework for Unified, Cross-Modal NFL Data Insights [0.0]
本稿では,Retrieval-Augmented Generation (RAG) と大規模言語モデル (LLM) を通じて構造化,半構造化,非構造化データを統一するフレームワークであるGridMindを紹介する。
このアプローチはマルチモーダル表現学習の進化する分野と一致する。
論文 参考訳(メタデータ) (2025-03-24T18:33:36Z) - Unifying Text Semantics and Graph Structures for Temporal Text-attributed Graphs with Large Language Models [19.710059031046377]
時間グラフニューラルネットワーク(TGNN)は時間グラフモデリングにおいて顕著な性能を示した。
TTAGモデリングのための既存のTGNNをシームレスに拡張するフレキシブルなフレームワークである textbfCROSS を提案する。
論文 参考訳(メタデータ) (2025-03-18T16:50:10Z) - A Survey on Post-training of Large Language Models [185.51013463503946]
大規模言語モデル(LLM)は、自然言語処理を根本的に変革し、会話システムから科学的探索まで、さまざまな領域で欠かせないものにしている。
これらの課題は、制限された推論能力、倫理的不確実性、最適なドメイン固有のパフォーマンスといった欠点に対処するために、先進的な訓練後言語モデル(PoLM)を必要とする。
本稿では,タスク固有の精度を向上するファインチューニング,倫理的コヒーレンスと人間の嗜好との整合性を保証するアライメント,報酬設計の課題によらず多段階の推論を進める推論,統合と適応の5つのパラダイムを体系的に追跡したPoLMの総合的な調査について述べる。
論文 参考訳(メタデータ) (2025-03-08T05:41:42Z) - Flex: End-to-End Text-Instructed Visual Navigation from Foundation Model Features [59.892436892964376]
本稿では,視覚に基づく制御ポリシを用いて,ロバストな閉ループ性能を実現するために必要な最小限のデータ要件とアーキテクチャ適応について検討する。
この知見はFlex (Fly lexically) で合成され, 凍結パッチワイド特徴抽出器として, 事前学習された視覚言語モデル (VLM) を用いたフレームワークである。
本研究では,本手法の有効性を,行動クローンによる訓練を実世界のシーンに応用した,四重項フライ・トゥ・ターゲットタスクに適用した。
論文 参考訳(メタデータ) (2024-10-16T19:59:31Z) - Contrastive Learning of Asset Embeddings from Financial Time Series [8.595725772518332]
金融時系列データから資産埋め込みを生成するための,新しいコントラスト学習フレームワークを提案する。
提案手法は,多くのサブウインドウに対するアセットリターンの類似性を利用して,情報的正および負のサンプルを生成する。
実世界のデータセットに関する実験は、ベンチマーク業界分類とポートフォリオ最適化タスクにおける学習した資産埋め込みの有効性を実証している。
論文 参考訳(メタデータ) (2024-07-26T10:26:44Z) - Financial Assets Dependency Prediction Utilizing Spatiotemporal Patterns [6.424226384944309]
資産の依存関係をADM(Asset Dependency Matrix)としてモデル化する新しいアプローチを提案する。
隣接する画素が物体運動の自然な連続性によって明らかに時間的依存を示すビデオ画像とは異なり、ADMのアセットは自然な順序を持たない。
本研究では,Conal Long Short-Term Memory (ConLSTM) ネットワークを用いたアセット依存ニューラルネットワーク (ADNN) を提案する。
論文 参考訳(メタデータ) (2024-06-13T09:42:28Z) - Contextualization Distillation from Large Language Model for Knowledge
Graph Completion [51.126166442122546]
我々は、差別的かつ生成的なKGCフレームワークと互換性のあるプラグイン・アンド・プレイ方式であるContextualization Distillation戦略を導入する。
提案手法は,大規模言語モデルに対して,コンパクトで構造的な三重項を文脈に富んだセグメントに変換するように指示することから始まる。
多様なデータセットとKGC技術にわたる総合的な評価は、我々のアプローチの有効性と適応性を強調している。
論文 参考訳(メタデータ) (2024-01-28T08:56:49Z) - MDGNN: Multi-Relational Dynamic Graph Neural Network for Comprehensive
and Dynamic Stock Investment Prediction [22.430266982219496]
マルチリレーショナルな動的グラフニューラルネットワーク(MDGNN)フレームワークを提案する。
提案するMDGNNフレームワークは,SOTA(state-of-the-art-the-art)ストック投資手法と比較して,公開データセットにおける最高のパフォーマンスを実現する。
論文 参考訳(メタデータ) (2024-01-19T02:51:29Z) - Structure-CLIP: Towards Scene Graph Knowledge to Enhance Multi-modal
Structured Representations [70.41385310930846]
マルチモーダルな構造表現を強化するためのエンドツーエンドフレームワークであるStructure-CLIPを提案する。
シーングラフを用いてセマンティックなネガティブな例の構築をガイドし、その結果、構造化された表現の学習に重点を置いている。
知識エンハンス(KEE)は、SGKを入力として活用し、構造化表現をさらに強化するために提案される。
論文 参考訳(メタデータ) (2023-05-06T03:57:05Z) - Modeling Complex Financial Products [5.873416857161077]
我々は、2008年の米金融危機の中心にある住宅ローン担保証券(resMBS)に焦点を当てている。
我々は、より複雑な一連のモデルを通じて、resMBS証券のパフォーマンスに関する洞察を提供する。
論文 参考訳(メタデータ) (2021-02-03T23:20:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。