論文の概要: Embedding-Aware Feature Discovery: Bridging Latent Representations and Interpretable Features in Event Sequences
- arxiv url: http://arxiv.org/abs/2603.15713v1
- Date: Mon, 16 Mar 2026 14:29:26 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-18 17:42:06.904328
- Title: Embedding-Aware Feature Discovery: Bridging Latent Representations and Interpretable Features in Event Sequences
- Title(参考訳): 埋め込みを意識した特徴発見: イベントシーケンスにおける潜在表現と解釈可能な特徴のブリッジ
- Authors: Artem Sakhno, Ivan Sergeev, Alexey Shestov, Omar Zoloev, Elizaveta Kovtun, Gleb Gusev, Andrey Savchenko, Maksim Makarenko,
- Abstract要約: 産業金融システムは、トランザクション、ユーザアクション、システムログなどの一時的なイベントシーケンスを運用する。
学習した埋め込みと機能ベースのパイプラインのギャップを埋める統合フレームワークであるEmbeding-Aware Feature Discovery (EAFD)を紹介します。
EAFDは2つの相補的基準を用いて、生のイベントシーケンスから直接特徴を発見し、評価し、洗練する。
- 参考スコア(独自算出の注目度): 5.03287845497428
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Industrial financial systems operate on temporal event sequences such as transactions, user actions, and system logs. While recent research emphasizes representation learning and large language models, production systems continue to rely heavily on handcrafted statistical features due to their interpretability, robustness under limited supervision, and strict latency constraints. This creates a persistent disconnect between learned embeddings and feature-based pipelines. We introduce Embedding-Aware Feature Discovery (EAFD), a unified framework that bridges this gap by coupling pretrained event-sequence embeddings with a self-reflective LLM-driven feature generation agent. EAFD iteratively discovers, evaluates, and refines features directly from raw event sequences using two complementary criteria: \emph{alignment}, which explains information already encoded in embeddings, and \emph{complementarity}, which identifies predictive signals missing from them. Across both open-source and industrial transaction benchmarks, EAFD consistently outperforms embedding-only and feature-based baselines, achieving relative gains of up to $+5.8\%$ over state-of-the-art pretrained embeddings, resulting in new state-of-the-art performance across event-sequence datasets.
- Abstract(参考訳): 産業金融システムは、トランザクション、ユーザアクション、システムログなどの一時的なイベントシーケンスを運用する。
最近の研究では、表現学習と大規模言語モデルが重視されているが、生産システムは、解釈可能性、限られた監督下での堅牢性、厳密なレイテンシ制約により、手作りの統計的特徴に強く依存し続けている。
これにより、学習した埋め込みと機能ベースのパイプラインの間に永続的な切断が生じます。
我々は,このギャップを埋める統合フレームワークであるEmbeding-Aware Feature Discovery (EAFD)を紹介した。
EAFDは2つの補完的な基準を用いて、生のイベントシーケンスから直接、機能を反復的に発見、評価、洗練する: \emph{alignment}、およびそれらから欠落した予測信号を特定する \emph{complementarity}。
オープンソースとインダストリアルの両方のトランザクションベンチマークにおいて、EAFDは埋め込みのみのベースラインと機能ベースのベースラインを一貫して上回り、最先端のプレトレーニング済み埋め込みに対して最大$5.8\%の相対的なゲインを達成し、イベントシーケンスデータセットをまたいだ新たな最先端パフォーマンスを実現している。
関連論文リスト
- ARTIS: Agentic Risk-Aware Test-Time Scaling via Iterative Simulation [72.78362530982109]
ARTIS(Agenic Risk-Aware Test-Time Scaling via Iterative Simulation)は、コミットメントから探索を分離するフレームワークである。
LLMをベースとした簡易シミュレータは, 希少かつ高インパクトな障害モードの捕捉に苦慮していることを示す。
本稿では,障害発生行動の忠実度を強調するリスク認識ツールシミュレータを提案する。
論文 参考訳(メタデータ) (2026-02-02T06:33:22Z) - GLOW: Graph-Language Co-Reasoning for Agentic Workflow Performance Prediction [51.83437071408662]
本稿では,AW性能予測のための統合フレームワークGLOWを提案する。
GLOWは、GNNのグラフ構造モデリング能力とLLMの推論能力を組み合わせる。
FLORA-Benchの実験では、GLOWは予測精度とランキングユーティリティにおいて最先端のベースラインを上回っている。
論文 参考訳(メタデータ) (2025-12-11T13:30:46Z) - Reflective Agreement: Combining Self-Mixture of Agents with a Sequence Tagger for Robust Event Extraction [9.746352647419345]
イベント抽出は、構造化されていないテキストからイベントに関する構造化情報を自動的に識別し、抽出する。
本稿では,エージェントの自己混合と識別配列タグを併用したハイブリッド手法を提案する。
実験では、3つのベンチマークデータセットで既存の最先端イベント抽出手法より優れていることを示す。
論文 参考訳(メタデータ) (2025-08-26T18:36:23Z) - LATTE: Learning Aligned Transactions and Textual Embeddings for Bank Clients [0.6106535351521803]
LATTEは、生のイベント埋め込みと凍結した言語モデルからのセマンティック埋め込みを整合させる、対照的な学習フレームワークである。
提案手法は,実世界の財務データセット上でのイベントシーケンス表現の学習において,最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2025-08-07T16:46:38Z) - DLF: Enhancing Explicit-Implicit Interaction via Dynamic Low-Order-Aware Fusion for CTR Prediction [71.41414150295702]
本稿では,クリックスルー率(CTR)予測をモデル化するための新しいフレームワークである動的低次認識融合(DLF)を提案する。
RLIは残差接続からの冗長性を緩和しながら低次信号を保持し、NAFは各層での明示的および暗黙的な表現を動的に統合し、情報共有を強化する。
公開データセットの実験では、DLFがCTR予測における最先端のパフォーマンスを達成し、既存のモデルの重要な制限に対処していることが示されている。
論文 参考訳(メタデータ) (2025-05-25T15:05:00Z) - CSE-SFP: Enabling Unsupervised Sentence Representation Learning via a Single Forward Pass [3.0566617373924325]
プレトレーニング言語モデル(PLM)の最近の進歩は、この分野において顕著な進歩をもたらした。
CSE-SFPは,生成モデルの構造的特徴を利用する革新的な手法である。
CSE-SFPは高品質な埋め込みを実現するだけでなく、トレーニング時間とメモリ消費を著しく削減する。
論文 参考訳(メタデータ) (2025-05-01T08:27:14Z) - Breaking Determinism: Fuzzy Modeling of Sequential Recommendation Using Discrete State Space Diffusion Model [66.91323540178739]
シークエンシャルレコメンデーション(SR)は、ユーザーが過去の行動に基づいて興味を持つかもしれない項目を予測することを目的としている。
我々はSRを新しい情報理論の観点から再検討し、逐次モデリング手法がユーザの行動のランダム性と予測不可能性を適切に把握できないことを発見した。
ファジィ情報処理理論に触発された本論文では,制限を克服し,ユーザの関心事の進化をよりよく捉えるために,ファジィなインタラクションシーケンスの組を導入する。
論文 参考訳(メタデータ) (2024-10-31T14:52:01Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。