論文の概要: Scalable Machine Learning Algorithms using Path Signatures
- arxiv url: http://arxiv.org/abs/2506.17634v1
- Date: Sat, 21 Jun 2025 08:36:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-24 19:06:36.518661
- Title: Scalable Machine Learning Algorithms using Path Signatures
- Title(参考訳): パスシグナチャを用いたスケーラブル機械学習アルゴリズム
- Authors: Csaba Tóth,
- Abstract要約: この論文は、スケーラブルな機械学習パイプラインにおいて、パスシグネチャの表現力を利用する方法を研究する。
理論的ロバスト性と計算効率を組み合わせ、粗い経路理論と確率論的モデリング、ディープラーニング、カーネルメソッドをブリッジする一連のモデルを導入している。
- 参考スコア(独自算出の注目度): 4.441866681085518
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The interface between stochastic analysis and machine learning is a rapidly evolving field, with path signatures - iterated integrals that provide faithful, hierarchical representations of paths - offering a principled and universal feature map for sequential and structured data. Rooted in rough path theory, path signatures are invariant to reparameterization and well-suited for modelling evolving dynamics, long-range dependencies, and irregular sampling - common challenges in real-world time series and graph data. This thesis investigates how to harness the expressive power of path signatures within scalable machine learning pipelines. It introduces a suite of models that combine theoretical robustness with computational efficiency, bridging rough path theory with probabilistic modelling, deep learning, and kernel methods. Key contributions include: Gaussian processes with signature kernel-based covariance functions for uncertainty-aware time series modelling; the Seq2Tens framework, which employs low-rank tensor structure in the weight space for scalable deep modelling of long-range dependencies; and graph-based models where expected signatures over graphs induce hypo-elliptic diffusion processes, offering expressive yet tractable alternatives to standard graph neural networks. Further developments include Random Fourier Signature Features, a scalable kernel approximation with theoretical guarantees, and Recurrent Sparse Spectrum Signature Gaussian Processes, which combine Gaussian processes, signature kernels, and random features with a principled forgetting mechanism for multi-horizon time series forecasting with adaptive context length. We hope this thesis serves as both a methodological toolkit and a conceptual bridge, and provides a useful reference for the current state of the art in scalable, signature-based learning for sequential and structured data.
- Abstract(参考訳): 確率解析と機械学習のインターフェースは急速に進化する分野であり、経路シグネチャ - パスの忠実で階層的な表現を提供する反復積分 - シーケンシャルで構造化されたデータのための原則付き、普遍的な特徴マップを提供する。
粗いパス理論では、経路シグネチャは再パラメータ化に不変であり、進化するダイナミクス、長距離依存、不規則なサンプリングをモデル化するのに適しています。
この論文は、スケーラブルな機械学習パイプラインにおいて、パスシグネチャの表現力を利用する方法を研究する。
理論的ロバスト性と計算効率を組み合わせ、粗い経路理論と確率論的モデリング、ディープラーニング、カーネルメソッドをブリッジする一連のモデルを導入している。
主要なコントリビューションとして、不確実性を考慮した時系列モデリングのためのカーネルベースの署名共分散関数を持つガウス的プロセス、長距離依存のスケーラブルな深部モデリングのためにウェイトスペースで低ランクテンソル構造を使用するSeq2Tensフレームワーク、グラフ上の期待シグネチャが低楕円拡散プロセスを誘発するグラフベースのモデル、標準グラフニューラルネットワークの表現的かつトラクタブルな代替手段を提供する。
さらに、Random Fourier Signature Featuresは理論的な保証を持つスケーラブルなカーネル近似であり、Recurrent Sparse Spectrum Signature Gaussian Processesはガウス的プロセス、シグネチャカーネル、ランダムな特徴を適応コンテキスト長で予測するマルチ水平時系列の原則的無視メカニズムと組み合わせている。
この論文は方法論的ツールキットと概念的ブリッジの両方として機能し、シーケンシャルで構造化されたデータに対するスケーラブルでシグネチャベースの学習における現在の最先端技術への有用な参照を提供することを期待している。
関連論文リスト
- Communities in the Kuramoto Model: Dynamics and Detection via Path Signatures [1.024113475677323]
この問題を解決するために,連続経路の幾何学的および時間的特性を符号化する数学的枠組みを提案する。
パスシグネチャは、動的データの再パラメータ化不変な特徴を提供する。
本研究では,観測時系列から構造的コミュニティを正確に復元する,署名に基づく新しいコミュニティ検出アルゴリズムを提案する。
論文 参考訳(メタデータ) (2025-03-21T21:41:48Z) - Flow-based generative models as iterative algorithms in probability space [18.701755188870823]
フローベースの生成モデルは、正確な推定、効率的なサンプリング、決定論的変換を提供する。
本チュートリアルでは,フローベース生成モデルのための直感的な数学的枠組みを提案する。
我々は,信号処理や機械学習にフローベース生成モデルを効果的に適用するために必要なツールを研究者や実践者に提供することを目的としている。
論文 参考訳(メタデータ) (2025-02-19T03:09:18Z) - Inference-Time Alignment in Diffusion Models with Reward-Guided Generation: Tutorial and Review [59.856222854472605]
このチュートリアルは、拡散モデルにおける下流の報酬関数を最適化するための推論時ガイダンスとアライメント方法に関する詳細なガイドを提供する。
生物学のような分野における実践的な応用は、しばしば特定の指標を最大化するサンプル生成を必要とする。
本稿では,(1)推論時と組み合わせた微調整手法,(2)モンテカルロ木探索などの探索アルゴリズムに基づく推論時アルゴリズム,(3)言語モデルと拡散モデルにおける推論時アルゴリズムの接続について論じる。
論文 参考訳(メタデータ) (2025-01-16T17:37:35Z) - Structure Learning in Gaussian Graphical Models from Glauber Dynamics [6.982878344925993]
グラウバー力学に基づいてデータをサンプリングする場合, ガウスモデル選択のための最初のアルゴリズムを提案する。
本稿では,提案アルゴリズムの構造学習性能の計算的および統計的複雑さを保証する。
論文 参考訳(メタデータ) (2024-12-24T18:49:13Z) - On the Trajectory Regularity of ODE-based Diffusion Sampling [79.17334230868693]
拡散に基づく生成モデルは微分方程式を用いて、複素データ分布と抽出可能な事前分布の間の滑らかな接続を確立する。
本稿では,拡散モデルのODEに基づくサンプリングプロセスにおいて,いくつかの興味深い軌道特性を同定する。
論文 参考訳(メタデータ) (2024-05-18T15:59:41Z) - Sparse Training of Discrete Diffusion Models for Graph Generation [45.103518022696996]
SparseDiffは、ほとんど全ての大きなグラフがスパースであるという観察に基づく、新しい拡散モデルである。
エッジのサブセットを選択することで、SparseDiffは、ノイズ発生過程とノイズ発生ネットワーク内のスパースグラフ表現を効果的に活用する。
本モデルでは,小規模・大規模両方のデータセットにおいて,複数のメトリクスにわたる最先端性能を示す。
論文 参考訳(メタデータ) (2023-11-03T16:50:26Z) - Bayesian Graph Contrastive Learning [55.36652660268726]
本稿では,ランダムな拡張がエンコーダにつながることを示すグラフコントラスト学習手法の新たな視点を提案する。
提案手法は,各ノードを決定論的ベクトルに埋め込む既存の手法とは対照的に,各ノードを潜在空間の分布で表現する。
いくつかのベンチマークデータセットにおける既存の最先端手法と比較して,性能が大幅に向上したことを示す。
論文 参考訳(メタデータ) (2021-12-15T01:45:32Z) - Learned Factor Graphs for Inference from Stationary Time Sequences [107.63351413549992]
定常時間列のためのモデルベースアルゴリズムとデータ駆動型MLツールを組み合わせたフレームワークを提案する。
ニューラルネットワークは、時系列の分布を記述する因子グラフの特定のコンポーネントを別々に学習するために開発された。
本稿では,学習された定常因子グラフに基づく推論アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-06-05T07:06:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。