論文の概要: A Brief Survey on the Approximation Theory for Sequence Modelling
- arxiv url: http://arxiv.org/abs/2302.13752v1
- Date: Mon, 27 Feb 2023 13:31:21 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-28 15:37:36.295423
- Title: A Brief Survey on the Approximation Theory for Sequence Modelling
- Title(参考訳): 系列モデリングのための近似理論に関する一考察
- Authors: Haotian Jiang, Qianxiao Li, Zhong Li, Shida Wang
- Abstract要約: 機械学習におけるシーケンスモデリングの近似理論の現況を調査する。
特に、古典近似パラダイムのレンズによる既存の結果の分類に重点を置いている。
また、シーケンスモデリング理論の構築に向けた今後の研究の方向性について概説する。
- 参考スコア(独自算出の注目度): 26.92162195167862
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We survey current developments in the approximation theory of sequence
modelling in machine learning. Particular emphasis is placed on classifying
existing results for various model architectures through the lens of classical
approximation paradigms, and the insights one can gain from these results. We
also outline some future research directions towards building a theory of
sequence modelling.
- Abstract(参考訳): 機械学習におけるシーケンスモデリングの近似理論の現況を調査する。
特に、古典的な近似パラダイムのレンズを通して、様々なモデルアーキテクチャの既存の結果の分類と、これらの結果から得られる洞察に重点が置かれている。
また,シーケンスモデリング理論の構築に向けた今後の研究方向についても概説する。
関連論文リスト
- A Survey of Model Architectures in Information Retrieval [64.75808744228067]
機能抽出のためのバックボーンモデルと、関連性推定のためのエンドツーエンドシステムアーキテクチャの2つの重要な側面に焦点を当てる。
従来の用語ベースの手法から現代のニューラルアプローチまで,特にトランスフォーマーベースのモデルとそれに続く大規模言語モデル(LLM)の影響が注目されている。
我々は、パフォーマンスとスケーラビリティのアーキテクチャ最適化、マルチモーダル、マルチランガルデータの処理、従来の検索パラダイムを超えた新しいアプリケーションドメインへの適応など、新たな課題と今後の方向性について議論することで結論付けた。
論文 参考訳(メタデータ) (2025-02-20T18:42:58Z) - On the Feature Learning in Diffusion Models [26.53807235141923]
本稿では,拡散モデルの学習力学を従来の分類モデルと比較し,分析・比較することを目的とした特徴学習フレームワークを提案する。
我々の理論的分析は、同じ条件下で拡散モデルがデータのよりバランスよく包括的な表現を学習することを奨励していることを示している。
対照的に、分類のために訓練された類似アーキテクチャを持つニューラルネットワークは、データの特定のパターンを学ぶことを優先する傾向がある。
論文 参考訳(メタデータ) (2024-12-02T00:41:25Z) - Towards Efficient Modelling of String Dynamics: A Comparison of State Space and Koopman based Deep Learning Methods [8.654571696634825]
State Space Models (SSM) と Koopman に基づくディープラーニング手法は、線形および非線形の剛弦の力学をモデル化する。
以上の結果から,提案したクープマンモデルが,長周期モデリングにおける非線形ケースにおいて,他の既存手法と同等以上の性能を示すことが示唆された。
本研究は、これらの手法と過去の手法の比較概要を提供し、モデル改善のための革新的な戦略を導入することにより、力学系の物理モデリングに関する洞察を貢献する。
論文 参考訳(メタデータ) (2024-08-29T15:55:27Z) - Learnable & Interpretable Model Combination in Dynamical Systems Modeling [0.0]
この研究は、動的システムモデリングにおいて、どのタイプのモデルが通常結合されるかを簡単に議論する。
本稿では,混合代数的,離散的,微分方程式に基づくモデルを表現可能なモデルのクラスを提案する。
最後に,モデルの任意の組み合わせを,容易に解釈可能な方法で記述できる新しいワイルドカードアーキテクチャを提案する。
論文 参考訳(メタデータ) (2024-06-12T11:17:11Z) - Applied Causal Inference Powered by ML and AI [54.88868165814996]
本書は古典的構造方程式モデル(SEM)とその現代AI等価性、有向非巡回グラフ(DAG)および構造因果モデル(SCM)のアイデアを提示する。
それは、現代の予測ツールを使用して、そのようなモデルで推論を行うダブル/デバイアスド機械学習メソッドをカバーしている。
論文 参考訳(メタデータ) (2024-03-04T20:28:28Z) - A PAC-Bayesian Perspective on the Interpolating Information Criterion [54.548058449535155]
補間系の性能に影響を及ぼす要因を特徴付ける一般モデルのクラスに対して,PAC-Bayes境界がいかに得られるかを示す。
オーバーパラメータ化モデルに対するテスト誤差が、モデルとパラメータの初期化スキームの組み合わせによって課される暗黙の正規化の品質に依存するかの定量化を行う。
論文 参考訳(メタデータ) (2023-11-13T01:48:08Z) - Representer Point Selection for Explaining Regularized High-dimensional
Models [105.75758452952357]
本稿では,高次元表現器と呼ぶサンプルベース説明のクラスを紹介する。
私たちのワークホースは、一般化された高次元モデルに対する新しい代表者定理である。
提案手法の実証的性能について,実世界の2進分類データセットと2つの推薦システムデータセットを用いて検討した。
論文 参考訳(メタデータ) (2023-05-31T16:23:58Z) - Internal Representations of Vision Models Through the Lens of Frames on
Data Manifolds [8.67467876089153]
多様体の接束上のフレームの概念から着想を得た、そのような表現を研究するための新しいアプローチを提案する。
私たちの構成は、ニューラルネットワークフレームと呼ばれ、データポイントの特定の種類の摂動を表すベクトルの集合を組み立てることによって形成されます。
ニューラルフレームを用いて、データポイントの小さな近傍でモデル、層間、特定の変動モードの処理方法について観察する。
論文 参考訳(メタデータ) (2022-11-19T01:48:19Z) - Learning Lattice Quantum Field Theories with Equivariant Continuous
Flows [10.124564216461858]
格子場理論の高次元確率分布から抽出する機械学習手法を提案する。
提案手法を$phi4$理論で検証し,提案したフローベース手法のサンプリング効率を体系的に上回っていることを示す。
論文 参考訳(メタデータ) (2022-07-01T09:20:05Z) - Planning with Diffusion for Flexible Behavior Synthesis [125.24438991142573]
我々は、できるだけ多くの軌道最適化パイプラインをモデリング問題に折り畳むことがどう見えるか検討する。
我々の技術的アプローチの核心は、軌道を反復的にデノベーションすることで計画する拡散確率モデルにある。
論文 参考訳(メタデータ) (2022-05-20T07:02:03Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。