論文の概要: Event Representation with Sequential, Semi-Supervised Discrete Variables
- arxiv url: http://arxiv.org/abs/2010.04361v3
- Date: Tue, 13 Apr 2021 00:44:03 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-09 04:20:21.224246
- Title: Event Representation with Sequential, Semi-Supervised Discrete Variables
- Title(参考訳): 逐次的半教師付き離散変数によるイベント表現
- Authors: Mehdi Rezaee and Francis Ferraro
- Abstract要約: 離散的な外部知識の部分的に観測されたシーケンスを考慮に入れたニューラルシーケンスモデリング法を提案する。
我々は、慎重に定義されたエンコーダ内でGumbel-Softmax再パラメータ化を利用するシーケンシャルなニューラル変動オートエンコーダを構築する。
- 参考スコア(独自算出の注目度): 16.54912614895861
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Within the context of event modeling and understanding, we propose a new
method for neural sequence modeling that takes partially-observed sequences of
discrete, external knowledge into account. We construct a sequential neural
variational autoencoder, which uses Gumbel-Softmax reparametrization within a
carefully defined encoder, to allow for successful backpropagation during
training. The core idea is to allow semi-supervised external discrete knowledge
to guide, but not restrict, the variational latent parameters during training.
Our experiments indicate that our approach not only outperforms multiple
baselines and the state-of-the-art in narrative script induction, but also
converges more quickly.
- Abstract(参考訳): イベントモデリングと理解の文脈において、離散的な外部知識の部分的に観測されたシーケンスを考慮に入れたニューラルシーケンスモデリングの新しい手法を提案する。
我々は、Gumbel-Softmax再パラメータ化を慎重に定義したエンコーダ内に構築し、トレーニング中のバックプロパゲーションを成功させる。
中心となる考え方は、半教師付き外部離散知識がトレーニング中の変動的潜在パラメータを誘導するが制限しないようにすることである。
実験の結果,我々のアプローチは,複数のベースラインや物語スクリプトのインダクションにおける最先端の技術に勝るだけでなく,より迅速に収束することが示唆された。
関連論文リスト
- Deep Learning Through A Telescoping Lens: A Simple Model Provides Empirical Insights On Grokking, Gradient Boosting & Beyond [61.18736646013446]
その驚くべき振る舞いをより深く理解するために、トレーニングされたニューラルネットワークの単純かつ正確なモデルの有用性について検討する。
3つのケーススタディで、様々な顕著な現象に関する新しい経験的洞察を導き出すためにどのように適用できるかを説明します。
論文 参考訳(メタデータ) (2024-10-31T22:54:34Z) - COTODE: COntinuous Trajectory neural Ordinary Differential Equations for modelling event sequences [2.2544703147182172]
我々は、イベントをスタンドアローンの現象ではなく、ガウス過程の観察として見る方法を採用し、それによって俳優のダイナミクスが支配される。
得られたダイナミクスを統合することにより,広範に成功したニューラルODEモデルの連続軌道修正を実現する。
実証研究により,ガウス過程と負のフィードバックを持つモデルが最先端性能を実現し,同様のアーキテクチャに対して最大20%のAUROCの改善が得られた。
論文 参考訳(メタデータ) (2024-08-15T09:49:37Z) - Trajectory Forecasting through Low-Rank Adaptation of Discrete Latent Codes [36.12653178844828]
トラジェクトリ予測は、一連のエージェントの将来の動きを予測できるため、ビデオ監視分析に不可欠である。
本稿では,離散潜在空間を用いたベクトル量子変分オートエンコーダ(VQ-VAEs)を導入し,後方崩壊問題に対処する。
このような2段階のフレームワークは、インスタンスレベルの離散化によって強化され、正確で多様な予測につながることを示す。
論文 参考訳(メタデータ) (2024-05-31T10:13:17Z) - Continual Learning via Sequential Function-Space Variational Inference [65.96686740015902]
連続学習を逐次関数空間変動推論として定式化した目的を提案する。
ニューラルネットワークの予測を直接正規化する目的と比較して、提案した目的はより柔軟な変動分布を可能にする。
タスクシーケンスの範囲で、逐次関数空間変動推論によってトレーニングされたニューラルネットワークは、関連する手法でトレーニングされたネットワークよりも予測精度が良いことを実証した。
論文 参考訳(メタデータ) (2023-12-28T18:44:32Z) - Learning minimal representations of stochastic processes with
variational autoencoders [52.99137594502433]
プロセスを記述するのに必要なパラメータの最小セットを決定するために、教師なしの機械学習アプローチを導入する。
我々の手法はプロセスを記述する未知のパラメータの自律的な発見を可能にする。
論文 参考訳(メタデータ) (2023-07-21T14:25:06Z) - Inverse Dynamics Pretraining Learns Good Representations for Multitask
Imitation [66.86987509942607]
このようなパラダイムを模倣学習でどのように行うべきかを評価する。
本稿では,事前学習コーパスがマルチタスクのデモンストレーションから成り立つ環境について考察する。
逆動力学モデリングはこの設定に適していると主張する。
論文 参考訳(メタデータ) (2023-05-26T14:40:46Z) - On the Forward Invariance of Neural ODEs [92.07281135902922]
本稿では,ニューラル常微分方程式(ODE)が出力仕様を満たすことを保証するための新しい手法を提案する。
提案手法では,出力仕様を学習システムのパラメータや入力の制約に変換するために,制御障壁関数のクラスを用いる。
論文 参考訳(メタデータ) (2022-10-10T15:18:28Z) - Latent Neural ODEs with Sparse Bayesian Multiple Shooting [13.104556034767025]
長い軌道上でのニューラルODEなどの動的モデルのトレーニングは、モデルトレーニングを実際に動作させるためには、軌道分割のような様々なトリックを使用する必要がある難しい問題である。
本稿では,並列に最適化されたトラジェクトリを管理可能なショートセグメントに分割する,ニューラルネットワークの多射法を提案する。
複数の大規模ベンチマークデータセット上で、効率的で安定したトレーニングと最先端のパフォーマンスを示す。
論文 参考訳(メタデータ) (2022-10-07T11:36:29Z) - Hybrid Predictive Coding: Inferring, Fast and Slow [62.997667081978825]
本稿では,反復型と償却型の両方を原則的に組み合わせたハイブリッド予測符号化ネットワークを提案する。
我々は,本モデルが本質的に不確実性に敏感であり,最小計算費用を用いて正確な信念を得るためにバランスを適応的にバランスさせることを実証した。
論文 参考訳(メタデータ) (2022-04-05T12:52:45Z) - Improving Deep Learning Interpretability by Saliency Guided Training [36.782919916001624]
精度法はモデル予測において重要な入力特徴を強調するために広く用いられている。
既存の方法の多くは、修正された勾配関数のバックプロパゲーションを使用して、サリエンシマップを生成する。
本稿では,予測に使用する雑音勾配を低減するために,ニューラルネットワークに対するサリエンシ指導訓練手法を提案する。
論文 参考訳(メタデータ) (2021-11-29T06:05:23Z) - Contrastively Disentangled Sequential Variational Autoencoder [20.75922928324671]
本稿では,C-DSVAE(Contrastively Disentangled Sequential Variational Autoencoder)という新しいシーケンス表現学習手法を提案する。
我々は,静的因子と動的因子の相互情報をペナルティ化しながら,入力と潜伏因子の相互情報を最大化する新しいエビデンスローバウンドを用いる。
実験の結果、C-DSVAEは従来の最先端の手法よりも優れていたことが判明した。
論文 参考訳(メタデータ) (2021-10-22T23:00:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。