Fugu-MT 論文翻訳(概要): Can recurrent neural networks learn process model structure?

論文の概要: Can recurrent neural networks learn process model structure?

arxiv url: http://arxiv.org/abs/2212.06430v1
Date: Tue, 13 Dec 2022 08:40:01 GMT
ステータス: 翻訳完了
システム内更新日: 2022-12-14 15:14:28.834241
Title: Can recurrent neural networks learn process model structure?
Title（参考訳）: リカレントニューラルネットワークはプロセスモデル構造を学習できるか?
Authors: Jari Peeperkorn and Seppe vanden Broucke and Jochen De Weerdt
Abstract要約: 本稿では,適合度,精度,一般化のために,変分に基づく再サンプリングとカスタムメトリクスを組み合わせた評価フレームワークを提案する。 LSTMは、単純化されたプロセスデータであっても、プロセスモデル構造を学ぶのに苦労する可能性があることを確認します。また,トレーニング中にLSTMで見られる情報量が減少すると,一般化や精度の低下が生じた。
参考スコア（独自算出の注目度）: 0.2580765958706854
License: http://creativecommons.org/licenses/by/4.0/
Abstract: Various methods using machine and deep learning have been proposed to tackle different tasks in predictive process monitoring, forecasting for an ongoing case e.g. the most likely next event or suffix, its remaining time, or an outcome-related variable. Recurrent neural networks (RNNs), and more specifically long short-term memory nets (LSTMs), stand out in terms of popularity. In this work, we investigate the capabilities of such an LSTM to actually learn the underlying process model structure of an event log. We introduce an evaluation framework that combines variant-based resampling and custom metrics for fitness, precision and generalization. We evaluate 4 hypotheses concerning the learning capabilities of LSTMs, the effect of overfitting countermeasures, the level of incompleteness in the training set and the level of parallelism in the underlying process model. We confirm that LSTMs can struggle to learn process model structure, even with simplistic process data and in a very lenient setup. Taking the correct anti-overfitting measures can alleviate the problem. However, these measures did not present themselves to be optimal when selecting hyperparameters purely on predicting accuracy. We also found that decreasing the amount of information seen by the LSTM during training, causes a sharp drop in generalization and precision scores. In our experiments, we could not identify a relationship between the extent of parallelism in the model and the generalization capability, but they do indicate that the process' complexity might have impact.
Abstract（参考訳）: 機械学習とディープラーニングを用いた様々な手法が、予測プロセスの監視、最も可能性の高い次の事象や接尾辞の予測、残時間、結果に関連する変数など、様々なタスクに取り組むために提案されている。 recurrent neural networks (rnns)、特にlong short-term memory nets (lstms)は人気の点で際立っている。本研究では、イベントログの基盤となるプロセスモデル構造を実際に学習するLSTMの機能について検討する。本稿では,適合度,精度,一般化のために,変分に基づく再サンプリングとカスタムメトリクスを組み合わせた評価フレームワークを提案する。 LSTMの学習能力,オーバーフィッティング対策の効果,トレーニングセットの不完全性レベル,基礎となるプロセスモデルにおける並列性レベルに関する4つの仮説を評価した。 LSTMは、単純化されたプロセスデータや非常に寛大なセットアップであっても、プロセスモデル構造を学ぶのに苦労する。正しいオーバーフィッティング対策をとることで問題を緩和できる。しかし、これらの測定値は、精度の予測において純粋にハイパーパラメータを選択する際に最適であるとは示さなかった。また,トレーニング中にLSTMで見られる情報量が減少すると,一般化や精度の低下が生じた。我々の実験では、モデルにおける並列性の程度と一般化能力の関係は特定できなかったが、プロセスの複雑さが影響する可能性があることを示している。

関連論文リスト

LESA: Learnable LLM Layer Scaling-Up [57.0510934286449]
LLM(Large Language Models)をスクラッチからトレーニングするには膨大な計算資源が必要であるため、非常に高価である。モデルスケーリングアップは、より小さなモデルのパラメータを活用してより大きなモデルを作成することで、有望なソリューションを提供する。深度スケールアップのための新しい学習方法である textbfLESA を提案する。
論文参考訳（メタデータ） (2025-02-19T14:58:48Z)
What Do Learning Dynamics Reveal About Generalization in LLM Reasoning? [83.83230167222852]
モデルの一般化動作は,事前記憶列車の精度と呼ばれるトレーニング指標によって効果的に特徴づけられることがわかった。モデルの学習行動と一般化を結びつけることで、トレーニング戦略に目標とする改善を導くことができる。
論文参考訳（メタデータ） (2024-11-12T09:52:40Z)
Multi-Scale Convolutional LSTM with Transfer Learning for Anomaly Detection in Cellular Networks [1.1432909951914676]
本研究では,トランスファーラーニング(TL)を用いたマルチスケール畳み込みLSTMによるセルネットワークの異常検出手法を提案する。モデルは最初、公開データセットを使用してスクラッチからトレーニングされ、典型的なネットワーク動作を学習する。我々は,スクラッチから訓練したモデルの性能と,TLを用いた微調整モデルの性能を比較した。
論文参考訳（メタデータ） (2024-09-30T17:51:54Z)
Just How Flexible are Neural Networks in Practice? [89.80474583606242]
ニューラルネットワークは、パラメータを持つ少なくとも多くのサンプルを含むトレーニングセットに適合できると広く信じられている。しかし実際には、勾配や正規化子など、柔軟性を制限したトレーニング手順によるソリューションしか見つからない。
論文参考訳（メタデータ） (2024-06-17T12:24:45Z)
Time Elastic Neural Networks [2.1756081703276]
時間弾性ニューラルネットワーク(teNN)という,非定型ニューラルネットワークアーキテクチャの導入と詳細化について述べる。古典的ニューラルネットワークアーキテクチャと比較して新しいのは、時間ゆがみ能力を明確に組み込んでいることだ。トレーニング過程において,TENNは各細胞に必要となるニューロン数を減少させることに成功した。
論文参考訳（メタデータ） (2024-05-27T09:01:30Z)
Continuous time recurrent neural networks: overview and application to forecasting blood glucose in the intensive care unit [56.801856519460465]
連続時間自己回帰リカレントニューラルネットワーク(Continuous Time Autoregressive Recurrent Neural Network, CTRNN)は、不規則な観測を考慮に入れたディープラーニングモデルである。重篤なケア環境下での血糖値の確率予測へのこれらのモデルの適用を実証する。
論文参考訳（メタデータ） (2023-04-14T09:39:06Z)
Theoretical Characterization of the Generalization Performance of Overfitted Meta-Learning [70.52689048213398]
本稿では,ガウス的特徴を持つ線形回帰モデルの下で,過剰適合型メタラーニングの性能について検討する。シングルタスク線形回帰には存在しない新しい興味深い性質が見つかる。本分析は,各訓練課題における基礎的真理のノイズや多様性・変動が大きい場合には,良心過剰がより重要かつ容易に観察できることを示唆する。
論文参考訳（メタデータ） (2023-04-09T20:36:13Z)
Go Beyond Multiple Instance Neural Networks: Deep-learning Models based on Local Pattern Aggregation [0.0]
畳み込みニューラルネットワーク(CNN)は、臨床心電図(ECG)と話者非依存音声の処理においてブレークスルーをもたらした。本稿では,局所的なパターン集約に基づくディープラーニングモデルを提案する。 LPANetと呼ばれる新しいネットワーク構造には、トリミングと集約操作が組み込まれている。
論文参考訳（メタデータ） (2022-05-28T13:18:18Z)
Can deep neural networks learn process model structure? An assessment framework and analysis [0.2580765958706854]
本稿では,新しい適合度,精度,一般化の指標を補完する評価手法を提案する。このフレームワークを単純な制御-フローの振る舞いを持つ複数のプロセスモデルに適用する。以上の結果から, 単純化モデルにおいても, オーバーフィッティング対策の注意深い調整が必要であることが示唆された。
論文参考訳（メタデータ） (2022-02-24T09:44:13Z)
Neural Complexity Measures [96.06344259626127]
本稿では,一般化を予測するメタラーニングフレームワークであるNeural Complexity(NC)を提案する。我々のモデルは、データ駆動方式で、多くの異種タスクとの相互作用を通じてスカラー複雑性尺度を学習する。
論文参考訳（メタデータ） (2020-08-07T02:12:10Z)
Convolutional Tensor-Train LSTM for Spatio-temporal Learning [116.24172387469994]
本稿では,ビデオシーケンスの長期相関を効率的に学習できる高次LSTMモデルを提案する。これは、時間をかけて畳み込み特徴を組み合わせることによって予測を行う、新しいテンソルトレインモジュールによって達成される。この結果は,幅広いアプリケーションやデータセットにおいて,最先端のパフォーマンス向上を実現している。
論文参考訳（メタデータ） (2020-02-21T05:00:01Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。