論文の概要: Automata Learning -- Expect Delays!
- arxiv url: http://arxiv.org/abs/2508.16384v1
- Date: Fri, 22 Aug 2025 13:38:49 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-25 16:42:36.396065
- Title: Automata Learning -- Expect Delays!
- Title(参考訳): 自動学習 - 遅延を期待!
- Authors: Gabriel Dengler, Sven Apel, Holger Hermanns,
- Abstract要約: 本稿では,遅延の存在下でのアクティブオートマトン学習(AAL)について検討する。
本稿では,各遷移に伴う遅延を有するMealyマシンについて考察し,学習者がそれらのマシンの忠実な推定値にどのように効率的に到達できるかを考察する。
- 参考スコア(独自算出の注目度): 5.208686653449339
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: This paper studies active automata learning (AAL) in the presence of stochastic delays. We consider Mealy machines that have stochastic delays associated with each transition and explore how the learner can efficiently arrive at faithful estimates of those machines, the precision of which crucially relies on repetitive sampling of transition delays. While it is possible to na\"ively integrate the delay sampling into AAL algorithms such as $L^*$, this leads to considerable oversampling near the root of the state space. We address this problem by separating conceptually the learning of behavior and delays such that the learner uses the information gained while learning the logical behavior to arrive at efficient input sequences for collecting the needed delay samples. We put emphasis on treating cases in which identical input/output behaviors might stem from distinct delay characteristics. Finally, we provide empirical evidence that our method outperforms the na\"ive baseline across a wide range of benchmarks and investigate its applicability in a realistic setting by studying the join order in a relational database.
- Abstract(参考訳): 本稿では,確率的遅延の存在下でのアクティブオートマトン学習(AAL)について検討する。
本稿では,各遷移に伴う確率的遅延を持つメアリー機械について考察し,学習者がそれらの機械の忠実な推定値にいかに効率よく到達できるかを検討する。
遅延サンプリングを$L^*$のようなAALアルゴリズムに統合することは可能であるが、これは状態空間の根元付近でかなりのオーバーサンプリングをもたらす。
本稿では,学習者が論理的動作を学習しながら得られた情報を用いて,必要な遅延サンプルを収集する効率的な入力シーケンスに到達するように,動作と遅延の学習を概念的に分離することで,この問題に対処する。
我々は、同一の入出力動作が異なる遅延特性から生じる可能性がある場合の処理に重点を置いている。
最後に,本手法は,幅広いベンチマークにおいて,na\"iveベースラインよりも優れていることを示す実証的証拠を提供するとともに,関係データベースにおける結合順序を研究することにより,現実的な環境での適用性について検討する。
関連論文リスト
- Evaluating the Efficacy of Instance Incremental vs. Batch Learning in Delayed Label Environments: An Empirical Study on Tabular Data Streaming for Fraud Detection [0.13980986259786224]
不正検出やクレジットスコアリングといった現実世界のシナリオでは、ラベルが遅れる可能性がある。
バッチインクリメンタルアルゴリズムは多くの現実世界のタスクで広く使われている。
以上の結果から,インクリメンタル学習が優れた選択肢ではないことが示唆された。
論文 参考訳(メタデータ) (2024-09-16T09:20:01Z) - Bisimulation Learning [55.859538562698496]
我々は、大きな、潜在的に無限の状態空間を持つ状態遷移系の有限バイシミュレートを計算する。
提案手法は,実際に行われている他の最先端ツールよりも高速な検証結果が得られる。
論文 参考訳(メタデータ) (2024-05-24T17:11:27Z) - DelGrad: Exact event-based gradients for training delays and weights on spiking neuromorphic hardware [1.5226147562426895]
スパイキングニューラルネットワーク(SNN)は本質的には情報表現と処理のための信号のタイミングに依存している。
我々は,シナプス重みと遅延の両方について,正確な損失勾配を計算するイベントベース手法であるDelGradを提案する。
ノイズの多い混合信号ハードウェア上でSNNに遅延を追加する際のメモリ効率と精度の利点を実験的に示す。
論文 参考訳(メタデータ) (2024-04-30T00:02:34Z) - Stochastic Approximation with Delayed Updates: Finite-Time Rates under Markovian Sampling [73.5602474095954]
マルコフサンプリングの遅延更新による近似スキームの非漸近的性能について検討した。
我々の理論的な発見は、幅広いアルゴリズムの遅延の有限時間効果に光を当てた。
論文 参考訳(メタデータ) (2024-02-19T03:08:02Z) - Posterior Sampling with Delayed Feedback for Reinforcement Learning with
Linear Function Approximation [62.969796245827006]
Delayed-PSVI は楽観的な値に基づくアルゴリズムであり、後続サンプリングによる雑音摂動により値関数空間を探索する。
我々のアルゴリズムは、未知の遅延が存在する場合に、$widetildeO(sqrtd3H3 T + d2H2 E[tau]$最悪の後悔を実現する。
遅延LPSVIのための勾配に基づく近似サンプリングスキームをLangevin動的に組み込んだ。
論文 参考訳(メタデータ) (2023-10-29T06:12:43Z) - Delayed Reinforcement Learning by Imitation [31.932677462399468]
遅延しない実演から遅延環境での動作方法を学ぶ新しいアルゴリズムを提案する。
各種タスクにおいて,DIDAは顕著なサンプル効率で高い性能が得られることを示す。
論文 参考訳(メタデータ) (2022-05-11T15:27:33Z) - Delay-adaptive step-sizes for asynchronous learning [8.272788656521415]
システム内の実際の時間変化の遅延に依存する学習率を利用することが可能であることを示す。
これらの方法のそれぞれに対して, 遅延をオンラインで測定し, 遅延適応的なステップサイズポリシーを提示し, 現状に対する理論的, 実践的優位性を実証する。
論文 参考訳(メタデータ) (2022-02-17T09:51:22Z) - A Novel Anomaly Detection Algorithm for Hybrid Production Systems based
on Deep Learning and Timed Automata [73.38551379469533]
DAD:DeepAnomalyDetectionは,ハイブリッド生産システムにおける自動モデル学習と異常検出のための新しいアプローチである。
深層学習とタイムドオートマトンを組み合わせて、観察から行動モデルを作成する。
このアルゴリズムは実システムからの2つのデータを含む少数のデータセットに適用され、有望な結果を示している。
論文 参考訳(メタデータ) (2020-10-29T08:27:43Z) - Non-Stationary Delayed Bandits with Intermediate Observations [10.538264213183076]
オンラインレコメンデータシステムは、特に長期的なメトリクスを最適化する場合、フィードバックを受け取るのに長い遅延に直面します。
中間観測による非定常遅延帯域の問題を紹介する。
UCRLに基づく効率的なアルゴリズムを開発し,その性能に対するサブ線形後悔保証を証明した。
論文 参考訳(メタデータ) (2020-06-03T09:27:03Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。