論文の概要: Path Structured Multimarginal Schr\"odinger Bridge for Probabilistic
Learning of Hardware Resource Usage by Control Software
- arxiv url: http://arxiv.org/abs/2310.00604v2
- Date: Tue, 3 Oct 2023 12:13:34 GMT
- ステータス: 処理完了
- システム内更新日: 2023-10-05 03:09:23.155640
- Title: Path Structured Multimarginal Schr\"odinger Bridge for Probabilistic
Learning of Hardware Resource Usage by Control Software
- Title(参考訳): 制御ソフトウェアによるハードウェア資源利用確率的学習のためのパス構造型多元系schr\"odinger bridge
- Authors: Georgiy A. Bondar, Robert Gifford, Linh Thi Xuan Phan, Abhishek Halder
- Abstract要約: 経路構造を持つマルチマルジナル・シュル「オーディンガー橋問題 (MSBP) の解法は、最も測定値の高い軌道である。
制御ソフトウェアによるハードウェアリソース利用の学習において,MSBPを解くアルゴリズムの進歩を活用している。
- 参考スコア(独自算出の注目度): 1.7601096935307592
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The solution of the path structured multimarginal Schr\"{o}dinger bridge
problem (MSBP) is the most-likely measure-valued trajectory consistent with a
sequence of observed probability measures or distributional snapshots. We
leverage recent algorithmic advances in solving such structured MSBPs for
learning stochastic hardware resource usage by control software. The solution
enables predicting the time-varying distribution of hardware resource
availability at a desired time with guaranteed linear convergence. We
demonstrate the efficacy of our probabilistic learning approach in a model
predictive control software execution case study. The method exhibits rapid
convergence to an accurate prediction of hardware resource utilization of the
controller. The method can be broadly applied to any software to predict
cyber-physical context-dependent performance at arbitrary time.
- Abstract(参考訳): path structured multimarginal schr\"{o}dinger bridge problem (msbp) の解は、観測された確率測度や分布スナップショットの列と一致する最もよく似た測度値の軌跡である。
制御ソフトウェアによる確率的ハードウェアリソース利用の学習において,このような構造化MSBPの解法における最近のアルゴリズムの進歩を活用する。
このソリューションは、線形収束を保証することにより、ハードウェアリソース可用性の時間変化分布を所望の時間で予測することができる。
モデル予測制御ソフトウェア実行ケーススタディにおいて,確率的学習手法の有効性を実証する。
この方法は、コントローラのハードウェアリソース利用の正確な予測に迅速に収束する。
この手法は任意のタイミングでサイバー物理的文脈依存のパフォーマンスを予測するソフトウェアに広く適用することができる。
関連論文リスト
- Stochastic Learning of Computational Resource Usage as Graph Structured Multimarginal Schrödinger Bridge [1.6111903346958474]
本稿では,グラフ構造を持つSchr"odingerブリッジ問題として,時間変化の計算資源利用法を提案する。
シングルコアおよびマルチコアのケースで学習するための詳細なアルゴリズムを提供し、収束保証、計算複雑性について議論し、それらの実用性を実証する。
論文 参考訳(メタデータ) (2024-05-21T02:39:45Z) - Practical Probabilistic Model-based Deep Reinforcement Learning by
Integrating Dropout Uncertainty and Trajectory Sampling [7.179313063022576]
本稿では,ニューラルネットワーク上に構築された現在の確率モデルベース強化学習(MBRL)の予測安定性,予測精度,制御能力について述べる。
トラジェクトリサンプリング(DPETS)を用いた新しいアプローチであるドロップアウト型確率アンサンブルを提案する。
論文 参考訳(メタデータ) (2023-09-20T06:39:19Z) - Robust Control for Dynamical Systems With Non-Gaussian Noise via Formal
Abstractions [59.605246463200736]
雑音分布の明示的な表現に依存しない新しい制御器合成法を提案する。
まず、連続制御系を有限状態モデルに抽象化し、離散状態間の確率的遷移によってノイズを捕捉する。
我々は最先端の検証技術を用いてマルコフ決定プロセスの間隔を保証し、これらの保証が元の制御システムに受け継がれるコントローラを演算する。
論文 参考訳(メタデータ) (2023-01-04T10:40:30Z) - Probabilistic Time Series Forecasting for Adaptive Monitoring in Edge
Computing Environments [0.06999740786886537]
本稿では,重要なインフラをモニタリングするためのサンプリングベースおよびクラウドロケーションアプローチを提案する。
公開されているストリーミングデータセット上で,モニタリングパイプラインのプロトタイプ実装を評価した。
論文 参考訳(メタデータ) (2022-11-24T17:35:14Z) - Distributional Hamilton-Jacobi-Bellman Equations for Continuous-Time
Reinforcement Learning [39.07307690074323]
本研究では,連続した環境下で対話するエージェントによって得られるリターンの分布を予測することの問題点を考察する。
正確なリターン予測は、リスクに敏感な制御、状態表現、マルチエージェント調整などのための最適なポリシーを決定するのに有用であることが証明されている。
本稿では、オンライン制御アルゴリズムで実装可能なJKOスキームに基づいて、分布HJBを近似的に解くことのできるトラクタブルアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-05-24T16:33:54Z) - Sampling-Based Robust Control of Autonomous Systems with Non-Gaussian
Noise [59.47042225257565]
雑音分布の明示的な表現に依存しない新しい計画法を提案する。
まず、連続系を離散状態モデルに抽象化し、状態間の確率的遷移によってノイズを捕捉する。
いわゆる区間マルコフ決定過程(iMDP)の遷移確率区間におけるこれらの境界を捉える。
論文 参考訳(メタデータ) (2021-10-25T06:18:55Z) - Probabilistic robust linear quadratic regulators with Gaussian processes [73.0364959221845]
ガウス過程(GP)のような確率モデルは、制御設計に続く使用のためのデータから未知の動的システムを学ぶための強力なツールです。
本稿では、確率的安定性マージンに関して堅牢なコントローラを生成する線形化GPダイナミクスのための新しいコントローラ合成について述べる。
論文 参考訳(メタデータ) (2021-05-17T08:36:18Z) - Closing the Closed-Loop Distribution Shift in Safe Imitation Learning [80.05727171757454]
模倣学習問題において,安全な最適化に基づく制御戦略を専門家として扱う。
我々は、実行時に安価に評価でき、専門家と同じ安全保証を確実に満足する学習されたポリシーを訓練する。
論文 参考訳(メタデータ) (2021-02-18T05:11:41Z) - Resource Allocation in Multi-armed Bandit Exploration: Overcoming
Sublinear Scaling with Adaptive Parallelism [107.48538091418412]
腕の引っ張りに様々な量の資源を割り当てることができる分割可能な資源にアクセス可能な場合,マルチアームの帯状地における探索について検討する。
特に、分散コンピューティングリソースの割り当てに重点を置いており、プル毎により多くのリソースを割り当てることで、結果をより早く得ることができます。
論文 参考訳(メタデータ) (2020-10-31T18:19:29Z) - Online Reinforcement Learning Control by Direct Heuristic Dynamic
Programming: from Time-Driven to Event-Driven [80.94390916562179]
時間駆動学習は、新しいデータが到着すると予測モデルのパラメータを継続的に更新する機械学習手法を指す。
ノイズなどの重要なシステムイベントによる時間駆動型dHDPの更新を防止することが望ましい。
イベント駆動型dHDPアルゴリズムは,従来の時間駆動型dHDPと比較して動作することを示す。
論文 参考訳(メタデータ) (2020-06-16T05:51:25Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。