論文の概要: Automating Staged Rollout with Reinforcement Learning
- arxiv url: http://arxiv.org/abs/2204.02189v1
- Date: Fri, 1 Apr 2022 21:22:39 GMT
- ステータス: 処理完了
- システム内更新日: 2022-04-08 04:39:55.313668
- Title: Automating Staged Rollout with Reinforcement Learning
- Title(参考訳): 強化学習による段階的ロールアウトの自動化
- Authors: Shadow Pritchard, Vidhyashree Nagaraju, Lance Fiondella
- Abstract要約: ステージドロールアウト(Staged rollout)は、システム障害などの壊滅的な結果を招くことなく、欠陥発見を加速するために、ソフトウェアアップデートをユーザの一部に段階的にリリースする戦略である。
本稿では,多目的強化学習による段階的ロールアウトを自動化し,新規機能の提供時間や遅延欠陥によるダウンタイムといった利害関係者のニーズを動的にバランスさせる可能性を示す。
- 参考スコア(独自算出の注目度): 1.3750624267664155
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Staged rollout is a strategy of incrementally releasing software updates to
portions of the user population in order to accelerate defect discovery without
incurring catastrophic outcomes such as system wide outages. Some past studies
have examined how to quantify and automate staged rollout, but stop short of
simultaneously considering multiple product or process metrics explicitly. This
paper demonstrates the potential to automate staged rollout with
multi-objective reinforcement learning in order to dynamically balance
stakeholder needs such as time to deliver new features and downtime incurred by
failures due to latent defects.
- Abstract(参考訳): ステージドロールアウト(Staged rollout)は、システム障害などの壊滅的な結果を招くことなく、欠陥発見を加速するために、ソフトウェアアップデートをユーザの一部に段階的にリリースする戦略である。
過去の研究では、段階的なロールアウトの定量化と自動化について検討しているが、複数の製品やプロセスメトリクスを明示的に考慮するのをやめている。
本稿では,多目的強化学習による段階的ロールアウトの自動化の可能性を示し,新規機能の提供時間や遅延欠陥によるダウンタイムといった利害関係者のニーズを動的にバランスさせる。
関連論文リスト
- CORT: Class-Oriented Real-time Tracking for Embedded Systems [46.3107850275261]
本研究は,マルチクラスオブジェクトトラッキングに対する新しいアプローチを提案する。
トラッキング性能をペナルティ化することなく、より小さく予測可能な実行時間を実現することができる。
提案手法は,異なるタイプの複数の対象を持つ複雑な都市シナリオにおいて評価された。
論文 参考訳(メタデータ) (2024-07-20T09:12:17Z) - Apparate: Rethinking Early Exits to Tame Latency-Throughput Tensions in ML Serving [10.926767319124547]
本稿では,機械学習モデルにおける早期退避を自動的に適用し,管理するシステムであるApparateを紹介する。
EEがもたらす時間的なオーバーヘッドと正確性に対処するために、Apparateは出口を再利用して継続的なフィードバックを提供する。
CVおよびNLP分類ワークロードの中央値応答レイテンシを40.5--91.5%と10.0--24.2%に下げる。
論文 参考訳(メタデータ) (2023-12-08T21:49:09Z) - Self-Supervised Multi-Object Tracking For Autonomous Driving From
Consistency Across Timescales [53.55369862746357]
自己管理型マルチオブジェクトトラッカーは、生のドメイン固有データから学習できるという大きな可能性を秘めている。
しかし、その再識別精度は、監督対象よりも低い。
本稿では,複数の連続フレームから再同定特徴を自己教師付きで学習できる学習目標を提案する。
論文 参考訳(メタデータ) (2023-04-25T20:47:29Z) - Self-Supervised Representation Learning from Temporal Ordering of
Automated Driving Sequences [49.91741677556553]
本研究では、認識タスクのための地域レベルの特徴表現を事前学習するための時間順述前文タスクであるTempOを提案する。
我々は各フレームを、オブジェクト検出やトラッキングシステムにとって自然な表現である、未順序な特徴ベクトルのセットで埋め込む。
BDD100K、nu Images、MOT17データセットの大規模な評価は、私たちのTempO事前学習アプローチがシングルフレームの自己教師型学習方法よりも優れていることを示している。
論文 参考訳(メタデータ) (2023-02-17T18:18:27Z) - A Learning Based Framework for Handling Uncertain Lead Times in
Multi-Product Inventory Management [8.889304968879163]
サプライチェーンと在庫管理に関する既存の文献の多くは、ゼロまたは一定リードタイムの需要プロセスを考慮する。
最近導入された遅延解決深度Q-ラーニング(DRDQN)アルゴリズムに動機づけられた本研究では,リードタイムにおける不確実性を扱うための強化学習に基づくパラダイムを開発する。
論文 参考訳(メタデータ) (2022-03-02T05:50:04Z) - Leveraging Time Irreversibility with Order-Contrastive Pre-training [3.1848820580333737]
時系列データに基づく自己教師付き事前学習のための「順序コントラスト」手法について検討する。
本研究では,順序コントラスト事前学習で学習した表現の下流誤差に対する有限サンプル保証を証明した。
この結果から,特定の分布クラスや下流タスクのために設計された事前学習手法が,自己指導型学習の性能を向上させることが示唆された。
論文 参考訳(メタデータ) (2021-11-04T02:56:52Z) - Automated Machine Learning Techniques for Data Streams [91.3755431537592]
本稿では、最先端のオープンソースAutoMLツールを調査し、ストリームから収集したデータに適用し、時間とともにパフォーマンスがどのように変化するかを測定する。
この結果から,既製のAutoMLツールで十分な結果が得られることが示されたが,概念ドリフトや検出,適応といった手法が適用されれば,予測精度を時間とともに維持することが可能になる。
論文 参考訳(メタデータ) (2021-06-14T11:42:46Z) - Induction and Exploitation of Subgoal Automata for Reinforcement
Learning [75.55324974788475]
本稿では,Regressed Learning (RL)タスクにおけるサブゴールの学習と活用のためのISAを提案する。
ISAは、タスクのサブゴールによってエッジがラベル付けされたオートマトンであるサブゴールオートマトンを誘導することで強化学習をインターリーブする。
サブゴールオートマトンはまた、タスクの完了を示す状態と、タスクが成功せずに完了したことを示す状態の2つの特別な状態で構成されている。
論文 参考訳(メタデータ) (2020-09-08T16:42:55Z) - Bayesian active learning for production, a systematic study and a
reusable library [85.32971950095742]
本稿では,現在のアクティブラーニング技術の主な欠点について分析する。
実世界のデータセットの最も一般的な課題が深層能動学習プロセスに与える影響について,系統的研究を行った。
部分的不確実性サンプリングやより大きいクエリサイズといった,アクティブな学習ループを高速化する2つの手法を導出する。
論文 参考訳(メタデータ) (2020-06-17T14:51:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。