論文の概要: Modifying Squint for Prediction with Expert Advice in a Changing
Environment
- arxiv url: http://arxiv.org/abs/2209.06826v1
- Date: Wed, 14 Sep 2022 11:55:15 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-16 13:03:40.099802
- Title: Modifying Squint for Prediction with Expert Advice in a Changing
Environment
- Title(参考訳): 変化環境におけるエキスパートアドバイザによる予測の修正
- Authors: Thom Neuteboom and Tim van Erven
- Abstract要約: 変化環境におけるオンライン学習,特に専門家のアドバイスによる予測のための新しい方法を提案する。
Squint-CEは環境の変化に適しており、Squintの特性を保っている。
- 参考スコア(独自算出の注目度): 1.7894377200944511
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We provide a new method for online learning, specifically prediction with
expert advice, in a changing environment. In a non-changing environment the
Squint algorithm has been designed to always function at least as well as other
known algorithms and in specific cases it functions much better. However, when
using a conventional black-box algorithm to make Squint suitable for a changing
environment, it loses its beneficial properties. Hence, we provide a new
algorithm, Squint-CE, which is suitable for a changing environment and
preserves the properties of Squint.
- Abstract(参考訳): 変化環境におけるオンライン学習,特に専門家のアドバイスによる予測のための新しい方法を提案する。
不変でない環境では、squitアルゴリズムは少なくとも他の既知のアルゴリズムと同様に常に機能するように設計されており、特定のケースではずっとよく機能する。
しかし,従来のブラックボックスアルゴリズムを用いてSquintを環境変化に適合させると,その利点が失われる。
そこで我々は,Squint-CEという,環境変化に適した新しいアルゴリズムを提案し,Squintの特性を保存した。
関連論文リスト
- Quantum Inspired Chaotic Salp Swarm Optimization for Dynamic Optimization [4.44483539967295]
我々は量子コンピューティングの原理を統合するQSSOとして知られるSSAの変種について研究する。
カオス演算子は、変化への対応と個々の検索可能性の向上を保証するために量子コンピューティングで使用される。
約束通り、導入されたQCSSOは、DOPのライバルアルゴリズムとして発見される。
論文 参考訳(メタデータ) (2024-01-21T02:59:37Z) - Reinforcement Learning with an Abrupt Model Change [15.101940747707705]
強化学習の問題は、環境やモデルが変化するところにあると考えられる。
エージェントがこのような問題に適応して最適な長期割引報酬を実現するアルゴリズムが提案されている。
アルゴリズムはモデルフリーであり、環境と相互作用することで最適なポリシーを学習する。
論文 参考訳(メタデータ) (2023-04-22T18:16:01Z) - Tree-Based Adaptive Model Learning [62.997667081978825]
我々はKearns-Vazirani学習アルゴリズムを拡張し、時間とともに変化するシステムを扱う。
本稿では,学習前の動作を再利用し,更新し,LearnerLibライブラリに実装し,大規模な実例で評価する学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-08-31T21:24:22Z) - Tree ensemble kernels for Bayesian optimization with known constraints
over mixed-feature spaces [54.58348769621782]
木アンサンブルはアルゴリズムチューニングやニューラルアーキテクチャ検索といったブラックボックス最適化タスクに適している。
ブラックボックス最適化にツリーアンサンブルを使うことの2つのよく知られた課題は、探索のためのモデル不確実性を効果的に定量化し、また、 (ii) ピースワイドな定値取得関数を最適化することである。
我々のフレームワークは、連続/離散的機能に対する非拘束ブラックボックス最適化のための最先端の手法と同様に、混合変数の特徴空間と既知の入力制約を組み合わせた問題の競合する手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-02T16:59:37Z) - Robustification of Online Graph Exploration Methods [59.50307752165016]
我々は、古典的で有名なオンライングラフ探索問題の学習強化版について研究する。
本稿では,予測をよく知られたNearest Neighbor(NN)アルゴリズムに自然に統合するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-10T10:02:31Z) - Preconditioned Plug-and-Play ADMM with Locally Adjustable Denoiser for
Image Restoration [54.23646128082018]
非定常雑音分散のパラメータ化が可能なデノイザを使用するために、プラグアンドプレイの最適化の概念を拡張した。
画素調整可能なデノイザは,適切なプレコンディショニング戦略とともに,いくつかのアプリケーションに対して,プラグアンドプレイADMMアプローチをさらに改善できることを示す。
論文 参考訳(メタデータ) (2021-10-01T15:46:35Z) - On the Optimality of Batch Policy Optimization Algorithms [106.89498352537682]
バッチポリシー最適化は、環境と対話する前に既存のデータをポリシー構築に活用することを検討する。
信頼調整インデックスアルゴリズムは楽観的,悲観的,中立的いずれであってもミニマックス最適であることを示す。
最適値予測の本来の難易度を考慮した新しい重み付き最小値基準を提案する。
論文 参考訳(メタデータ) (2021-04-06T05:23:20Z) - Double Coverage with Machine-Learned Advice [100.23487145400833]
オンラインの基本的な$k$-serverの問題を学習強化環境で研究する。
我々のアルゴリズムは任意の k に対してほぼ最適の一貫性-破壊性トレードオフを達成することを示す。
論文 参考訳(メタデータ) (2021-03-02T11:04:33Z) - Exploiting Local Optimality in Metaheuristic Search [0.0]
本稿では,適応型メモリメタヒューリスティックを用いて,ソリューション履歴の有用な特徴を特定し,活用するための戦略を導入する。
提案手法は指数外挿という構造に基づく新しい適応型メモリを用いる。
論文 参考訳(メタデータ) (2020-10-12T01:51:09Z) - Gaussian Process Policy Optimization [0.0]
本稿では,アクターに批判的かつモデルなしの強化学習アルゴリズムを提案する。
ベイズ的パラメータ空間探索法を用いて環境を解く。
ロボットの移動をシミュレートする環境において、現在のアルゴリズムよりも経験的に優れていることが示されています。
論文 参考訳(メタデータ) (2020-03-02T18:06:27Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。