論文の概要: Real-Time Black-Box Optimization for Dynamic Discrete Environments Using Embedded Ising Machines
- arxiv url: http://arxiv.org/abs/2506.16924v1
- Date: Fri, 20 Jun 2025 11:31:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-06-23 19:00:05.426937
- Title: Real-Time Black-Box Optimization for Dynamic Discrete Environments Using Embedded Ising Machines
- Title(参考訳): 埋め込みイジングマシンを用いた動的離散環境のリアルタイムブラックボックス最適化
- Authors: Tomoya Kashimata, Yohei Hamakawa, Masaya Yamasaki, Kosuke Tatsumura,
- Abstract要約: Black-box Optimization (BBO)アルゴリズムとMulti-armed Bandit (MAB)アルゴリズムは、アクションを繰り返し行い、それに対応する即時報酬を事前の知識なしに観察することで最適化を行う。
そこで本研究では,Ising マシンを用いた BBO 手法が,離散値の組み合わせによって表現される最良の動作を見つけるために提案されていることを示す。
移動ユーザを持つ無線通信システムにおいて,提案手法の動的適応性を示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-time systems require the optimization of discrete variables. Black-box optimization (BBO) algorithms and multi-armed bandit (MAB) algorithms perform optimization by repeatedly taking actions and observing the corresponding instant rewards without any prior knowledge. Recently, a BBO method using an Ising machine has been proposed to find the best action that is represented by a combination of discrete values and maximizes the instant reward in static environments. In contrast, dynamic environments, where real-time systems operate, necessitate MAB algorithms that maximize the average reward over multiple trials. However, due to the enormous number of actions resulting from the combinatorial nature of discrete optimization, conventional MAB algorithms cannot effectively optimize dynamic, discrete environments. Here, we show a heuristic MAB method for dynamic, discrete environments by extending the BBO method, in which an Ising machine effectively explores the actions while considering interactions between variables and changes in dynamic environments. We demonstrate the dynamic adaptability of the proposed method in a wireless communication system with moving users.
- Abstract(参考訳): 多くのリアルタイムシステムは離散変数の最適化を必要とする。
Black-box Optimization (BBO)アルゴリズムとMulti-armed Bandit (MAB)アルゴリズムは、アクションを繰り返し行い、それに対応する即時報酬を事前の知識なしに観察することで最適化を行う。
近年,Ising マシンを用いた BBO 手法が提案され,個別の値の組み合わせによって表現される最良のアクションを見つけ,静的環境における即時報酬を最大化する手法が提案されている。
対照的に、リアルタイムシステムが動作する動的環境は、複数の試行に対して平均報酬を最大化するMABアルゴリズムを必要とする。
しかし、離散最適化の組合せの性質から生じる膨大な数の作用により、従来のMABアルゴリズムは動的で離散的な環境を効果的に最適化することはできない。
本稿では,BBO法を拡張した動的離散環境に対するヒューリスティックMAB法について述べる。
移動ユーザを持つ無線通信システムにおいて,提案手法の動的適応性を示す。
関連論文リスト
- A Perturbation and Speciation-Based Algorithm for Dynamic Optimization Uninformed of Change [1.4425878137951238]
Perturbation and Speciation-Based Particle Swarm Optimization (PSPSO) は、非インフォームド動的最適化のための頑健なアルゴリズムである。
PSPSOは、投射に基づくニチング、不活性化、DOPを処理するための新しいランダム摂動機構を組み合わせたものである。
PSPSOは、一般化された移動ピークベンチマークにおいて、高次元性または高周波数変化を持つ関数の強度を示す。
論文 参考訳(メタデータ) (2025-05-16T18:53:37Z) - Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。
EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。
得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文 参考訳(メタデータ) (2023-12-10T15:22:30Z) - Polynomial-Model-Based Optimization for Blackbox Objectives [0.0]
ブラックボックス最適化は、事前定義された目的関数が最小化されるようなシステムに対して最適なパラメータを求める。
PMBOは目的関数にサロゲートを合わせることで最小値を求める新しいブラックボックスである。
PMBOは、与えられた人工的解析関数のセットに対して、他の最先端のアルゴリズムとベンチマークされる。
論文 参考訳(メタデータ) (2023-09-01T14:11:03Z) - Vector Autoregressive Evolution for Dynamic Multi-Objective Optimisation [7.5104598146227]
動的多目的最適化(DMO)は、様々な環境において複数の目的を持つ最適化問題を扱う。
本稿では,DMOの環境変化に対応するために,ベクトル自己回帰(VAR)と環境対応ハイパーミューテーションからなるベクトル自己回帰進化(VARE)を提案する。
論文 参考訳(メタデータ) (2023-05-22T06:24:25Z) - Tree ensemble kernels for Bayesian optimization with known constraints
over mixed-feature spaces [54.58348769621782]
木アンサンブルはアルゴリズムチューニングやニューラルアーキテクチャ検索といったブラックボックス最適化タスクに適している。
ブラックボックス最適化にツリーアンサンブルを使うことの2つのよく知られた課題は、探索のためのモデル不確実性を効果的に定量化し、また、 (ii) ピースワイドな定値取得関数を最適化することである。
我々のフレームワークは、連続/離散的機能に対する非拘束ブラックボックス最適化のための最先端の手法と同様に、混合変数の特徴空間と既知の入力制約を組み合わせた問題の競合する手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-02T16:59:37Z) - Optimization on manifolds: A symplectic approach [127.54402681305629]
本稿では、最適化問題を解くための一般的な枠組みとして、ディラックの制約付きハミルトン系理論の散逸拡張を提案する。
我々の(加速された)アルゴリズムのクラスは単純で効率的なだけでなく、幅広い文脈にも適用できる。
論文 参考訳(メタデータ) (2021-07-23T13:43:34Z) - Robust Value Iteration for Continuous Control Tasks [99.00362538261972]
シミュレーションから物理システムへ制御ポリシを転送する場合、そのポリシは、動作の変動に対して堅牢でなければならない。
本稿では、動的プログラミングを用いて、コンパクトな状態領域上での最適値関数を計算するRobust Fitted Value Iterationを提案する。
より深い強化学習アルゴリズムや非ロバストなアルゴリズムと比較して、ロバストな値の方が頑健であることを示す。
論文 参考訳(メタデータ) (2021-05-25T19:48:35Z) - Value Iteration in Continuous Actions, States and Time [99.00362538261972]
連続状態と動作に対する連続的適合値反復(cFVI)アルゴリズムを提案する。
非線形制御アフィンダイナミクスに対して最適なポリシを導出することができる。
物理システムのビデオは、urlhttps://sites.google.com/view/value-iteration.comで入手できる。
論文 参考訳(メタデータ) (2021-05-10T21:40:56Z) - Adaptive Local Bayesian Optimization Over Multiple Discrete Variables [9.860437640748113]
本稿では,チームKAIST OSIのアプローチをステップワイズで記述し,ベースラインアルゴリズムを最大20.39%向上させる。
同様の方法では,ベイジアンとマルチアームドバンディット(mab)の手法を組み合わせ,変数型を考慮した値選択を行う。
経験的評価により,提案手法は既存の手法を異なるタスクにまたがる性能を示す。
論文 参考訳(メタデータ) (2020-12-07T07:51:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。