論文の概要: A Reinforcement Learning Inspired Latent Yield Based Adaptive Algorithm Switching Mechanism
- arxiv url: http://arxiv.org/abs/2605.24436v1
- Date: Sat, 23 May 2026 07:12:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-26 19:50:18.057209
- Title: A Reinforcement Learning Inspired Latent Yield Based Adaptive Algorithm Switching Mechanism
- Title(参考訳): 遅延収率に基づく適応型アルゴリズムスイッチング機構による強化学習
- Authors: Jayprakash S. Nair, Jimson Mathew, Shivashankar B. Nair,
- Abstract要約: 本稿では,複数の問題インスタンスにまたがってアルゴリズムの性能を集約する,計算効率のよい手法を提案する。
強化学習(Reinforcement Learning, RL)固有の特徴にインスパイアされたこの技術は、報酬と罰則を潜在収率にカプセル化し、それによって搾取と探索が引き起こされる。
分類アルゴリズムとロボット障害物回避タスクの実験的評価は、アプローチの有効性と有効性を示している。
- 参考スコア(独自算出の注目度): 4.901543643055091
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Selecting the most suitable algorithm for a given problem instance remains a challenging task, particularly in online or dynamic environments where problem characteristics evolve over time. Relying solely on instantaneous performance metrics can result in a reactive and unstable behaviour, often leading to suboptimal algorithm switching. This paper introduces a computationally efficient approach for aggregating an algorithm's performance across multiple problem instances that is fairly immune to erratic variations in instance features. Inspired by features inherent to Reinforcement Learning (RL), this technique encapsulates rewards and penalties into a latent yield that, in turn, triggers exploitation and exploration, consequently resulting in adaptive algorithm switching. The proposed technique employs island models, inspired by Genetic Algorithms, to facilitate parallel exploration and performance exchanges among algorithm populations inhabiting local repertoires. Experimental evaluations on sorting algorithms and robotic obstacle avoidance tasks demonstrate the feasibility and effectiveness of the approach, highlighting its potential in domains where adaptive algorithm selection is critical.
- Abstract(参考訳): 与えられた問題インスタンスに対して最も適切なアルゴリズムを選択することは、特に問題特性が時間とともに進化するオンライン環境や動的環境では、依然として難しい課題である。
即時のパフォーマンス測定だけに頼れば、リアクティブで不安定な動作になり、しばしばアルゴリズムの準最適化につながる。
本稿では,複数の問題インスタンスにまたがるアルゴリズムの性能を計算的に効率的に集約する手法を提案する。
強化学習(RL)固有の特徴にインスパイアされたこの技術は、報酬と罰則を潜在収率にカプセル化することで、搾取と探索をトリガーし、適応アルゴリズムの切り替えをもたらす。
提案手法は, 遺伝的アルゴリズムにインスパイアされた島モデルを用いて, 局所レパートリーに生息するアルゴリズム集団間の並列探索と性能交換を容易にする。
分類アルゴリズムとロボット障害物回避タスクの実験的評価は、適応アルゴリズムの選択が重要となる領域におけるその可能性を強調し、アプローチの実現可能性と有効性を示す。
関連論文リスト
- Landscape-aware Automated Algorithm Design: An Efficient Framework for Real-world Optimization [32.203665659052845]
大規模言語モデル(LLM)は、アルゴリズムの自動設計において新たなフロンティアを開放した。
LLMは探索過程を導くために対象問題の広範な評価を必要とする。
本研究では,アルゴリズム発見を低コスト評価から切り離す,革新的で効率的なフレームワークを提案する。
論文 参考訳(メタデータ) (2026-02-04T13:18:45Z) - Deep Reinforcement Learning for Online Optimal Execution Strategies [49.1574468325115]
本稿では,動的な金融市場における非マルコフ的最適実行戦略の学習に挑戦する。
我々は,Deep Deterministic Policy Gradient(DDPG)に基づく新しいアクター批判アルゴリズムを提案する。
提案アルゴリズムは最適実行戦略の近似に成功していることを示す。
論文 参考訳(メタデータ) (2024-10-17T12:38:08Z) - Switchable Decision: Dynamic Neural Generation Networks [98.61113699324429]
本稿では,各データインスタンスのリソースを動的に割り当てることで,推論を高速化するスイッチブルな決定を提案する。
提案手法は, 同一の精度を維持しながら, 推論時のコスト低減に有効である。
論文 参考訳(メタデータ) (2024-05-07T17:44:54Z) - Deep Reinforcement Learning for Dynamic Algorithm Selection: A
Proof-of-Principle Study on Differential Evolution [27.607740475924448]
本稿では,この課題を実現するための強化学習に基づく動的アルゴリズム選択フレームワークを提案する。
我々は、最適な動作を推測し、アルゴリズムの選択を確実にするために、洗練されたディープニューラルネットワークモデルを用いる。
基礎研究として、この枠組みを微分進化アルゴリズム群に適用する。
論文 参考訳(メタデータ) (2024-03-04T15:40:28Z) - Improved Algorithms for Neural Active Learning [74.89097665112621]
非パラメトリックストリーミング設定のためのニューラルネットワーク(NN)ベースの能動学習アルゴリズムの理論的および経験的性能を改善する。
本研究では,SOTA(State-of-the-art (State-the-art)) 関連研究で使用されるものよりも,アクティブラーニングに適する人口減少を最小化することにより,2つの後悔の指標を導入する。
論文 参考訳(メタデータ) (2022-10-02T05:03:38Z) - Stabilizing Q-learning with Linear Architectures for Provably Efficient
Learning [53.17258888552998]
本研究では,線形関数近似を用いた基本的な$Q$-learningプロトコルの探索変種を提案する。
このアルゴリズムの性能は,新しい近似誤差というより寛容な概念の下で,非常に優雅に低下することを示す。
論文 参考訳(メタデータ) (2022-06-01T23:26:51Z) - Evolving Reinforcement Learning Algorithms [186.62294652057062]
メタラーニング強化学習アルゴリズムの手法を提案する。
学習アルゴリズムはドメインに依存しないため、トレーニング中に見えない新しい環境に一般化することができる。
従来の制御タスク、gridworld型タスク、atariゲームよりも優れた一般化性能を得る2つの学習アルゴリズムに注目した。
論文 参考訳(メタデータ) (2021-01-08T18:55:07Z) - Discrete Action On-Policy Learning with Action-Value Critic [72.20609919995086]
離散的な行動空間における強化学習(RL)は、実世界の応用では至るところで行われているが、その複雑さは行動空間次元とともに指数関数的に増大する。
我々は,行動値関数を推定し,相関行動に適用し,これらの評価値を組み合わせて勾配推定の分散を制御する。
これらの取り組みにより、分散制御技術に頼って、関連するRLアルゴリズムを実証的に上回る、新たな離散的なRLアルゴリズムが実現される。
論文 参考訳(メタデータ) (2020-02-10T04:23:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。