論文の概要: Optimizing LPB Algorithms using Simulated Annealing
- arxiv url: http://arxiv.org/abs/2501.14751v2
- Date: Wed, 29 Jan 2025 12:35:30 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-30 15:52:18.046112
- Title: Optimizing LPB Algorithms using Simulated Annealing
- Title(参考訳): Simulated Annealing を用いたLPBアルゴリズムの最適化
- Authors: Dana Rasul Hamad, Tarik A. Rashid,
- Abstract要約: 本研究は, 改良されたアルゴリズムの作業手順を, 主集団に提供し, 良質な集団と悪質な集団に分割することによって概説する。
その結果、人口が増加し、効率が向上し、PBSAの性能が検証された。
- 参考スコア(独自算出の注目度): 4.939986309170004
- License:
- Abstract: Learner Performance-based Behavior using Simulated Annealing (LPBSA) is an improvement of the Learner Performance-based Behavior (LPB) algorithm. LPBSA, like LPB, has been proven to deal with single and complex problems. Simulated Annealing (SA) has been utilized as a powerful technique to optimize LPB. LPBSA has provided results that outperformed popular algorithms, like the Genetic Algorithm (GA), Particle Swarm Optimization (PSO), and even LPB. This study outlines the improved algorithm's working procedure by providing a main population and dividing it into Good and Bad populations and then applying crossover and mutation operators. When some individuals are born in the crossover stage, they have to go through the mutation process. Between these two steps, we have applied SA using the Metropolis Acceptance Criterion (MAC) to accept only the best and most useful individuals to be used in the next iteration. Finally, the outcomes demonstrate that the population is enhanced, leading to improved efficiency and validating the performance of LPBSA.
- Abstract(参考訳): The Learner Performance-based Behavior using Simulated Annealing (LPBSA) is a improve of the Learner Performance-based Behavior (LPB) algorithm。
LPBSAはLPBと同様、単一および複雑な問題に対処することが証明されている。
シミュレーションアナリング (SA) はLPBを最適化する強力な技術として利用されている。
LPBSAは、GA(Genematic Algorithm)、PSO(Particle Swarm Optimization)、LPB(LPB)など、一般的なアルゴリズムよりも優れている結果を提供している。
本研究は, 改良アルゴリズムの作業手順の概要を, 主な個体群を提供し, 良質個体群と悪質個体群に区分し, 交叉・突然変異演算子を適用して概説した。
一部の個体が交雑期に生まれた場合、突然変異の過程を経なければならない。
これら2つのステップの間に、私たちは、次のイテレーションで使用する最も優れた、最も有用な個人のみを受け入れるために、Metropolis Acceptance Criterion (MAC)を使用してSAを適用しました。
最後に, 人口が増加し, 効率が向上し, LPBSAの性能が検証された。
関連論文リスト
- Provably Faster Algorithms for Bilevel Optimization via Without-Replacement Sampling [96.47086913559289]
勾配に基づくアルゴリズムはバイレベル最適化に広く用いられている。
本研究では,より高速な収束率を実現する非置換サンプリングに基づくアルゴリズムを提案する。
合成および実世界の両方のアプリケーションに対してアルゴリズムを検証する。
論文 参考訳(メタデータ) (2024-11-07T17:05:31Z) - Faster WIND: Accelerating Iterative Best-of-$N$ Distillation for LLM Alignment [81.84950252537618]
本稿では,反復的BONDと自己プレイアライメントの統一的なゲーム理論接続を明らかにする。
WINレート支配(WIN rate Dominance, WIND)という新しいフレームワークを構築し, 正規化利率支配最適化のためのアルゴリズムを多数提案する。
論文 参考訳(メタデータ) (2024-10-28T04:47:39Z) - CLPB: Chaotic Learner Performance Based Behaviour [4.939986309170004]
本稿では,10個のカオスマップをLPB内に埋め込むことにより,単一目的LPBの性能を向上させることを目的とする。
提案アルゴリズムは,処理時間(PT)を削減し,グローバル最適に近づき,最適収束速度で局所最適をバイパスする。
論文 参考訳(メタデータ) (2024-04-25T09:30:51Z) - Poisson Process for Bayesian Optimization [126.51200593377739]
本稿では、Poissonプロセスに基づくランキングベースの代理モデルを提案し、Poisson Process Bayesian Optimization(PoPBO)と呼ばれる効率的なBOフレームワークを提案する。
従来のGP-BO法と比較すると,PoPBOはコストが低く,騒音に対する堅牢性も良好であり,十分な実験により検証できる。
論文 参考訳(メタデータ) (2024-02-05T02:54:50Z) - Parameterized Projected Bellman Operator [64.129598593852]
近似値反復(英: Approximate value iteration, AVI)は、強化学習(RL)のためのアルゴリズムの一群である。
本稿ではベルマン作用素の近似版を学習する新しい代替手法を提案する。
逐次決定問題に対するPBO学習のための最適化問題を定式化する。
論文 参考訳(メタデータ) (2023-12-20T09:33:16Z) - Optimizing with Low Budgets: a Comparison on the Black-box Optimization
Benchmarking Suite and OpenAI Gym [2.511157007295545]
Black-box Optimization (BO)アルゴリズムは機械学習(ML)で人気がある
MLのためのBBOツールと、より古典的なCOCOの比較を行う。
BBOコミュニティのアルゴリズムの中には、MLタスクで驚くほどうまく機能するものもある。
論文 参考訳(メタデータ) (2023-09-29T18:33:10Z) - Provably Efficient UCB-type Algorithms For Learning Predictive State
Representations [55.00359893021461]
逐次決定問題は、予測状態表現(PSR)によってモデル化された低ランク構造が認められる場合、統計的に学習可能である
本稿では,推定モデルと実モデル間の全変動距離を上限とする新しいボーナス項を特徴とする,PSRに対する最初のUCB型アプローチを提案する。
PSRに対する既存のアプローチとは対照的に、UCB型アルゴリズムは計算的トラクタビリティ、最優先の準最適ポリシー、モデルの精度が保証される。
論文 参考訳(メタデータ) (2023-07-01T18:35:21Z) - BiSLS/SPS: Auto-tune Step Sizes for Stable Bi-level Optimization [33.082961718280245]
既存のアルゴリズムは、ハイパーグラディエントを計算する際に近似誤差の影響を受け得る2つの結合学習率を含んでいる。
線形探索(SLS)とポリアクステップサイズ(SPS)という適応的なステップサイズ法を用いて,上層と下層の両方の学習率の計算を行う。
SGDとAdamの両バージョンで利用できる新しいアルゴリズムは、最小限のチューニングで大きな学習率を見つけ、対応するバニラBOアルゴリズムよりも高速に収束させることができる。
論文 参考訳(メタデータ) (2023-05-30T00:37:50Z) - LAB: A Leader-Advocate-Believer Based Optimization Algorithm [9.525324619018983]
この原稿は、リーダ・アドボケート・ビリーバーに基づく最適化アルゴリズム(LAB)と呼ばれる、社会にインスパイアされた新しいメタヒューリスティック手法を紹介している。
提案アルゴリズムは、グループ内の個人が同時に改善し、役割(リーダ、アドボケート、ベリバー)を確立しながら示すAIベースの競争行動に着想を得たものである。
論文 参考訳(メタデータ) (2022-04-23T10:58:58Z) - Adaptive Sampling for Best Policy Identification in Markov Decision
Processes [79.4957965474334]
本稿では,学習者が生成モデルにアクセスできる場合の,割引マルコフ決定(MDP)における最良の政治的識別の問題について検討する。
最先端アルゴリズムの利点を論じ、解説する。
論文 参考訳(メタデータ) (2020-09-28T15:22:24Z) - A new evolutionary algorithm: Learner performance based behavior
algorithm [1.1802674324027231]
本稿では,Learner Performance Based Behavior Algorithm (LPB) と呼ばれる新しい進化的アルゴリズムを提案する。
LPBの基本的なインスピレーションは、大学の様々な部署の高校の大学院生を受け入れる過程に端を発する。
提案アルゴリズムの結果は,DA,GA,PSOと比較される。
論文 参考訳(メタデータ) (2020-09-05T04:17:35Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。