論文の概要: RDEx-SOP: Exploitation-Biased Reconstructed Differential Evolution for Fixed-Budget Bound-Constrained Single-Objective Optimization
- arxiv url: http://arxiv.org/abs/2603.27089v1
- Date: Sat, 28 Mar 2026 02:18:38 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-31 23:18:44.777154
- Title: RDEx-SOP: Exploitation-Biased Reconstructed Differential Evolution for Fixed-Budget Bound-Constrained Single-Objective Optimization
- Title(参考訳): RDEx-SOP: Exploitation-Biased Reconstructed Differential Evolution for Fixed-Budget bound-Constrained Single-Objective Optimization
- Authors: Sichen Tao, Yifei Yang, Ruihan Zhao, Kaiyu Wang, Sicheng Liu, Shangce Gao,
- Abstract要約: 本報告では, IEEE CEC 2025数値最適化コンペティションで使用される, 評価バイアス付き成功史差分進化変種RDEx-SOPについて述べる。
RDEx-SOP を U-score フレームワークによる公式 CEC 2025 SOP ベンチマークで評価する(高速化と精度のカテゴリ)。
- 参考スコア(独自算出の注目度): 13.368759036974224
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Bound-constrained single-objective numerical optimisation remains a key benchmark for assessing the robustness and efficiency of evolutionary algorithms. This report documents RDEx-SOP, an exploitation-biased success-history differential evolution variant used in the IEEE CEC 2025 numerical optimisation competition (C06 special session). RDEx-SOP combines success-history parameter adaptation, an exploitation-biased hybrid branch, and lightweight local perturbations to balance fast convergence and final solution quality under a strict evaluation budget. We evaluate RDEx-SOP on the official CEC 2025 SOP benchmark with the U-score framework (Speed and Accuracy categories). Experimental results show that RDEx-SOP achieves strong overall performance and statistically competitive final outcomes across the 29 benchmark functions.
- Abstract(参考訳): 境界制約付き単目的数値最適化は、進化的アルゴリズムの堅牢性と効率を評価するための重要なベンチマークのままである。
本報告では,IEEE CEC 2025数値最適化コンペティション(C06スペシャルセッション)で使用される,評価バイアス付き成功史差分進化変種RDEx-SOPについて報告する。
RDEx-SOPは、成功史パラメータ適応、搾取バイアスハイブリッドブランチ、および厳格な評価予算の下での高速収束と最終ソリューション品質のバランスをとるための軽量な局所摂動を組み合わせたものである。
RDEx-SOP を U-score framework (Speed and Accuracy category) を用いて CEC 2025 SOP の公式ベンチマークで評価した。
実験の結果,RDEx-SOPは29のベンチマーク関数に対して高い総合性能と統計的に競合する最終結果が得られることがわかった。
関連論文リスト
- RDEx-MOP: Indicator-Guided Reconstructed Differential Evolution for Fixed-Budget Multiobjective Optimization [13.368759036974224]
本報告では、IEEE CEC 2025数値最適化コンペティションで使用される再構成された微分進化変種RDEx-MOPについて述べる。
RDEx-MOP を CEC 2025 MOP ベンチマークで評価し,チェックポイントトレースと中央値の U-score フレームワークを用いて評価した。
実験の結果,RDEx-MOPは全比較アルゴリズムの中で最高スコアと最高平均ランクを達成できた。
論文 参考訳(メタデータ) (2026-03-28T02:25:34Z) - RDEx-CSOP: Feasibility-Aware Reconstructed Differential Evolution with Adaptive epsilon-Constraint Ranking [13.368759036974224]
本報告では、IEEE CEC 2025数値最適化コンペティションで使用される制約付き微分進化変種RDEx-CSOPについて述べる。
RDEx-CSOP を U-score フレームワークを用いて CEC 2025 CSOP ベンチマークで評価した。
その結果,RDEx-CSOPは全比較アルゴリズムの中で最高スコアと最高ランクを達成できた。
論文 参考訳(メタデータ) (2026-03-28T02:23:11Z) - Not All Preferences Are Created Equal: Stability-Aware and Gradient-Efficient Alignment for Reasoning Models [52.48582333951919]
ポリシー更新の信号対雑音比を最大化することにより、アライメントの信頼性を高めるために設計された動的フレームワークを提案する。
SAGE(Stability-Aware Gradient Efficiency)は、モデル能力に基づいて候補プールをリフレッシュする粗いきめ細かいカリキュラムメカニズムを統合する。
複数の数学的推論ベンチマークの実験により、SAGEは収束を著しく加速し、静的ベースラインを上回っていることが示された。
論文 参考訳(メタデータ) (2026-02-01T12:56:10Z) - Case-Guided Sequential Assay Planning in Drug Discovery [2.8529443025686487]
Implicit Bayesian Markov Decision Process (IBMDP) はシミュレータフリー設定用に設計されたモデルベースのRLフレームワークである。
IBMDPは、望ましい結果とリソース効率とのバランスをとる安定したポリシーを生成する。
実世界の中枢神経系(CNS)の薬物発見タスクにおいて、IBMDPは確立されたものと比較して、リソース消費を最大92%削減した。
論文 参考訳(メタデータ) (2026-01-21T06:58:01Z) - Robust Differential Evolution via Nonlinear Population Size Reduction and Adaptive Restart: The ARRDE Algorithm [0.010411372746649314]
ARRDE は LSHADE アルゴリズム上に構築され,jSO の鍵機構を組み込んだ非線形人口削減戦略を導入している。
ARRDEは、考慮されたすべてのベンチマークスイートの中で、トップレベルのパフォーマンスを一貫して示す。
論文 参考訳(メタデータ) (2025-11-23T12:50:25Z) - NDCG-Consistent Softmax Approximation with Accelerated Convergence [67.10365329542365]
本稿では,ランキングの指標と直接一致した新たな損失定式化を提案する。
提案したRG損失を高効率な Alternating Least Squares (ALS) 最適化手法と統合する。
実世界のデータセットに対する実証的な評価は、我々のアプローチが同等または上位のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2025-06-11T06:59:17Z) - Tuning for Trustworthiness -- Balancing Performance and Explanation Consistency in Neural Network Optimization [49.567092222782435]
我々は,異なる特徴帰属法間の合意として定義された,XAI整合性という新しい概念を紹介する。
予測性能と説明のバランスをとる多目的最適化フレームワークを構築した。
本研究は、トレードオフゾーンバランス性能損失とXAI整合性による強靭性向上のモデルについて、今後の研究基盤を提供する。
論文 参考訳(メタデータ) (2025-05-12T13:19:14Z) - Overcoming Reward Overoptimization via Adversarial Policy Optimization with Lightweight Uncertainty Estimation [46.61909578101735]
AdvPO(Adversarial Policy Optimization)は、人間からの強化学習における報酬過度最適化の問題に対する新しい解決策である。
本稿では,報酬モデルの最後の層埋め込みにのみ依存して,報酬の不確実性を定量化する軽量な手法を提案する。
論文 参考訳(メタデータ) (2024-03-08T09:20:12Z) - Evolving Pareto-Optimal Actor-Critic Algorithms for Generalizability and
Stability [67.8426046908398]
汎用性と安定性は,実世界における強化学習(RL)エージェントの運用において重要な2つの目的である。
本稿では,アクター・クリティック・ロス関数の自動設計法であるMetaPGを提案する。
論文 参考訳(メタデータ) (2022-04-08T20:46:16Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。