論文の概要: Benchmarking Stopping Criteria for Evolutionary Multi-objective Optimization
- arxiv url: http://arxiv.org/abs/2604.25458v1
- Date: Tue, 28 Apr 2026 10:05:34 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-29 16:49:17.812294
- Title: Benchmarking Stopping Criteria for Evolutionary Multi-objective Optimization
- Title(参考訳): 進化的多目的最適化のためのベンチマーク停止基準
- Authors: Kenji Kitamura, Ryoji Tanabe,
- Abstract要約: 停止基準は、停滞する人口の関数評価を無駄にしないように、進化的アルゴリズムをいつ停止するかを決定する。
近年,進化的多目的最適化の新しい停止基準はめったに開発されていない。
本稿では,(i)EMOの基準の停止と,(ii)ファイルベースのベンチマーク手法を提案する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Stopping criteria automatically determine when to stop an evolutionary algorithm, so as not to waste function evaluations on a stagnant population. Although stopping criteria play an important role in real-world applications, they have attracted little attention in the evolutionary multi-objective optimization (EMO) community. In fact, new stopping criteria for EMO have been rarely developed in recent years. One reason for the stagnation in developing stopping criteria for EMO is a lack of effective benchmarking methodologies. To address this issue, this paper proposes (i) a performance measure of stopping criteria for EMO and (ii) a file-based benchmarking approach. This paper also proposes (iii) a data representation method that effectively stores population states in text files. (i) The proposed measure represents the performance of stopping criteria as a single scalar value, making comparison easy. (ii) The proposed file-based approach not only simplifies the benchmarking process but also facilitates reproducibility. (iii) The proposed data representation method addresses the issue of file size in (ii). We demonstrate the effectiveness of our three contributions (i)--(iii) by benchmarking five representative stopping criteria for EMO.
- Abstract(参考訳): 停止基準は、停滞する人口の関数評価を無駄にしないように、いつ進化アルゴリズムを止めるかを自動的に決定する。
実世界の応用において、基準の停止は重要な役割を果たすが、進化的多目的最適化(EMO)コミュニティではほとんど注目されていない。
実際、近年EMOの新しい停止基準はめったに開発されていない。
EMOの停止基準の開発が停滞している理由の1つは、効果的なベンチマーク手法の欠如である。
この問題に対処するために,本稿は提案する。
一 EMO 及び EMO の基準を定める性能指標
(ii) ファイルベースのベンチマーク手法。
本稿も提案する。
三 テキストファイル中の人口状態を効果的に記憶するデータ表現方法。
i) 提案尺度は, 基準を1つのスカラー値として表し, 比較し易くする。
(ii) 提案したファイルベースのアプローチは、ベンチマークプロセスを単純化するだけでなく、再現性も促進する。
三 ファイルサイズの問題に対処するデータ表現法
(II)。
3つのコントリビューションの有効性を実証する。
(i)--
(iii) EMOの5つの代表的な停止基準をベンチマークすることで。
関連論文リスト
- PRM-as-a-Judge: A Dense Evaluation Paradigm for Fine-Grained Robotic Auditing [45.2131622534282]
PRM-as-a-Judgeはトラジェクティブビデオから直接ポリシー実行を監査する高密度評価パラダイムである。
このパラダイムの中心はOPDメトリックシステムであり、タスク対応の進捗電位によって実行品質を明示的に定式化する。
マイクロスケールプログレス判別のための診断ベンチマークであるRoboPulseを用いて,マイクロレゾリューション特性を実証的に検証した。
論文 参考訳(メタデータ) (2026-03-23T07:48:42Z) - Towards Anytime-Valid Statistical Watermarking [63.02116925616554]
我々は、任意の時間価推論で最適なサンプリングを統一する、最初のe-value-based watermarking frameworkであるAnchored E-Watermarkingを開発した。
本フレームワークはサンプル効率を大幅に向上させ,最先端のベースラインに対して,検出に必要な平均トークン予算を13~15%削減する。
論文 参考訳(メタデータ) (2026-02-19T18:32:26Z) - CE-RM: A Pointwise Generative Reward Model Optimized via Two-Stage Rollout and Unified Criteria [48.70940362676624]
専用の2段階ロールアウト法を用いて学習したポイントワイズ生成報酬モデルCE-RM-4Bを提案する。
オープンソースの選好データセットから算出した約5.7Kの高品質データを用いて、CE-RM-4Bは様々な報奨モデルベンチマークにおいて優れた性能を実現する。
論文 参考訳(メタデータ) (2026-01-28T07:46:13Z) - On the Limits of Test-Time Compute: Sequential Reward Filtering for Better Inference [71.09125259964684]
テスト時計算(TTC)は、大規模言語モデル(LLM)の拡張のパラダイムとして、ますます顕著になっている。
本稿では,高次世代のみを文脈に選択的に組み込む単純な手順である報酬フィルタシーケンシャル推論について検討する。
理論的には、報酬フィルタによる逐次推論は標準TTCパラダイムよりも厳密な保証が得られることを示す。
論文 参考訳(メタデータ) (2025-12-04T08:21:33Z) - Criteria-Based LLM Relevance Judgments [5.478764356647438]
大規模言語モデル(LLM)は、プロンプトを通じて関連ラベルを直接生成することで、スケーラブルなソリューションを提供する。
LLMに基づく関連判断のための多基準フレームワークを提案し、関連性の概念を複数の基準に分解する。
以上の結果から,マルチクオリトリア判定はシステムランキング・リーダーボードの性能を向上させることが示唆された。
論文 参考訳(メタデータ) (2025-07-13T04:21:21Z) - A New Approach for Multicriteria Assessment in the Ranking of Alternatives Using Cardinal and Ordinal Data [0.0]
2つの仮想ギャップ解析(VGA)モデルを組み合わせた新しいMCA手法を提案する。
線形プログラミングに根ざしたVGAフレームワークは、MCA方法論において重要である。
論文 参考訳(メタデータ) (2025-07-10T04:00:48Z) - A Principled Approach to Randomized Selection under Uncertainty: Applications to Peer Review and Grant Funding [61.86327960322782]
本稿では,各項目の品質の間隔推定に基づくランダム化意思決定の枠組みを提案する。
最適化に基づく最適化手法であるMERITを導入する。
MERITが既存のアプローチで保証されていない望ましい公理特性を満たすことを証明している。
論文 参考訳(メタデータ) (2025-06-23T19:59:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。