論文の概要: Guiding Multi-Objective Genetic Programming with Description Length Improves Symbolic Regression Solutions
- arxiv url: http://arxiv.org/abs/2605.22374v1
- Date: Thu, 21 May 2026 12:07:05 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-22 16:35:42.244861
- Title: Guiding Multi-Objective Genetic Programming with Description Length Improves Symbolic Regression Solutions
- Title(参考訳): 記述長による多目的遺伝的プログラミングの誘導による記号回帰解の改善
- Authors: Gabriel Kronberger, Fabricio Olivetti de Franca, Deaglan J. Bartlett, Harry Desmond, Pedro G. Ferreira,
- Abstract要約: 遺伝的プログラミング(GPSR)による象徴的回帰は、過剰適合と構造的肥大に悩まされる可能性がある。
我々は,記述長 (DL) と分数ベイズ係数 (FBF) の基準を,最適化のための原則的,データ効率の良い代替手段として評価した。
- 参考スコア(独自算出の注目度): 0.39146761527401425
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Symbolic regression with genetic programming (GPSR) may suffer from overfitting and structural bloat, especially when noise is present. In this paper we evaluate description length (DL) and fractional Bayes factor (FBF) criteria as principled, data-efficient alternatives to heuristics for selecting compact expressions that generalise well. We implement DL using a Fisher-information-based parameter encoding and compare it to AIC and BIC across multiple datasets, including noisy synthetic benchmarks and real-world regression problems. We study three search/selection strategies: (i) multi-objective search for accuracy and program length followed by DL/FBF selection; (ii) multi-objective search using DL directly as an objective; and (iii) single-objective optimisation with DL/FBF as the fitness. Across datasets we find that DL/FBF post-selection improves test performance compared to AIC/BIC baseline and that BIC in combination with the same function complexity penalty from DL/FBF produces similar results. In contrast, using DL/FBF directly as a fitness function in single-objective GPSR frequently induces premature convergence to overly simple models. We conclude with practical guidance for using DL/FBF as robust model-selection tools in genetic programming workflows.
- Abstract(参考訳): 遺伝的プログラミング(GPSR)による象徴的回帰は、特にノイズが存在する場合、過度に適合し、構造的な肥大に悩まされる。
本稿では、記述長(DL)と分数ベイズ係数(FBF)の基準を、一般化したコンパクトな表現を選択するためのヒューリスティックの原理的、データ効率の良い代替品として評価する。
我々は、フィッシャー情報に基づくパラメータエンコーディングを用いてDLを実装し、ノイズの多い合成ベンチマークや実世界の回帰問題を含む複数のデータセットでAICやBICと比較する。
検索・選択戦略を3つ研究する。
i) 精度とプログラム長の多目的探索とDL/FBF選択
(二)目的語として直接DLを用いた多目的検索、及び
三 DL/FBFを適合度とする単目的最適化。
DL/FBFのポストセレクションにより,AIC/BICベースラインと比較してテスト性能が向上し,DL/FBFと同じ機能複雑性ペナルティと組み合わせることで,同様の結果が得られることがわかった。
対照的に、単目的GPSRの適合関数としてDL/FBFを直接使用すると、過度に単純なモデルへの早めの収束がしばしば引き起こされる。
我々は、遺伝的プログラミングのワークフローにおいて、DL/FBFを堅牢なモデル選択ツールとして使用するための実践的なガイダンスで結論付けた。
関連論文リスト
- ShapeBench: A Scalable Benchmark and Diagnostic Suite for Standardized Evaluation in Aerodynamic Shape Optimization [9.151054983399924]
オープンソースのASOベンチマークであるShapeBenchを紹介した。8つのカテゴリにまたがる103のタスクと複数の最適化機構にまたがる統一APIを備える。
それぞれのShapeBenchタスクは、高速検索のための検証されたサロゲートを含み、体系的な忠実度-ギャップ解析を可能にする。
シェープベンチの結果は、スピアマン平均が0.013$であるような、形状カテゴリーと問題定式化のランク付けにおいて、かなりのばらつきを示すため、単一タスクの結論は問題クラス全体で確実に一般化されない。
古典的な手法はあらゆる形態のカテゴリやタスクに当てはまることは稀であり、より汎用的なアプローチの必要性をさらに強調している。
論文 参考訳(メタデータ) (2026-05-20T06:05:57Z) - Learning Multi-Indicator Weights for Data Selection: A Joint Task-Model Adaptation Framework with Efficient Proxies [50.39041754816285]
本稿では、下流タスクと特定のモデルの両方にデータ選択を併用する多変数重み学習フレームワークを提案する。
提案手法は,GSM8Kのトレーニングサンプルの30%しか使用せず,フルデータセットチューニングに匹敵する性能を実現する。
論文 参考訳(メタデータ) (2026-05-10T17:30:16Z) - Relatron: Automating Relational Machine Learning over Relational Databases [50.94254514286021]
本稿では, RDL と DFS を共有設計空間に統合し, 多様な RDB タスクを対象としたアーキテクチャ中心の検索を行う。
RDLはDFSを一貫して上回り、高いタスク依存性を持つ。(2)タスク全体において単一のアーキテクチャが支配的であり、タスク認識モデル選択の必要性を強調し、精度は選択アーキテクチャの信頼性の低いガイドである。
論文 参考訳(メタデータ) (2026-02-26T02:45:22Z) - Adaptive Split-MMD Training for Small-Sample Cross-Dataset P300 EEG Classification [12.103074826558531]
データセット間のシフトは、大きなソースデータセットで小さなターゲットセットを増やそうとするときに発生する。
適応分割最大値離散化学習(AS-MMD)を紹介する。
AS-MMDは、ターゲット重み付き損失とソース/ターゲットサイズ比の平方根に結びついたウォームアップを組み合わせる。
目標のみのトレーニングやプールトレーニングよりも優れています。
論文 参考訳(メタデータ) (2025-10-24T18:48:21Z) - Aligning Distributionally Robust Optimization with Practical Deep Learning Needs [70.87757502315293]
従来のLearning (DL)メソッドはすべてのサンプルを平等に扱うが、DROと現在のDLプラクティスの間には大きなギャップがある。
本稿では,重み付けグループを扱える改良DRO目標に対する適応アルゴリズムを導入することにより,このギャップを埋めることを目的とする。
論文 参考訳(メタデータ) (2025-08-22T18:17:44Z) - Robust Multi-Objective Controlled Decoding of Large Language Models [14.58153072993207]
本稿では,ロバスト多目的復号法(RMOD)を提案する。
RMODは、報酬重み付けとサンプリングポリシーの間の最大2プレーヤゲームとして頑健な復号問題を定式化する。
我々は,ゲームが最悪の重みを求めるために凸最適化問題に還元されるのに対して,最良の応答ポリシは解析的に計算可能であることを示す。
論文 参考訳(メタデータ) (2025-03-11T18:15:26Z) - UCB-driven Utility Function Search for Multi-objective Reinforcement Learning [51.00436121587591]
マルチオブジェクト強化学習(MORL)エージェントでは、意思決定行動の最適化を行う。
重みベクトル w でパラメトリした線型効用関数の場合に焦点を当てる。
学習過程の異なる段階で最も有望な重みベクトルを効率的に探索する上信頼境界に基づく手法を提案する。
論文 参考訳(メタデータ) (2024-05-01T09:34:42Z) - BOtied: Multi-objective Bayesian optimization with tied multivariate ranks [33.414682601242006]
本稿では,非支配解と結合累積分布関数の極端量子化との自然な関係を示す。
このリンクにより、我々はPareto対応CDFインジケータと関連する取得関数BOtiedを提案する。
種々の合成および実世界の問題に対する実験により,BOtied は最先端MOBO 取得関数より優れていることが示された。
論文 参考訳(メタデータ) (2023-06-01T04:50:06Z) - Partial Least Square Regression via Three-factor SVD-type Manifold
Optimization for EEG Decoding [4.0204191666595595]
双グラスマン多様体 (PLSRbiGr) の最適化による部分最小二乗回帰(PLSR)の解法を提案する。
qlPLSRbiGrは、運動画像(MI)における脳波信号を復号する様々な実験と、定常視覚誘発電位(SSVEP)タスクで検証される。
論文 参考訳(メタデータ) (2022-08-09T11:57:02Z) - Automatic selection of basis-adaptive sparse polynomial chaos expansions
for engineering applications [0.0]
スパースカオス展開のための3つの最新技術に基づく基礎適応的アプローチについて述べる。
我々は,大規模な計算モデルに対して,大域的近似精度の観点から広範なベンチマークを行う。
クロスバリデーションエラーによって導かれる新しい解法と基底適応性選択スキームを導入する。
論文 参考訳(メタデータ) (2020-09-10T12:13:57Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。