論文の概要: Zobrist Hash-based Duplicate Detection in Symbolic Regression
- arxiv url: http://arxiv.org/abs/2508.13859v1
- Date: Tue, 19 Aug 2025 14:18:16 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-08-20 15:36:31.949255
- Title: Zobrist Hash-based Duplicate Detection in Symbolic Regression
- Title(参考訳): シンボリック回帰におけるZobrist Hashによる重複検出
- Authors: Bogdan Burlacu,
- Abstract要約: 遺伝的プログラミング(GP)は、自然選択のメカニズムを通じて数学的表現の集団を進化させる進化的探索法である。
探索空間の多くの点がアルゴリズムによって何度も再訪・再評価され、時間の無駄な計算作業に繋がることを示す。
抽象ボードゲームでよく使われるハッシュの一種であるZobristハッシュに基づくキャッシュ機構を導入する。
- 参考スコア(独自算出の注目度): 0.5439020425819
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Symbolic regression encompasses a family of search algorithms that aim to discover the best fitting function for a set of data without requiring an a priori specification of the model structure. The most successful and commonly used technique for symbolic regression is Genetic Programming (GP), an evolutionary search method that evolves a population of mathematical expressions through the mechanism of natural selection. In this work we analyze the efficiency of the evolutionary search in GP and show that many points in the search space are re-visited and re-evaluated multiple times by the algorithm, leading to wasted computational effort. We address this issue by introducing a caching mechanism based on the Zobrist hash, a type of hashing frequently used in abstract board games for the efficient construction and subsequent update of transposition tables. We implement our caching approach using the open-source framework Operon and demonstrate its performance on a selection of real-world regression problems, where we observe up to 34\% speedups without any detrimental effects on search quality. The hashing approach represents a straightforward way to improve runtime performance while also offering some interesting possibilities for adjusting search strategy based on cached information.
- Abstract(参考訳): シンボリック回帰は、モデル構造の事前仕様を必要とせず、一連のデータに対して最適な適合関数を発見することを目的とした探索アルゴリズムのファミリーを含んでいる。
最も成功しよく使われている記号回帰法は遺伝的プログラミング(GP)であり、自然選択のメカニズムを通じて数学的表現の集団を進化させる進化的探索法である。
本研究では,GPにおける進化的探索の効率を解析し,探索空間の多くの点がアルゴリズムによって何度も再訪・再評価され,時間の無駄な計算作業に繋がることを示す。
本稿では,Zobristハッシュをベースとしたキャッシュ機構を導入することでこの問題に対処する。
我々は,オープンソースのフレームワークであるOperonを用いてキャッシュ方式を実装し,実世界の回帰問題の選択においてその性能を実証する。
ハッシュアプローチは、ランタイムパフォーマンスを改善するための簡単な方法であり、キャッシュされた情報に基づいて検索戦略を調整するための興味深い可能性も提供する。
関連論文リスト
- Improving Genetic Programming for Symbolic Regression with Equality Graphs [0.0]
等式グラフを利用して、式とその等価な形式を格納する。
サブツリー演算子を適応させて、表現の再検討の機会を減らします。
提案手法は,PySRやOperonと競合する単純なGPアルゴリズムの性能を向上させる。
論文 参考訳(メタデータ) (2025-01-29T18:49:34Z) - The Inefficiency of Genetic Programming for Symbolic Regression -- Extended Version [0.0]
我々は,遺伝的プログラミングの探索挙動を,実用上は関係するが限定的な状況下での象徴的回帰のために分析する。
これにより、最良の表現を見つける成功確率を定量化できる。
遺伝的プログラミングの探索効率を意味的一意表現の空間におけるランダム探索と比較する。
論文 参考訳(メタデータ) (2024-04-26T09:49:32Z) - Unified Functional Hashing in Automatic Machine Learning [58.77232199682271]
高速に統一された関数型ハッシュを用いることで,大きな効率向上が得られることを示す。
私たちのハッシュは"機能的"であり、表現やコードが異なる場合でも同等の候補を識別します。
ニューラルアーキテクチャ検索やアルゴリズム発見など、複数のAutoMLドメインで劇的な改善がなされている。
論文 参考訳(メタデータ) (2023-02-10T18:50:37Z) - Efficient Non-Parametric Optimizer Search for Diverse Tasks [93.64739408827604]
興味のあるタスクを直接検索できる,スケーラブルで汎用的なフレームワークを初めて提示する。
基礎となる数学表現の自然木構造に着想を得て、空間を超木に再配置する。
我々は,モンテカルロ法を木探索に適用し,レジェクションサンプリングと等価形状検出を備える。
論文 参考訳(メタデータ) (2022-09-27T17:51:31Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Improving Passage Retrieval with Zero-Shot Question Generation [109.11542468380331]
オープンな質問応答における経路検索を改善するための,シンプルで効果的な再ランク付け手法を提案する。
再ランカは、学習済み言語モデルを用いて、検索されたパスに条件付けられた入力質問の確率を算出するゼロショット質問生成モデルを用いて、検索されたパスを再スコアする。
論文 参考訳(メタデータ) (2022-04-15T14:51:41Z) - Symbolic Regression by Exhaustive Search: Reducing the Search Space
Using Syntactical Constraints and Efficient Semantic Structure Deduplication [2.055204980188575]
シンボリック回帰は、モデル構造に関する事前の知識が得られない産業シナリオにおいて、強力なシステム識別技術である。
この章では、これらの問題に対処するために特別に設計された決定論的シンボリック回帰アルゴリズムを紹介します。
全ての可能なモデルの有限列挙は、構造的制約と意味論的に等価な解を検出するキャッシング機構によって保証される。
論文 参考訳(メタデータ) (2021-09-28T17:47:51Z) - Local policy search with Bayesian optimization [73.0364959221845]
強化学習は、環境との相互作用によって最適な政策を見つけることを目的としている。
局所探索のための政策勾配は、しばしばランダムな摂動から得られる。
目的関数の確率モデルとその勾配を用いたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2021-06-22T16:07:02Z) - A Genetic Algorithm for Obtaining Memory Constrained Near-Perfect
Hashing [0.0]
本稿では,検索時の比較回数の最小化と,総コレクションサイズを最小化することに焦点を当てたハッシュテーブルに基づくアプローチを提案する。
論文は、ほぼ完全なハッシュはバイナリ検索よりも高速であるが、完全なハッシュよりも少ないメモリを使用することを示した。
論文 参考訳(メタデータ) (2020-07-16T12:57:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。