論文の概要: Thinking Outside the Template with Modular GP-GOMEA
- arxiv url: http://arxiv.org/abs/2505.01262v1
- Date: Fri, 02 May 2025 13:29:55 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-05 17:21:20.039141
- Title: Thinking Outside the Template with Modular GP-GOMEA
- Title(参考訳): モジュールGP-GOMEAでテンプレートの外を考える
- Authors: Joe Harrison, Peter A. N. Bosman, Tanja Alderliesten,
- Abstract要約: 本稿では,GP-GOMEAのモジュラー表現を用いて,複数の木を同時に進化させ,(機能的な)部分表現として使用できることを示す。
提案手法は一般に単音節のGP-GOMEAより優れており,モジュール部分表現を含まないGP-GOMEAよりも高速に,モジュール部分表現を用いた合成データセットの基底構造表現を明らかにすることができる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: The goal in Symbolic Regression (SR) is to discover expressions that accurately map input to output data. Because often the intent is to understand these expressions, there is a trade-off between accuracy and the interpretability of expressions. GP-GOMEA excels at producing small SR expressions (increasing the potential for interpretability) with high accuracy, but requires a fixed tree template, which limits the types of expressions that can be evolved. This paper presents a modular representation for GP-GOMEA that allows multiple trees to be evolved simultaneously that can be used as (functional) subexpressions. While each tree individually is constrained to a (small) fixed tree template, the final expression, if expanded, can exhibit a much larger structure. Furthermore, the use of subexpressions decomposes the original regression problem and opens the possibility for enhanced interpretability through the piece-wise understanding of small subexpressions. We compare the performance of GP-GOMEA with and without modular templates on a variety of datasets. We find that our proposed approach generally outperforms single-template GP-GOMEA and can moreover uncover ground-truth expressions underlying synthetic datasets with modular subexpressions at a faster rate than GP-GOMEA without modular subexpressions.
- Abstract(参考訳): シンボリック回帰(SR)の目標は、入力を出力データに正確にマッピングする式を見つけることである。
これらの表現を理解する意図がしばしばあるので、精度と表現の解釈可能性の間にはトレードオフがある。
GP-GOMEAは、小さなSR式(解釈可能性を高める)を高い精度で生成するが、進化可能な式の種類を制限する固定されたツリーテンプレートを必要とする。
本稿では,GP-GOMEAのモジュラー表現を用いて,複数の木を同時に進化させ,(機能的な)部分表現として使用できることを示す。
各木は(小さい)固定木テンプレートに個別に制約されるが、拡張された場合、最終的な表現はより大きな構造を示すことができる。
さらに、部分表現の使用は元の回帰問題を分解し、小さな部分表現の断片的理解を通じて解釈可能性を高める可能性を開放する。
GP-GOMEAの性能と,各種データセットのモジュールテンプレートの有無を比較した。
提案手法は一般に単音節のGP-GOMEAより優れており,モジュール部分表現を含まないGP-GOMEAよりも高速に,モジュール部分表現を用いた合成データセットの基底構造表現を明らかにすることができる。
関連論文リスト
- Improving Genetic Programming for Symbolic Regression with Equality Graphs [0.0]
等式グラフを利用して、式とその等価な形式を格納する。
サブツリー演算子を適応させて、表現の再検討の機会を減らします。
提案手法は,PySRやOperonと競合する単純なGPアルゴリズムの性能を向上させる。
論文 参考訳(メタデータ) (2025-01-29T18:49:34Z) - Improving the efficiency of GP-GOMEA for higher-arity operators [0.0]
遺伝的プログラミング(GP)は、本質的に解釈可能な表現を進化させる方法を提供する。
GP-GOMEA (GP-GOMEA) はGPの1形態であり、サイズが制限されていないが正確な表現の進化に特に有効であることが見出され、解釈可能性の向上に寄与している。
本稿では,GP-GOMEAの2つの機能拡張について提案する。
論文 参考訳(メタデータ) (2024-02-15T10:20:40Z) - Structure-Unified M-Tree Coding Solver for MathWord Problem [57.825176412485504]
従来,数式表現の2次木構造を考慮に入れたモデルでは,性能が向上した。
本稿では、出力構造を統一するために、任意のM枝(M-tree)を持つ木を適用した構造統一M-Tree符号化(S-UMCr)を提案する。
広く使われているMAWPSとMath23Kデータセットの実験結果は、SUMC-rが複数の最先端モデルを上回るだけでなく、低リソース条件下でもはるかに優れた性能を発揮することを示した。
論文 参考訳(メタデータ) (2022-10-22T12:20:36Z) - GraphQ IR: Unifying Semantic Parsing of Graph Query Language with
Intermediate Representation [91.27083732371453]
本稿では,グラフクエリ言語,すなわちGraphQ IRに対する統合中間表現(IR)を提案する。
セマンティックギャップをブリッジするIRの自然言語のような表現と、グラフ構造を維持するための正式に定義された構文によって、ニューラルネットワークによるセマンティックパーシングは、ユーザクエリをより効果的にGraphQ IRに変換することができる。
我々のアプローチは、KQA Pro、Overnight、MetaQAにおける最先端のパフォーマンスを一貫して達成できます。
論文 参考訳(メタデータ) (2022-05-24T13:59:53Z) - Entailment Tree Explanations via Iterative Retrieval-Generation Reasoner [56.08919422452905]
我々はIRGR(Iterative Retrieval-Generation Reasoner)と呼ばれるアーキテクチャを提案する。
本モデルでは,テキストの前提からステップバイステップの説明を体系的に生成することにより,与えられた仮説を説明することができる。
前提条件の検索と細分化木の生成に関する既存のベンチマークを上回り、全体の正しさはおよそ300%向上した。
論文 参考訳(メタデータ) (2022-05-18T21:52:11Z) - METGEN: A Module-Based Entailment Tree Generation Framework for Answer
Explanation [59.33241627273023]
複数のモジュールと推論コントローラを備えたモジュールベースのEntailment Tree GENフレームワークMETGENを提案する。
質問に対して、METGENは、別々のモジュールで単一ステップのエンタテインメントを実行し、コントローラで推論フローを選択することで、エンタテインメントツリーを反復的に生成することができる。
実験の結果,METGENは従来の最先端モデルよりも9%のパラメータで優れていた。
論文 参考訳(メタデータ) (2022-05-05T12:06:02Z) - Fast Interpretable Greedy-Tree Sums [8.268938983372452]
Fast Interpretable Greedy-Tree Sums (FIGS) は、CARTアルゴリズムを一般化し、要約において柔軟な数の木を成長させる。
G-FIGSは、ドメイン知識を反映し、感度や解釈性を犠牲にすることなく(CARTよりも20%も向上した)特異性を享受するCDIを導出する。
Bagging-FIGSは、現実世界のデータセット上でランダムなフォレストやXGBoostと競合するパフォーマンスを享受している。
論文 参考訳(メタデータ) (2022-01-28T04:50:37Z) - Learning to Synthesize Data for Semantic Parsing [57.190817162674875]
本稿では,プログラムの構成をモデル化し,プログラムを発話にマップする生成モデルを提案する。
PCFGと事前学習されたBARTの簡易性により,既存のデータから効率的に生成モデルを学習することができる。
GeoQuery と Spider の標準ベンチマークで解析する text-to-Query の in-domain と out-of-domain の両方で、この手法を評価します。
論文 参考訳(メタデータ) (2021-04-12T21:24:02Z) - Closed-Form Expressions for Global and Local Interpretation of Tsetlin
Machines with Applications to Explaining High-Dimensional Data [7.05622249909585]
TMモデルが特定の予測を行う理由(局所的解釈可能性)を理解するためのクローズドフォーム表現を提案する。
また、連続した特徴に対する特徴値範囲の重要性を測定するための式も導入する。
分類と回帰については,XGBoost, Explainable Boosting Machines, Neural Additive Modelsと比較し, SHAPとの対応, および競合予測精度を示す。
論文 参考訳(メタデータ) (2020-07-27T21:47:24Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。