論文の概要: GESR: A Genetic Programming-Based Symbolic Regression Method with Gene Editing
- arxiv url: http://arxiv.org/abs/2605.10685v2
- Date: Tue, 12 May 2026 03:13:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-13 18:21:07.135863
- Title: GESR: A Genetic Programming-Based Symbolic Regression Method with Gene Editing
- Title(参考訳): GESR:遺伝子編集を用いた遺伝的プログラミングに基づくシンボリック回帰法
- Authors: Yanjie Li, Weijun Li, Xin Ning,
- Abstract要約: 進化的アルゴリズムに基づく遺伝的プログラミング(GP)は、現在でも最も古典的で広く採用されている手法の1つである。
本稿ではGESRと呼ばれる遺伝子編集に基づく記号回帰手法を提案する。
- 参考スコア(独自算出の注目度): 19.45909107561264
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Mathematical formulas serve as a language through which humans communicate with nature. Discovering mathematical laws from scientific data to describe natural phenomena has been a long-standing pursuit of humanity for centuries. In the field of artificial intelligence, this challenge is known as the symbolic regression problem. Among existing symbolic regression approaches, Genetic Programming (GP) based on evolutionary algorithms remains one of the most classical and widely adopted methods. GP simulates the evolutionary process across generations through genetic mutation and crossover. However, mutations and crossovers in GP are entirely random. While this randomness effectively mimics natural evolution, it inevitably produces both beneficial and detrimental variations. If there existed a metaphorical `God` capable of foreseeing which genetic mutations or crossovers would yield superior outcomes and performing targeted gene editing accordingly, the efficiency of evolution could be substantially improved. Motivated by this idea, we propose in this paper a symbolic regression approach based on gene editing, termed GESR. In GESR, we trained two "hands of God" (two BERT models). Among them, the first leverages the BERT's masked language modeling capability to guide the mutation of genes (expression symbols). The other BERT model guides the crossover of individual genes by predicting the crossover point. Experimental results demonstrate that GESR significantly improves computational efficiency compared with traditional GP algorithms and achieves strong overall performance across multiple symbolic regression tasks.
- Abstract(参考訳): 数学的公式は、人間が自然とコミュニケーションする言語として機能する。
自然現象を記述するために科学データから数学的法則を発見することは、何世紀にもわたって人類の追求であった。
人工知能の分野では、この挑戦は象徴的回帰問題として知られている。
既存の象徴的回帰手法の中で、進化的アルゴリズムに基づく遺伝的プログラミング(GP)は最も古典的で広く採用されている手法の1つである。
GPは遺伝子変異と交叉を通じて世代間で進化過程をシミュレートする。
しかし、GPの突然変異と交叉は全くランダムである。
このランダム性は自然進化を効果的に模倣するが、必然的に有益かつ有害なバリエーションを生み出す。
もし「God」というメタファーがあり、どの遺伝子変異や交叉が優れた結果をもたらすかを予測し、それに従って標的遺伝子編集を行うことができるなら、進化の効率は大幅に改善される可能性がある。
本論文では,GESRと呼ばれる遺伝子編集に基づく記号的回帰手法を提案する。
GESRでは、2つの"神の手"(2つのBERTモデル)を訓練しました。
そのうちの1つは、BERTのマスク付き言語モデリング機能を利用して遺伝子(発現記号)の突然変異を誘導する。
他のBERTモデルは、クロスオーバーポイントを予測することによって、個々の遺伝子のクロスオーバーを誘導する。
実験結果から,GESRは従来のGPアルゴリズムと比較して計算効率を著しく向上し,複数のシンボル回帰タスクに対して高い総合的な性能を実現することが示された。
関連論文リスト
- Beyond Independent Genes: Learning Module-Inductive Representations for Gene Perturbation Prediction [48.80217316452559]
scBIGは、協調した遺伝子プログラムを明示的にモデル化するモジュール誘導予測フレームワークである。
scBIGは、特に目に見えない、摂動的な設定において、最先端のメソッドを一貫して上回る。
論文 参考訳(メタデータ) (2026-02-03T16:43:40Z) - GRAPE: Heterogeneous Graph Representation Learning for Genetic Perturbation with Coding and Non-Coding Biotype [51.58774936662233]
遺伝子制御ネットワーク(GRN)の構築は、遺伝的摂動の影響を理解し予測するために不可欠である。
本研究では,事前学習した大規模言語モデルとDNAシークエンスモデルを用いて,遺伝子記述やDNAシークエンスデータから特徴を抽出する。
我々は、遺伝子摂動において初めて遺伝子バイオタイプ情報を導入し、細胞プロセスの制御において異なるバイオタイプを持つ遺伝子の異なる役割をシミュレートした。
論文 参考訳(メタデータ) (2025-05-06T03:35:24Z) - Predicting Genetic Mutation from Whole Slide Images via Biomedical-Linguistic Knowledge Enhanced Multi-label Classification [119.13058298388101]
遺伝子変異予測性能を向上させるため,生物知識を付加したPathGenomic Multi-label Transformerを開発した。
BPGTはまず、2つの慎重に設計されたモジュールによって遺伝子前駆体を構成する新しい遺伝子エンコーダを確立する。
BPGTはその後ラベルデコーダを設計し、最終的に2つの調整されたモジュールによる遺伝的突然変異予測を行う。
論文 参考訳(メタデータ) (2024-06-05T06:42:27Z) - VQDNA: Unleashing the Power of Vector Quantization for Multi-Species Genomic Sequence Modeling [60.91599380893732]
VQDNAは、ゲノムボキャブラリ学習の観点からゲノムのトークン化を改良する汎用フレームワークである。
ベクトル量子化されたコードブックを学習可能な語彙として活用することにより、VQDNAはゲノムをパターン認識の埋め込みに適応的にトークン化することができる。
論文 参考訳(メタデータ) (2024-05-13T20:15:03Z) - Epigenetics Algorithms: Self-Reinforcement-Attention mechanism to
regulate chromosomes expression [0.0]
本稿ではメチル化として知られるエピジェネティックス現象を模倣する新しいエピジェネティックスアルゴリズムを提案する。
エピジェネティックスアルゴリズムの斬新さは、主に注意機構と深層学習を利用しており、遺伝子/サイレンシングの概念とよく適合している。
論文 参考訳(メタデータ) (2023-03-15T21:33:21Z) - The Effect of Multi-Generational Selection in Geometric Semantic Genetic
Programming [8.0322025529523]
Geometric Semantic Genetic Programming (GSGP) は実世界の多くの問題に適用可能である。
GSGPの実装には特異性があるため、GSGPは進化の歴史を全て保存する必要がある。
我々は、この蓄積された情報を利用して、高齢者の個人を利用できる多世代選択スキームを定義する。
論文 参考訳(メタデータ) (2022-05-05T12:26:25Z) - rfPhen2Gen: A machine learning based association study of brain imaging
phenotypes to genotypes [71.1144397510333]
56個の脳画像QTを用いてSNPを予測する機械学習モデルを学習した。
アルツハイマー病(AD)リスク遺伝子APOEのSNPは、ラスソとランダムな森林に対して最低のRMSEを有していた。
ランダム・フォレストは、線形モデルによって優先順位付けされなかったが、脳関連疾患と関連があることが知られている追加のSNPを特定した。
論文 参考訳(メタデータ) (2022-03-31T20:15:22Z) - VEGN: Variant Effect Prediction with Graph Neural Networks [19.59965282985234]
本稿では,遺伝子と変異を持つ異種グラフ上で動作するグラフニューラルネットワーク(GNN)を用いて,変異効果予測をモデル化したVEGNを提案する。
このグラフは、変異体を遺伝子に割り当て、遺伝子-遺伝子相互作用ネットワークに遺伝子を接続することによって作成される。
VeGNは既存の最先端モデルの性能を改善する。
論文 参考訳(メタデータ) (2021-06-25T13:51:46Z) - Zoetrope Genetic Programming for Regression [2.642406403099596]
Zoetrope Genetic Programming (ZGP)アルゴリズムは、数学的表現のオリジナルの表現に基づいている。
ZGPは多数のパブリックドメイン回帰データセットを使用して検証される。
論文 参考訳(メタデータ) (2021-02-26T10:47:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。