論文の概要: BioBO: Biology-informed Bayesian Optimization for Perturbation Design
- arxiv url: http://arxiv.org/abs/2509.19988v1
- Date: Wed, 24 Sep 2025 10:50:06 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-25 20:53:19.782397
- Title: BioBO: Biology-informed Bayesian Optimization for Perturbation Design
- Title(参考訳): BioBO:生体情報を用いた摂動設計のためのベイズ最適化
- Authors: Yanke Li, Tianyu Cui, Tommaso Mansi, Mangal Prakash, Rui Liao,
- Abstract要約: 本稿では,生物インフォームドベイズ最適化(Biology-Informed Bayesian Optimization, BioBO)を提案する。
BioBOは、生物学的に根ざした前駆体と、有望な遺伝子に対する探索をバイアスする原則的枠組みによる獲得機能を組み合わせる。
以上の結果から,BioBOはラベリング効率を25~40%向上させ,従来のBOよりも常に優れており,高い性能の摂動を識別する。
- 参考スコア(独自算出の注目度): 10.086893225706321
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Efficient design of genomic perturbation experiments is crucial for accelerating drug discovery and therapeutic target identification, yet exhaustive perturbation of the human genome remains infeasible due to the vast search space of potential genetic interactions and experimental constraints. Bayesian optimization (BO) has emerged as a powerful framework for selecting informative interventions, but existing approaches often fail to exploit domain-specific biological prior knowledge. We propose Biology-Informed Bayesian Optimization (BioBO), a method that integrates Bayesian optimization with multimodal gene embeddings and enrichment analysis, a widely used tool for gene prioritization in biology, to enhance surrogate modeling and acquisition strategies. BioBO combines biologically grounded priors with acquisition functions in a principled framework, which biases the search toward promising genes while maintaining the ability to explore uncertain regions. Through experiments on established public benchmarks and datasets, we demonstrate that BioBO improves labeling efficiency by 25-40%, and consistently outperforms conventional BO by identifying top-performing perturbations more effectively. Moreover, by incorporating enrichment analysis, BioBO yields pathway-level explanations for selected perturbations, offering mechanistic interpretability that links designs to biologically coherent regulatory circuits.
- Abstract(参考訳): ゲノム摂動実験の効率的な設計は、薬物発見と治療標的同定の促進に不可欠であるが、潜在的な遺伝的相互作用と実験的制約の広大な探索空間のため、ヒトゲノムの徹底的な摂動は実現不可能である。
ベイズ最適化(BO)は情報的介入を選択するための強力なフレームワークとして登場したが、既存のアプローチはドメイン固有の生物学的事前知識を活用できないことが多い。
本稿では,ベイズ最適化とマルチモーダル遺伝子埋め込みとエンリッチメント解析を統合したバイオロジーインフォームドベイズ最適化(BioBO)を提案する。
BioBOは、生物学的に根ざした先行機能と、不確実な領域を探索する能力を維持しながら、有望な遺伝子に対する探索をバイアスする原則的な枠組みによる獲得機能を組み合わせる。
確立された公開ベンチマークとデータセットの実験を通じて、BioBOはラベルの効率を25~40%改善し、トップパフォーマンスの摂動をより効果的に識別することで、従来のBOよりも一貫して優れていることを示した。
さらに、濃縮分析を取り入れることで、BioBOは選択された摂動に対して経路レベルの説明を与え、設計を生物学的に一貫性のある制御回路にリンクする機械的解釈性を提供する。
関連論文リスト
- GENERator: A Long-Context Generative Genomic Foundation Model [66.46537421135996]
本稿では,98k塩基対 (bp) と1.2Bパラメータからなるゲノム基盤モデル GENERator を提案する。
DNAの386Bbpからなる拡張データセットに基づいて、GENERatorは、確立されたベンチマークと新しく提案されたベンチマークの両方で最先端のパフォーマンスを実証する。
また、特に特定のアクティビティプロファイルを持つエンハンサーシーケンスを即応的に生成することで、シーケンス最適化において大きな可能性を秘めている。
論文 参考訳(メタデータ) (2025-02-11T05:39:49Z) - Knowledge-Guided Biomarker Identification for Label-Free Single-Cell RNA-Seq Data: A Reinforcement Learning Perspective [30.927272289309048]
本稿では、既存の遺伝子選択アルゴリズムからのアンサンブル知識を利用して、予備的境界や事前知識を確立する反復的な遺伝子パネル選択戦略を提案する。
我々は、専門家の行動によって形成される報酬関数を通じて強化学習を取り入れ、動的洗練と遺伝子パネルの標的選択を可能にした。
本研究は, 単細胞ゲノムデータ解析における本手法の可能性を明らかにするものである。
論文 参考訳(メタデータ) (2025-01-02T07:57:41Z) - Enhanced Gene Selection in Single-Cell Genomics: Pre-Filtering Synergy and Reinforced Optimization [16.491060073775884]
単一セルゲノミクスにおけるクラスタリングタスクに適用可能な反復的遺伝子パネル選択戦略を提案する。
本手法は、他の遺伝子選択アルゴリズムの結果を統合し、重要な予備的境界を提供する。
強化学習(RL)における探索プロセスの性質と,その連続最適化能力を取り入れた。
論文 参考訳(メタデータ) (2024-06-11T16:21:33Z) - BioDiscoveryAgent: An AI Agent for Designing Genetic Perturbation Experiments [112.25067497985447]
そこで,BioDiscoveryAgentを紹介した。このエージェントは,新しい実験を設計し,その結果の理由を明らかにし,仮説空間を効率的にナビゲートし,望ましい解に到達させる。
BioDiscoveryAgentは、機械学習モデルをトレーニングすることなく、新しい実験を独自に設計することができる。
6つのデータセットで関連する遺伝的摂動を予測することで、平均21%の改善が達成されている。
論文 参考訳(メタデータ) (2024-05-27T19:57:17Z) - Improving Biomedical Entity Linking with Retrieval-enhanced Learning [53.24726622142558]
$k$NN-BioELは、トレーニングコーパス全体から同様のインスタンスを予測のヒントとして参照する機能を備えたBioELモデルを提供する。
k$NN-BioELは、いくつかのデータセットで最先端のベースラインを上回ります。
論文 参考訳(メタデータ) (2023-12-15T14:04:23Z) - DiscoBAX: Discovery of Optimal Intervention Sets in Genomic Experiment
Design [61.48963555382729]
本研究では,実験1回あたりの有意な発見率を最大化するためのサンプル効率向上手法としてDiscoBAXを提案する。
我々は、標準仮定の下で近似最適性の理論的保証を提供し、包括的な実験評価を行う。
論文 参考訳(メタデータ) (2023-12-07T06:05:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。