論文の概要: Many Needles in a Haystack: Active Hit Discovery for Perturbation Experiments
- arxiv url: http://arxiv.org/abs/2605.10196v1
- Date: Mon, 11 May 2026 08:45:19 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-12 23:28:50.662734
- Title: Many Needles in a Haystack: Active Hit Discovery for Perturbation Experiments
- Title(参考訳): ヘイスタックの多くの針:摂動実験のためのアクティブなヒット発見
- Authors: Andrea Rubbi, Arpit Merchant, Samuel Ogden, Amir Akbarnejad, Pietro Liò, Sattar Vakili, Mo Lotfollahi,
- Abstract要約: 高スループット遺伝子摂動実験は、並列にいくつかの遺伝的介入をテストすることができるが、実験予算は限られている。
中心的なゴールは発見であり、できるだけ多くの摂動を識別し、その効果が予め定義された閾値を超えることである。
本稿では,大域的な大域的最適化を目標とし,他の高値領域を無視しながら支配的モードを過度に展開する手法を提案する。
- 参考スコア(独自算出の注目度): 19.510272466719044
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: High-throughput gene perturbation experiments can test several genetic interventions in parallel, yet experimental budgets remain limited. A central goal is hit discovery: identifying as many perturbations as possible whose phenotypic effect exceeds a predefined threshold. Pure exploration strategies are statistically inefficient, wasting budget on low-value regions. Bayesian optimization methods offer a principled alternative but target a single global optimum, over-exploiting dominant modes while neglecting other high-value regions. We formalize hit discovery as a sequential experimental design problem and propose Probability-of-Hit, an acquisition function that directly targets threshold exceedance by ranking candidates according to their posterior probability of being a hit. We prove asymptotic optimality of this approach and demonstrate strong empirical performance on both synthetic benchmarks and real biological immunology datasets, including up to 6.4% improvement over baselines on the Schmidt IL-2 dataset.
- Abstract(参考訳): 高スループット遺伝子摂動実験は、並列にいくつかの遺伝的介入をテストすることができるが、実験予算は限られている。
中心的なゴールは発見であり、表現型効果が予め定義された閾値を超えているできるだけ多くの摂動を特定することである。
純粋な探査戦略は統計的に非効率であり、低価値地域の予算を浪費する。
ベイズ最適化法は、原則化された代替手段を提供するが、他の高値領域を無視しながら、1つの大域的な最適化、過剰に露出する支配的モードをターゲットにしている。
本研究では、ヒット発見を逐次的な実験設計問題として定式化し、ヒット確率に応じてランキング候補による閾値超過を直接狙う取得関数であるProbability-of-Hitを提案する。
このアプローチの漸近的最適性を証明し、Schmidt IL-2データセットのベースラインを最大6.4%改善するなど、合成ベンチマークと実際の生物学的免疫学データセットの両方で強力な経験的性能を示す。
関連論文リスト
- Active Target Discovery under Uninformative Prior: The Power of Permanent and Transient Memory [26.488250231429774]
高品質なデータを取得するのが高価である多くの科学・工学分野において、制限された予算内での発見率の最大化には、観測されていない領域の戦略的サンプリングが不可欠である。
非形式的事前設定においても効果的なアクティブターゲット発見を可能にする新しい手法を提案する。
ブラックボックスのポリシーとは異なり、私たちのアプローチは本質的に解釈可能であり、意思決定に関する明確な洞察を与えます。
論文 参考訳(メタデータ) (2025-10-19T00:42:56Z) - Prediction-Powered Causal Inferences [59.98498488132307]
予測型因果推論(PPCI)に焦点をあてる
まず, 条件付きキャリブレーションにより, 人口レベルでの有効なPPCIが保証されることを示す。
次に、実験間での十分な表現制約伝達の妥当性を導入する。
論文 参考訳(メタデータ) (2025-02-10T10:52:17Z) - Adaptive Sampling to Reduce Epistemic Uncertainty Using Prediction Interval-Generation Neural Networks [0.0]
本稿では,予測モデルにおけるてんかんの不確実性を低減するための適応サンプリング手法を提案する。
我々の主な貢献は、潜在的なてんかんの不確実性を推定する計量の開発である。
ガウス過程(GP)に基づくバッチサンプリング戦略も提案する。
本研究では, 実験肥料の施肥率を選択するために, 3つの一次元合成問題と, 農業分野に基づく多次元データセットについて検討した。
論文 参考訳(メタデータ) (2024-12-13T21:21:47Z) - Optimizing Adaptive Experiments: A Unified Approach to Regret Minimization and Best-Arm Identification [9.030753181146176]
実験内性能と実験後の成果を同時に考慮した統一モデルを提案する。
実験期間の大幅な短縮は、実験内および実験後の後悔の両方に最小限の影響を伴って達成できることが示されている。
論文 参考訳(メタデータ) (2024-02-16T11:27:48Z) - DiscoBAX: Discovery of Optimal Intervention Sets in Genomic Experiment
Design [61.48963555382729]
本研究では,実験1回あたりの有意な発見率を最大化するためのサンプル効率向上手法としてDiscoBAXを提案する。
我々は、標準仮定の下で近似最適性の理論的保証を提供し、包括的な実験評価を行う。
論文 参考訳(メタデータ) (2023-12-07T06:05:39Z) - Benchmarking Bayesian Causal Discovery Methods for Downstream Treatment
Effect Estimation [137.3520153445413]
下流推論に重点を置く因果発見手法の評価において,顕著なギャップが存在する。
我々は,GFlowNetsに基づく新たな手法を含む,確立された7つの基本因果探索手法を評価する。
研究の結果,研究対象のアルゴリズムのいくつかは,多種多様なATEモードを効果的に捉えることができることがわかった。
論文 参考訳(メタデータ) (2023-07-11T02:58:10Z) - MetaRF: Differentiable Random Forest for Reaction Yield Prediction with
a Few Trails [58.47364143304643]
本稿では,反応収率予測問題に焦点をあてる。
筆者らはまず,数発の収量予測のために特別に設計された,注意に基づく識別可能なランダム森林モデルであるMetaRFを紹介した。
数発の学習性能を改善するために,さらに次元還元に基づくサンプリング手法を導入する。
論文 参考訳(メタデータ) (2022-08-22T06:40:13Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。