論文の概要: Kernel-Based Evaluation of Conditional Biological Sequence Models
- arxiv url: http://arxiv.org/abs/2510.15601v1
- Date: Fri, 17 Oct 2025 12:47:51 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-20 20:17:34.622472
- Title: Kernel-Based Evaluation of Conditional Biological Sequence Models
- Title(参考訳): カーネルによる条件付き生物配列モデルの評価
- Authors: Pierre Glaser, Steffanie Paul, Alissa M. Hummer, Charlotte M. Deane, Debora S. Marks, Alan N. Amin,
- Abstract要約: 条件付きシーケンスモデルの設計と調整を行うためのカーネルベースのツールセットを提案する。
我々のツールのバックボーンは、Augmented Maximum Mean Discrepancy (ACMMD)と呼ばれる、真の条件分布とモデルの推定値との新たな相違の尺度である。
本稿では,タンパク質設計モデルであるプロテインMPNNを解析し,本手法の有用性を実証する。
- 参考スコア(独自算出の注目度): 8.322729112426819
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a set of kernel-based tools to evaluate the designs and tune the hyperparameters of conditional sequence models, with a focus on problems in computational biology. The backbone of our tools is a new measure of discrepancy between the true conditional distribution and the model's estimate, called the Augmented Conditional Maximum Mean Discrepancy (ACMMD). Provided that the model can be sampled from, the ACMMD can be estimated unbiasedly from data to quantify absolute model fit, integrated within hypothesis tests, and used to evaluate model reliability. We demonstrate the utility of our approach by analyzing a popular protein design model, ProteinMPNN. We are able to reject the hypothesis that ProteinMPNN fits its data for various protein families, and tune the model's temperature hyperparameter to achieve a better fit.
- Abstract(参考訳): 本稿では,計算生物学の問題に焦点をあて,条件付きシーケンスモデルのハイパーパラメータを評価・調整するためのカーネルベースのツールセットを提案する。
我々のツールのバックボーンは、Augmented Conditional Maximum Mean Discrepancy (ACMMD)と呼ばれる、真の条件分布とモデルの推定との新たな相違の尺度である。
モデルがサンプル化できるならば、データからACMMDを不偏に推定して絶対モデル適合性を定量化し、仮説テストに統合し、モデルの信頼性を評価することができる。
本稿では,タンパク質設計モデルであるプロテインMPNNを解析し,本手法の有用性を実証する。
我々は、タンパク質MPNNが様々なタンパク質ファミリーのデータを適合させるという仮説を否定することができ、モデルの温度ハイパーパラメータを調整して、より良い適合を達成することができる。
関連論文リスト
- Uncertainty-Guided Model Selection for Tabular Foundation Models in Biomolecule Efficacy Prediction [3.108481950101193]
本研究では,モデル選択のための不確実性誘導戦略について検討する。
本研究では,直列型特徴量を用いたTabPFNモデルが,最先端の予測器を上回りうることを示す。
論文 参考訳(メタデータ) (2025-10-02T18:33:19Z) - Model Correlation Detection via Random Selection Probing [62.093777777813756]
既存の類似性に基づく手法では、モデルパラメータにアクセスしたり、しきい値なしでスコアを生成する必要がある。
本稿では,モデル相関検出を統計的テストとして定式化する仮説テストフレームワークであるランダム選択探索(RSP)を紹介する。
RSPは相関の証拠を定量化する厳密なp-値を生成する。
論文 参考訳(メタデータ) (2025-09-29T01:40:26Z) - Robust Spatiotemporal Epidemic Modeling with Integrated Adaptive Outlier Detection [7.5504472850103435]
疫病モデルでは、アウトレーヤはパラメータ推定を歪め、公衆衛生上の判断を誤ったものにすることができる。
本稿では、この歪みを軽減するために、ロバストな一般化加法モデル(RST-GAM)を導入する。
アメリカ合衆国における郡レベルのCOVID-19感染データを解析し,RTT-GAMの実用性を実証した。
論文 参考訳(メタデータ) (2025-07-12T19:23:25Z) - Model-free Methods for Event History Analysis and Efficient Adjustment (PhD Thesis) [55.2480439325792]
この論文は、モデルフリーの観点から統一された統計学への独立した貢献のシリーズである。
第1章では、機械学習から予測技術を活用する柔軟なメソッドを定式化するために、モデルフリーの視点をどのように利用できるか、詳しく説明している。
第2章では、あるプロセスの進化が他のプロセスに直接影響されるかどうかを記述した地域独立の概念を研究している。
論文 参考訳(メタデータ) (2025-02-11T19:24:09Z) - Adaptive Nonparametric Perturbations of Parametric Bayesian Models [33.85958872117418]
非パラメトリック摂動パラメトリック(NPP)ベイズモデルについて検討し、パラメトリックベイズモデルをその可能性の歪みによって緩和する。
NPPモデルはパラメトリックモデルのデータの効率を保ちながら、非モデルのロバスト性を提供できることを示す。
単一細胞RNAシークエンシングデータから遺伝子発現の因果効果を推定し,本手法を実証する。
論文 参考訳(メタデータ) (2024-12-14T05:06:38Z) - Stable Training of Probabilistic Models Using the Leave-One-Out Maximum Log-Likelihood Objective [0.7373617024876725]
カーネル密度推定(KDE)に基づくモデルは、このタスクの一般的な選択であるが、密度の異なるデータ領域に適応できない。
適応的なKDEモデルを用いてこれを回避し、モデル内の各カーネルは個別の帯域幅を持つ。
最適化速度を確実に高速化するために改良された期待最大化アルゴリズムを用いる。
論文 参考訳(メタデータ) (2023-10-05T14:08:42Z) - Conditional Korhunen-Lo\'{e}ve regression model with Basis Adaptation
for high-dimensional problems: uncertainty quantification and inverse
modeling [62.997667081978825]
本稿では,物理系の観測可能な応答のサロゲートモデルの精度を向上させる手法を提案する。
本研究では,定常水理応答のBasis Adaptation (BA)法による代理モデル構築に提案手法を適用した。
論文 参考訳(メタデータ) (2023-07-05T18:14:38Z) - Generalization Metrics for Practical Quantum Advantage in Generative
Models [68.8204255655161]
生成モデリングは量子コンピュータにとって広く受け入れられている自然のユースケースである。
我々は,アルゴリズムの一般化性能を計測して,生成モデリングのための実用的な量子優位性を探索する,単純で曖昧な手法を構築した。
シミュレーションの結果、我々の量子にインスパイアされたモデルは、目に見えない、有効なサンプルを生成するのに、最大で68倍の費用がかかります。
論文 参考訳(メタデータ) (2022-01-21T16:35:35Z) - How Faithful is your Synthetic Data? Sample-level Metrics for Evaluating
and Auditing Generative Models [95.8037674226622]
ドメインに依存しない方法で生成モデルの忠実度,多様性,一般化性能を特徴付ける3次元評価指標を提案する。
当社のメトリクスは、精度リコール分析により統計的発散測定を統合し、モデル忠実度と多様性のサンプルおよび分布レベルの診断を可能にします。
論文 参考訳(メタデータ) (2021-02-17T18:25:30Z) - Leveraging Global Parameters for Flow-based Neural Posterior Estimation [90.21090932619695]
実験観測に基づくモデルのパラメータを推定することは、科学的方法の中心である。
特に困難な設定は、モデルが強く不確定であるとき、すなわち、パラメータの異なるセットが同一の観測をもたらすときである。
本稿では,グローバルパラメータを共有する観測の補助的セットによって伝達される付加情報を利用して,その不確定性を破る手法を提案する。
論文 参考訳(メタデータ) (2021-02-12T12:23:13Z) - Unravelling the Architecture of Membrane Proteins with Conditional
Random Fields [11.321552104966326]
条件ランダム場 (CRF) は, 生物体に関するマイクロレベルの情報を数学的モデルに統合し, マクロレベルの振る舞いを理解するテンプレートを提供する。
ベンチマークデータセットと他の28の手法との比較では、CRFモデルが極めて正確な予測につながることが示されている。
論文 参考訳(メタデータ) (2020-08-06T05:57:20Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。