論文の概要: Combining Bayesian and Frequentist Inference for Laboratory-Specific Performance Guarantees in Copy Number Variation Detection
- arxiv url: http://arxiv.org/abs/2604.14305v1
- Date: Wed, 15 Apr 2026 18:01:37 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-04-17 21:29:29.975735
- Title: Combining Bayesian and Frequentist Inference for Laboratory-Specific Performance Guarantees in Copy Number Variation Detection
- Title(参考訳): コピー数変化検出における実験室特性保証のためのベイズ推定と周波数推定の組み合わせ
- Authors: Austin Talbot, Alex V. Kotlar, Yue Ke,
- Abstract要約: 粗大化後部とサンドイッチ調整後部を含む頑健なベイズ的信頼区間であっても, アンプリコン数が少ないパネルでは, 極めて誤診されている。
本稿では,ガムマ分布を伴う2乗損失をモデルとして,ベイズ的後続関数を検証標本上で評価するハイブリッドフレームワークを提案する。
- 参考スコア(独自算出の注目度): 0.8602553195689513
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Targeted amplicon panels are widely used in oncology diagnostics, but providing per-gene performance guarantees for copy number variant (CNV) detection remains challenging due to amplification artifacts, process-mismatch heterogeneity, and limited validation sample sizes. While Bayesian CNV callers naturally quantify per-sample uncertainty, translating this into the frequentist population-level guarantees required for clinical validation, coverage rates, false-positive bounds, and minimum detectable copy-number changes, is a fundamentally different inferential problem. We show empirically that even robust Bayesian credible intervals, including coarsened posteriors and sandwich-adjusted intervals, are severely miscalibrated on panels with small amplicon counts per gene. To address this, we propose a hybrid framework that evaluates Bayesian posterior functionals on validation samples and models the resulting squared losses with a Gamma distribution, yielding tolerance intervals with valid frequentist coverage. Three components make the method practical under real-world constraints: (1) imputation that removes the influence of true CNV-positive samples without requiring known ground truth, (2) regularization to address small sample variability, and (3) evidence-based stratification on the log model evidence to accommodate non-exchangeable noise profiles arising from process mismatch. Evaluated on two targeted amplicon panels using leave-one-out cross-validation, the proposed method achieves single-digit mean absolute coverage error across all genes under both process-matched and unmatched conditions, whereas Bayesian comparators exhibit mean absolute errors exceeding 60\% on clinically relevant genes such as ERBB2.
- Abstract(参考訳): 標的としたアンプリコンパネルは腫瘍診断に広く用いられているが、コピー数変種(CNV)検出の遺伝子単位の性能保証は、増幅アーティファクト、プロセスミスマッチの不均一性、検証サンプルサイズが制限されているため、依然として困難である。
ベイジアンCNV呼び出し者は、自然にサンプルごとの不確実性を定量化し、これを臨床検証、カバレッジ率、偽陽性境界、最小検出可能なコピー数変更に必要な頻繁な人口レベルの保証に翻訳することは、根本的に異なる推論問題である。
弱体化後部とサンドイッチ調整後部を含む頑健なベイズ的信頼区間においても,遺伝子単位のアンプリコン数が少ないパネルでは,重度に偏りがみられた。
そこで本稿では,ガムマ分布で得られた2乗損失をモデルとしてベイズ的後続関数を評価するハイブリッドフレームワークを提案する。
実世界の制約下では,(1)真理を必要とせずに真のCNV陽性試料の影響を除去する命令,(2)小さなサンプルの変動に対処するための規則化,(3)プロセスミスマッチによる非交換性ノイズプロファイルに対応するためのログモデル証拠へのエビデンスに基づく階層化の3つの要素が実演されている。
本手法は, 2つの標的アンプリコンパネルにおいて, プロセス整合および未整合条件下での全遺伝子に対して1桁平均絶対被覆誤差を達成し, ERBB2などの臨床関連遺伝子に対して平均絶対被覆誤差が60倍を超えることを示した。
関連論文リスト
- Improving RCT-Based Treatment Effect Estimation Under Covariate Mismatch via Calibrated Alignment [0.0]
本稿では,各ソースの特徴を共通表現空間にマッピングする埋め込み学習により,インプットを回避したCALMを提案する。
OSの結果モデルはRTT埋め込み空間に転送され、試行データを用いて校正され、ランダム化による因果同定が保存される。
論文 参考訳(メタデータ) (2026-03-19T17:43:12Z) - From Calibration to Refinement: Seeking Certainty via Probabilistic Evidence Propagation for Noisy-Label Person Re-Identification [40.73759251488672]
既存のノイズロスのある人物Re-ID法は、ソフトマックス出力を用いた損失補正やサンプル選択方式に依存している。
本稿では,キャリブレーションからリファインメントへ伝播する確率的証拠を通じて確実性を求める2段階フレームワークであるCARE法を提案する。
精製段階では, クリーン試料とノイズ試料をより正確に識別できるエビデンス伝搬精製法(EPR)を設計する。
論文 参考訳(メタデータ) (2026-02-26T15:50:15Z) - Detecting Batch Heterogeneity via Likelihood Clustering [0.9668407688201359]
バッチエフェクトはゲノム診断の主要な共同創設者である。
ベイジアンモデル証拠に従ってサンプルをクラスタリングすることで,両方の制約に対処する手法を提案する。
本手法は,標準相関法や次元縮小法と比較して,クラスタリング精度が優れている。
論文 参考訳(メタデータ) (2026-01-14T01:49:21Z) - Unlasting: Unpaired Single-Cell Multi-Perturbation Estimation by Dual Conditional Diffusion Implicit Bridges [68.98973318553983]
本稿では,Dual Diffusion Implicit Bridges (DDIB) に基づくフレームワークを提案する。
我々は、生物学的に意味のある方法で摂動シグナルを伝達するために遺伝子制御ネットワーク(GRN)情報を統合する。
また、サイレント遺伝子を予測し、生成したプロファイルの品質を向上させるためのマスキング機構も組み込んだ。
論文 参考訳(メタデータ) (2025-06-26T09:05:38Z) - ROTI-GCV: Generalized Cross-Validation for right-ROTationally Invariant Data [5.830619388189558]
高次元正規化回帰における2つの重要なタスクは、正確な予測のために正規化強度を調整し、サンプル外リスクを推定することである。
問題のある条件下でクロスバリデーションを確実に行うための新しいフレームワーク ROTI-GCV を導入する。
論文 参考訳(メタデータ) (2024-06-17T15:50:00Z) - Breaking the Spurious Causality of Conditional Generation via Fairness
Intervention with Corrective Sampling [77.15766509677348]
条件生成モデルは、トレーニングデータセットから急激な相関を継承することが多い。
これは別の潜在属性に対して不均衡なラベル条件分布をもたらす。
この問題を緩和するための一般的な2段階戦略を提案する。
論文 参考訳(メタデータ) (2022-12-05T08:09:33Z) - Hierarchical Semi-Supervised Contrastive Learning for
Contamination-Resistant Anomaly Detection [81.07346419422605]
異常検出は、通常のデータ分布から逸脱したサンプルを特定することを目的としている。
コントラスト学習は、異常の効果的な識別を可能にする表現のサンプル化に成功している。
汚染耐性異常検出のための新しい階層型半教師付きコントラスト学習フレームワークを提案する。
論文 参考訳(メタデータ) (2022-07-24T18:49:26Z) - Statistical and Computational Phase Transitions in Group Testing [73.55361918807883]
本研究の目的は、希少な疾患を患っているk人の集団を同定することである。
個々人のテストを割り当てるための2つの異なる単純なランダムな手順を考える。
論文 参考訳(メタデータ) (2022-06-15T16:38:50Z) - Exploiting Sample Uncertainty for Domain Adaptive Person
Re-Identification [137.9939571408506]
各サンプルに割り当てられた擬似ラベルの信頼性を推定・活用し,ノイズラベルの影響を緩和する。
不確実性に基づく最適化は大幅な改善をもたらし、ベンチマークデータセットにおける最先端のパフォーマンスを達成します。
論文 参考訳(メタデータ) (2020-12-16T04:09:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。