論文の概要: Controlling False Discovery in Arbitrarily Structured Hypothesis Spaces via Reproducing Kernels
- arxiv url: http://arxiv.org/abs/2605.17559v1
- Date: Sun, 17 May 2026 17:42:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-19 17:57:48.195186
- Title: Controlling False Discovery in Arbitrarily Structured Hypothesis Spaces via Reproducing Kernels
- Title(参考訳): 再生カーネルによる任意構造仮説空間における偽発見の制御
- Authors: Binyamin Perets, Shie Mannor,
- Abstract要約: 連続的なドメイン、グラフ、階層を1つのアルゴリズムで統一するフレームワークをカーネル選択のみで導入する。
FDR(False Discovery Rate)を制御するための2つの決定ルールを提供します。
本手法は,高次元実世界のデータセットから得られた空間的位置とタンパク質間相互作用グラフを用いた遺伝子発現タスクの2つの情報源で検証する。
- 参考スコア(独自算出の注目度): 47.16593717985932
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Large-scale hypothesis testing is central to modern science, where controlling the False Discovery Rate (FDR) has become the standard approach to managing false positives across many simultaneous tests. Hypotheses rarely exist in isolation; they often exhibit structure through proximity, connectivity, or hierarchy. This structure represents both a challenge and an opportunity: while classical methods treat these dependencies as obstacles requiring conservative correction, leveraging them can substantially increase discovery power. Here, we reframe structured FDR control as a regularized learning problem. By optimizing within a suitable Reproducing Kernel Hilbert Space (RKHS), we introduce a framework that unifies continuous domains, graphs, and hierarchies under a single algorithm through kernel choice alone. This formulation enables smooth solutions in place of the piecewise-constant fits of prior methods, principled likelihood-based hyperparameter selection rather than heuristic tuning, and inference at unobserved locations which in turn supports sample-efficient experimental design. Building on this estimator, we provide two decision rules which we prove to control the FDR. We validate our method on two sources: spatial locations derived from high-dimensional real-world datasets, and a differential gene expression task utilizing protein-protein interaction graphs.
- Abstract(参考訳): 大規模な仮説テストは現代の科学の中心であり、False Discovery Rate(FDR)の制御は多くの同時テストで偽陽性を管理する標準的なアプローチとなっている。
仮説は孤立して存在することは稀であり、しばしば近接性、接続性、階層構造を通して構造を示す。
古典的な手法ではこれらの依存関係を、保守的な修正を必要とする障害として扱うが、それらを活用することで発見能力を大幅に向上させることができる。
ここでは、構造化されたFDR制御を正規化学習問題として再編成する。
好適な再生カーネルヒルベルト空間(RKHS)内で最適化することにより、カーネル選択のみを通じて、単一アルゴリズムの下で連続的なドメイン、グラフ、階層を統一するフレームワークを導入する。
この定式化は、従来の手法のピースワイズ整合性に代えて滑らかな解、ヒューリスティックなチューニングではなく、原則化された確率ベースのハイパーパラメータ選択、そしてサンプル効率のよい実験設計をサポートする未観測の場所での推論を可能にする。
この推定器に基づいて、FDRを制御することを証明した2つの決定ルールを提供する。
本手法は,高次元実世界のデータセットから得られた空間的位置とタンパク質間相互作用グラフを用いた遺伝子発現タスクの2つの情報源で検証する。
関連論文リスト
- Too Correct to Learn: Reinforcement Learning on Saturated Reasoning Data [55.84428098924793]
構造保存探索を行うためのパラメータ自由復号法である Constrained Uniform Top-K Smpling (CUTS) を提案する。
グループ内の利点分散を増幅するために、エクスプロイトと探索的なロールアウトを相乗化するためのトレーニングフレームワークであるMixed-CUTSに統合する。
特にMixed-CUTSは、AIME25ベンチマークのPass@1の精度を標準のGRPOよりも15.1%向上している。
論文 参考訳(メタデータ) (2026-04-20T16:43:28Z) - Learning False Discovery Rate Control via Model-Based Neural Networks [14.45679797184966]
本稿では、FDPとFDRのギャップを狭めるT-Rex Selectorフレームワークの学習強化について紹介する。
提案手法は,解析的FDP推定器を,多様な合成データセットのみを訓練したニューラルネットワークに置き換えることで,FDPのより厳密で正確な近似を可能にする。
論文 参考訳(メタデータ) (2026-02-05T15:53:11Z) - Riemannian Flow Matching for Disentangled Graph Domain Adaptation [51.98961391065951]
グラフドメイン適応(GDA)は典型的には、ユークリッド空間におけるグラフ埋め込みの整列に逆学習を使用する。
DisRFMは、埋め込みとフローベースのトランスポートを統一する幾何学的なGDAフレームワークである。
論文 参考訳(メタデータ) (2026-01-31T11:05:35Z) - ARGUS: Adaptive Rotation-Invariant Geometric Unsupervised System [0.0]
本稿では,データ多様体の固定空間分割上での局所統計追跡としてドリフト検出を再現するフレームワークであるArgusを紹介する。
正準正則フレーム上のボロノイテッセルレーションは変換に不変なドリフト計量をもたらす。
孤立摂動からコヒーレントな分布シフトを区別するドリフト伝播のグラフ理論的特徴付けを開発した。
論文 参考訳(メタデータ) (2026-01-03T22:39:20Z) - Improving constraint-based discovery with robust propagation and reliable LLM priors [13.871152992680152]
高信頼度種子から縁を伝播する因果発見法であるMosaCDを提案する。
次に、最も信頼性の高いエッジを優先し、スケルトンに基づく発見手法と統合可能な、新しい信頼度低下伝搬戦略を適用する。
論文 参考訳(メタデータ) (2025-09-28T02:00:20Z) - Training-Free Stein Diffusion Guidance: Posterior Correction for Sampling Beyond High-Density Regions [46.59494117137471]
自由拡散誘導の訓練は、追加の訓練なしに既成の分類器を活用する柔軟な方法を提供する。
本稿では,SOC を対象とする新たなトレーニングフリーフレームワークである Stein Diffusion Guidance (SDG) を紹介する。
分子低密度サンプリングタスクの実験は、SDGが標準のトレーニングフリーガイダンス手法を一貫して上回っていることを示唆している。
論文 参考訳(メタデータ) (2025-07-07T21:14:27Z) - COIN: Uncertainty-Guarding Selective Question Answering for Foundation Models with Provable Risk Guarantees [51.5976496056012]
COINは、統計的に有効な閾値を校正し、質問毎に1つの生成された回答をフィルタリングする不確実性保護選択フレームワークである。
COINはキャリブレーションセット上で経験的誤差率を推定し、信頼区間法を適用して真誤差率に高い確率上界を確立する。
リスク管理におけるCOINの堅牢性,許容回答を維持するための強いテストタイムパワー,キャリブレーションデータによる予測効率を実証する。
論文 参考訳(メタデータ) (2025-06-25T07:04:49Z) - High-Dimensional False Discovery Rate Control for Dependent Variables [10.86851797584794]
本稿では,変数間の依存関係構造を利用した依存性認識型T-Rexセレクタを提案する。
可変ペナル化機構がFDR制御を保証することを実証する。
グラフィカルモデルとT-Rexフレームワークのパラメータを同時に決定する完全統合最適キャリブレーションアルゴリズムを定式化する。
論文 参考訳(メタデータ) (2024-01-28T22:56:16Z) - Lower bounds in multiple testing: A framework based on derandomized
proxies [107.69746750639584]
本稿では, 各種コンクリートモデルへの適用例を示す, デランドマイズに基づく分析戦略を提案する。
これらの下界のいくつかを数値シミュレーションし、Benjamini-Hochberg (BH) アルゴリズムの実際の性能と密接な関係を示す。
論文 参考訳(メタデータ) (2020-05-07T19:59:51Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。