論文の概要: Multivariate Conformal Selection
- arxiv url: http://arxiv.org/abs/2505.00917v1
- Date: Thu, 01 May 2025 23:33:57 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-05 17:21:19.865873
- Title: Multivariate Conformal Selection
- Title(参考訳): 多変量コンフォーマル選択
- Authors: Tian Bai, Yue Zhao, Xiang Yu, Archer Y. Yang,
- Abstract要約: 本稿では,厳密な不確実性定量化を実現するために,コンフォーマルセレクション(CS)の一般化を提案する。
距離ベーススコアを用いたmCS-distと、微分可能な最適化により最適なスコアを学習するmCS-learnの2つの変種を提示する。
シミュレーションおよび実世界のデータセットの実験により、mCSはFalse Discovery Rate(FDR)制御を維持しながら選択能力を大幅に向上することが示された。
- 参考スコア(独自算出の注目度): 9.431551477608528
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Selecting high-quality candidates from large datasets is critical in applications such as drug discovery, precision medicine, and alignment of large language models (LLMs). While Conformal Selection (CS) provides rigorous uncertainty quantification, it is limited to univariate responses and scalar criteria. To address this issue, we propose Multivariate Conformal Selection (mCS), a generalization of CS designed for multivariate response settings. Our method introduces regional monotonicity and employs multivariate nonconformity scores to construct conformal p-values, enabling finite-sample False Discovery Rate (FDR) control. We present two variants: mCS-dist, using distance-based scores, and mCS-learn, which learns optimal scores via differentiable optimization. Experiments on simulated and real-world datasets demonstrate that mCS significantly improves selection power while maintaining FDR control, establishing it as a robust framework for multivariate selection tasks.
- Abstract(参考訳): 大規模データセットから高品質な候補を選択することは、薬物発見、精密医療、大規模言語モデル(LLM)のアライメントといった応用において重要である。
コンフォーマル選択(CS)は厳密な不確実性定量化を提供するが、単変量応答とスカラー基準に制限される。
この問題に対処するために,多変量対応設定用に設計されたCSの一般化であるMultivarate Conformal Selection (mCS)を提案する。
本手法は局所単調性を導入し,多変量非整合性スコアを用いて共形p値を構築し,有限サンプルFalse Discovery Rate(FDR)制御を実現する。
距離ベーススコアを用いたmCS-distと、微分可能な最適化により最適なスコアを学習するmCS-learnの2つの変種を提示する。
シミュレーションおよび実世界のデータセットの実験により、mCSはFDR制御を維持しながら選択能力を大幅に改善し、多変量選択タスクのための堅牢なフレームワークとして確立した。
関連論文リスト
- Few-shot Steerable Alignment: Adapting Rewards and LLM Policies with Neural Processes [50.544186914115045]
大きな言語モデル(LLM)は、日々のアプリケーションにますます組み込まれています。
個人ユーザの多様な嗜好との整合性を確保することは、重要な課題となっている。
数発のステアライメントのための新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2024-12-18T16:14:59Z) - Optimized Conformal Selection: Powerful Selective Inference After Conformity Score Optimization [4.984656106595651]
本稿では、フレキシブルなデータ駆動モデル最適化後に有効な統計的テスト(選択)を可能にするOptCSを提案する。
我々は,データ再利用が十分であるにもかかわらず,OptCSが正則なp-値を構成する一般的な条件を紹介する。
モデルごとに異なる最適化を行うFDR制御手順を3つ提案する。
論文 参考訳(メタデータ) (2024-11-27T01:40:50Z) - Balancing Diversity and Risk in LLM Sampling: How to Select Your Method and Parameter for Open-Ended Text Generation [60.493180081319785]
本稿では,各復号ステップにおける多様性とリスクのトレードオフを考慮し,トラクションサンプリング手法のキャパシティを推定する体系的手法を提案する。
本研究は,既存のトラクションサンプリング手法を総合的に比較し,パラメータ選択のための実用的なユーザガイドとして機能する。
論文 参考訳(メタデータ) (2024-08-24T14:14:32Z) - Ensemble Kalman Filtering Meets Gaussian Process SSM for Non-Mean-Field and Online Inference [47.460898983429374]
我々は,非平均場(NMF)変動推定フレームワークにアンサンブルカルマンフィルタ(EnKF)を導入し,潜在状態の後方分布を近似する。
EnKFとGPSSMのこの新しい結婚は、変分分布の学習における広範なパラメータ化の必要性をなくすだけでなく、エビデンスの下限(ELBO)の解釈可能でクローズドな近似を可能にする。
得られたEnKF支援オンラインアルゴリズムは、データ適合精度を確保しつつ、モデル正規化を組み込んで過度適合を緩和し、目的関数を具現化する。
論文 参考訳(メタデータ) (2023-12-10T15:22:30Z) - A data-science pipeline to enable the Interpretability of Many-Objective
Feature Selection [0.1474723404975345]
多目的特徴選択(MOFS)アプローチは、4つ以上の目的を用いて、教師付き学習タスクにおける機能のサブセットの関連性を決定する。
本稿では,MOFS結果の解釈と比較においてデータサイエンティストを支援する手法を提案する。
論文 参考訳(メタデータ) (2023-11-30T17:44:22Z) - BOtied: Multi-objective Bayesian optimization with tied multivariate ranks [33.414682601242006]
本稿では,非支配解と結合累積分布関数の極端量子化との自然な関係を示す。
このリンクにより、我々はPareto対応CDFインジケータと関連する取得関数BOtiedを提案する。
種々の合成および実世界の問題に対する実験により,BOtied は最先端MOBO 取得関数より優れていることが示された。
論文 参考訳(メタデータ) (2023-06-01T04:50:06Z) - Variable Selection for Kernel Two-Sample Tests [9.581064100940381]
2サンプルテストの変数選択問題を考察する。
カーネルの最大平均誤差(MMD)に基づく新しいフレームワークを提案する。
提案手法は,分散正規化カーネルMDD統計量の最大化を図った,所定のサイズを持つ変数のサブセットを求める。
論文 参考訳(メタデータ) (2023-02-15T00:39:56Z) - Greedy Search Algorithms for Unsupervised Variable Selection: A
Comparative Study [3.4888132404740797]
本稿では,非監視変数選択に基づく次元還元について述べる。
本稿では,7つの非監視勾配変数選択アルゴリズムの臨界評価について述べる。
本稿では,FSCA(Forward selection component analysis)アルゴリズムで説明された分散の遅延実装を初めて導入し,評価する。
論文 参考訳(メタデータ) (2021-03-03T21:10:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。