論文の概要: Don't guess what's true: choose what's optimal. A probability transducer
for machine-learning classifiers
- arxiv url: http://arxiv.org/abs/2302.10578v1
- Date: Tue, 21 Feb 2023 10:14:13 GMT
- ステータス: 処理完了
- システム内更新日: 2023-02-22 15:39:44.504419
- Title: Don't guess what's true: choose what's optimal. A probability transducer
for machine-learning classifiers
- Title(参考訳): 真実を推測するな 最適なものを選ぶんだ
機械学習分類器の確率変換器
- Authors: K. Dyrland, A. S. Lundervold, P.G.L. Porta Mana
- Abstract要約: 医学や薬物発見において、分類の最終的な目標は、クラスを推測するのではなく、可能な一連のクラスの中から最適な行動経路を選択することである。
本研究の主な目的は、特徴ではなく、訓練された分類器の出力に基づいて確率を計算することである。
この計算は安価で、1回だけ行う必要があり、将来の全ての出力に適用できる出力から確率までの「トランスデューサ」を提供する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In fields such as medicine and drug discovery, the ultimate goal of a
classification is not to guess a class, but to choose the optimal course of
action among a set of possible ones, usually not in one-one correspondence with
the set of classes. This decision-theoretic problem requires sensible
probabilities for the classes. Probabilities conditional on the features are
computationally almost impossible to find in many important cases. The main
idea of the present work is to calculate probabilities conditional not on the
features, but on the trained classifier's output. This calculation is cheap,
needs to be made only once, and provides an output-to-probability "transducer"
that can be applied to all future outputs of the classifier. In conjunction
with problem-dependent utilities, the probabilities of the transducer allow us
to find the optimal choice among the classes or among a set of more general
decisions, by means of expected-utility maximization. This idea is demonstrated
in a simplified drug-discovery problem with a highly imbalanced dataset. The
transducer and utility maximization together always lead to improved results,
sometimes close to theoretical maximum, for all sets of problem-dependent
utilities. The one-time-only calculation of the transducer also provides,
automatically: (i) a quantification of the uncertainty about the transducer
itself; (ii) the expected utility of the augmented algorithm (including its
uncertainty), which can be used for algorithm selection; (iii) the possibility
of using the algorithm in a "generative mode", useful if the training dataset
is biased.
- Abstract(参考訳): 医学や創薬などの分野において、分類の究極の目標は、クラスを推測することではなく、クラスの集合と1対1の対応ではなく、可能なものの集合の中で最適な行動経路を選択することである。
この決定論的問題は、クラスの賢明な確率を必要とする。
特徴に条件づけられた確率は、多くの重要なケースでほとんど計算不可能である。
本研究の主な考え方は,特徴量ではなく,訓練された分類器の出力に基づいて確率を計算することである。
この計算は安価で、一度だけ行う必要があり、分類器の全ての将来の出力に適用できる出力から確率までの「変換器」を提供する。
問題依存ユーティリティと連携して、トランスデューサの確率は、期待利用の最大化によって、クラスまたはより一般的な決定のセットの中で最適な選択を見つけることができる。
このアイデアは、高度に不均衡なデータセットを持つ簡易な薬物発見問題で実証される。
トランスデューサとユーティリティの最大化は、常に、問題依存ユーティリティのすべての集合に対して、理論上の最大値に近い結果をもたらす。
トランスデューサのワンタイムオンリーな計算も自動的に提供します。
(i) トランスデューサ自体に関する不確かさの定量化
二 アルゴリズム選択に使用できる拡張アルゴリズム(不確実性を含む。)の期待される実用性
(iii) 学習データセットが偏りがある場合に役立つ「生成モード」におけるアルゴリズムの使用の可能性。
関連論文リスト
- Accelerated zero-order SGD under high-order smoothness and overparameterized regime [79.85163929026146]
凸最適化問題を解くための新しい勾配のないアルゴリズムを提案する。
このような問題は医学、物理学、機械学習で発生する。
両種類の雑音下で提案アルゴリズムの収束保証を行う。
論文 参考訳(メタデータ) (2024-11-21T10:26:17Z) - When can you trust feature selection? -- I: A condition-based analysis
of LASSO and generalised hardness of approximation [49.1574468325115]
近似入力を読み取る際に、LASSOのミニミサの正しいサポートセットを(確率$>1/2$で)決定できないことを示す。
不適切な入力の場合、アルゴリズムは永遠に動作するので、間違った答えを出すことはない。
無限条件数を持つ点を含む開集合上で定義される任意のアルゴリズムに対して、アルゴリズムが永久に実行されるか、間違った解を生成するような入力が存在する。
論文 参考訳(メタデータ) (2023-12-18T18:29:01Z) - Nonparametric active learning for cost-sensitive classification [2.1756081703276]
コスト依存型分類のための一般的な非パラメトリック能動学習アルゴリズムを設計する。
我々は、一致した(対数係数まで)下界を提供することにより、得られた上界のほぼ最適性を証明した。
論文 参考訳(メタデータ) (2023-09-30T22:19:21Z) - Experience in Engineering Complex Systems: Active Preference Learning
with Multiple Outcomes and Certainty Levels [1.5257326975704795]
ブラックボックス最適化とは、目的関数と/または制約集合が未知、到達不能、あるいは存在しない問題を指す。
この特定の情報を活用するために、いわゆるActive Preference Learningと呼ばれるアルゴリズムが開発された。
我々のアプローチは、さらなる情報を効果的に活用できるような方法でアルゴリズムを拡張することを目的としている。
論文 参考訳(メタデータ) (2023-02-27T15:55:37Z) - Who Should Predict? Exact Algorithms For Learning to Defer to Humans [40.22768241509553]
従来の手法では,誤分類誤りの少ない人間-AIシステムを見つけることができなかった。
線形設定における問題を最適に解くことができるMILP(mixed-integer-linear-gramming)の定式化について述べる。
実現可能で,実証的にも良好に機能する新規な代理損失関数を提供する。
論文 参考訳(メタデータ) (2023-01-15T21:57:36Z) - Reliability analysis of discrete-state performance functions via
adaptive sequential sampling with detection of failure surfaces [0.0]
本稿では,レアイベント確率推定のための新しい効率的でロバストな手法を提案する。
この手法は、複数の障害タイプの確率を推定することができる。
この情報に対応して、推定確率の精度を高めることができる。
論文 参考訳(メタデータ) (2022-08-04T05:59:25Z) - Efficient and Differentiable Conformal Prediction with General Function
Classes [96.74055810115456]
本稿では,複数の学習可能なパラメータに対する共形予測の一般化を提案する。
本研究は, クラス内において, ほぼ有効な人口被覆率, ほぼ最適効率を実現していることを示す。
実験の結果,提案アルゴリズムは有効な予測セットを学習し,効率を著しく向上できることがわかった。
論文 参考訳(メタデータ) (2022-02-22T18:37:23Z) - Offline Model-Based Optimization via Normalized Maximum Likelihood
Estimation [101.22379613810881]
データ駆動最適化の問題を検討し、一定の点セットでクエリのみを与えられた関数を最大化する必要がある。
この問題は、関数評価が複雑で高価なプロセスである多くの領域に現れる。
我々は,提案手法を高容量ニューラルネットワークモデルに拡張可能なトラクタブル近似を提案する。
論文 参考訳(メタデータ) (2021-02-16T06:04:27Z) - Online Model Selection for Reinforcement Learning with Function
Approximation [50.008542459050155]
我々は、$tildeO(L5/6 T2/3)$ regretで最適な複雑性に適応するメタアルゴリズムを提案する。
また、メタアルゴリズムは、インスタンス依存の後悔境界を著しく改善することを示す。
論文 参考訳(メタデータ) (2020-11-19T10:00:54Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。