論文の概要: Classification by estimating the cumulative distribution function for
small data
- arxiv url: http://arxiv.org/abs/2210.05953v1
- Date: Wed, 12 Oct 2022 06:36:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-13 15:13:19.236536
- Title: Classification by estimating the cumulative distribution function for
small data
- Title(参考訳): 小データの累積分布関数の推定による分類
- Authors: Meng-Xian Zhua and Yuan-Hai Shao
- Abstract要約: 与えられたデータの条件付き確率関数を推定して分類問題を考察する。
新しい予測リスク推定の主な特徴は、入力空間の分布に対するリスクを測定することである。
新たなメカニズムに基づく分類モデルと分類評価指標が従来のものと異なる点に留意する必要がある。
- 参考スコア(独自算出の注目度): 4.3454147188676595
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In this paper, we study the classification problem by estimating the
conditional probability function of the given data. Different from the
traditional expected risk estimation theory on empirical data, we calculate the
probability via Fredholm equation, this leads to estimate the distribution of
the data. Based on the Fredholm equation, a new expected risk estimation theory
by estimating the cumulative distribution function is presented. The main
characteristics of the new expected risk estimation is to measure the risk on
the distribution of the input space. The corresponding empirical risk
estimation is also presented, and an $\varepsilon$-insensitive $L_{1}$
cumulative support vector machines ($\varepsilon$-$L_{1}$VSVM) is proposed by
introducing an insensitive loss. It is worth mentioning that the classification
models and the classification evaluation indicators based on the new mechanism
are different from the traditional one. Experimental results show the
effectiveness of the proposed $\varepsilon$-$L_{1}$VSVM and the corresponding
cumulative distribution function indicator on validity and interpretability of
small data classification.
- Abstract(参考訳): 本稿では,与えられたデータの条件付き確率関数を推定して分類問題を考察する。
実験データに対する従来の予測リスク推定理論とは異なり、フレドホルム方程式を用いて確率を計算することにより、データの分布を推定する。
フレッドホルム方程式に基づいて、累積分布関数を推定して予測される新たなリスク推定理論を示す。
新しい予測リスク推定の主な特徴は、入力空間の分布に対するリスクを測定することである。
対応する経験的リスク推定も提示され、インセンティブ損失を導入して、$\varepsilon$-insensitive $L_{1}$ cumulative support vector machines(\varepsilon$-$L_{1}$VSVM)が提案される。
新たなメカニズムに基づく分類モデルと分類評価指標が従来のものと異なる点に注意が必要である。
実験の結果,提案した$\varepsilon$-$L_{1}$VSVMと対応する累積分布関数インジケータが,データ分類の有効性と解釈性に与える影響が示された。
関連論文リスト
- Rejection via Learning Density Ratios [50.91522897152437]
拒絶による分類は、モデルを予測しないことを許容する学習パラダイムとして現れます。
そこで我々は,事前学習したモデルの性能を最大化する理想的なデータ分布を求める。
私たちのフレームワークは、クリーンでノイズの多いデータセットで実証的にテストされます。
論文 参考訳(メタデータ) (2024-05-29T01:32:17Z) - R-divergence for Estimating Model-oriented Distribution Discrepancy [37.939239477868796]
モデル指向分布の相違性を評価するために設計されたR分割を導入する。
R-発散は混合データ上で最小の仮説を学習し、その間に経験的リスク差を測る。
教師なしタスクおよび教師なしタスクにおけるテストパワーの評価を行い、R分割が最先端のパフォーマンスを達成することを確認する。
論文 参考訳(メタデータ) (2023-10-02T11:30:49Z) - Transfer Learning with Random Coefficient Ridge Regression [2.0813318162800707]
ランダム係数のリッジ回帰は、高次元設定における固定係数回帰の重要な代替となる。
本稿では,移動学習の設定におけるランダム係数リッジ回帰の推定と予測について考察する。
論文 参考訳(メタデータ) (2023-06-28T04:36:37Z) - Variational Classification [51.2541371924591]
我々は,変分オートエンコーダの訓練に用いるエビデンスローバウンド(ELBO)に類似した,モデルの訓練を目的とした変分目的を導出する。
軟質マックス層への入力を潜伏変数のサンプルとして扱うことで, 抽象化された視点から, 潜在的な矛盾が明らかとなった。
我々は、標準ソフトマックス層に見られる暗黙の仮定の代わりに、選択された潜在分布を誘導する。
論文 参考訳(メタデータ) (2023-05-17T17:47:19Z) - Doubly Robust Counterfactual Classification [1.8907108368038217]
本研究では,仮説的(事実とは対照的に)なシナリオ下での意思決定のための新しいツールとして,カウンターファクトの分類について検討する。
本稿では, 一般対物分類器のための2次ロバストな非パラメトリック推定器を提案する。
論文 参考訳(メタデータ) (2023-01-15T22:04:46Z) - Information Processing Equalities and the Information-Risk Bridge [10.451984251615512]
本稿では,統計実験のための2つの新しい情報尺度について紹介する。
我々は,情報量測定と統計的決定問題のベイズリスクとの簡単な幾何学的関係を導出する。
論文 参考訳(メタデータ) (2022-07-25T08:54:36Z) - CARD: Classification and Regression Diffusion Models [51.0421331214229]
本稿では,条件生成モデルと事前学習条件平均推定器を組み合わせた分類と回帰拡散(CARD)モデルを提案する。
おもちゃの例と実世界のデータセットを用いて条件分布予測におけるCARDの卓越した能力を示す。
論文 参考訳(メタデータ) (2022-06-15T03:30:38Z) - Self-Certifying Classification by Linearized Deep Assignment [65.0100925582087]
そこで我々は,PAC-Bayesリスク認定パラダイム内で,グラフ上のメトリックデータを分類するための新しい深層予測器のクラスを提案する。
PAC-Bayesの最近の文献とデータに依存した先行研究に基づいて、この手法は仮説空間上の後続分布の学習を可能にする。
論文 参考訳(メタデータ) (2022-01-26T19:59:14Z) - Marginalization in Bayesian Networks: Integrating Exact and Approximate
Inference [0.0]
欠落データと隠れ変数は、変数のサブセットの限界確率分布を計算する必要がある。
ベイジアンネットワークのグラフィカルな特性を利用した分割・コンカレント手法を開発した。
分類変数の限界確率分布を推定するための効率的でスケーラブルなアルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-12-16T21:49:52Z) - Learning from Similarity-Confidence Data [94.94650350944377]
類似度信頼性(Sconf)データから学習する新しい弱監督学習問題について検討する。
本研究では,Sconfデータのみから計算可能な分類リスクの非バイアス推定器を提案し,推定誤差境界が最適収束率を達成することを示す。
論文 参考訳(メタデータ) (2021-02-13T07:31:16Z) - Nonparametric Estimation of the Fisher Information and Its Applications [82.00720226775964]
本稿では,大きさn$のランダムサンプルからフィッシャー情報の位置推定の問題について考察する。
Bhattacharyaにより提案された推定器を再検討し、収束率の向上を導出する。
クリッピング推定器と呼ばれる新しい推定器を提案する。
論文 参考訳(メタデータ) (2020-05-07T17:21:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。