論文の概要: Joints in Random Forests
- arxiv url: http://arxiv.org/abs/2006.14937v3
- Date: Thu, 19 Nov 2020 16:15:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-17 02:47:21.008480
- Title: Joints in Random Forests
- Title(参考訳): ランダム森林における関節
- Authors: Alvaro H. C. Correia, Robert Peharz, Cassio de Campos
- Abstract要約: 決定木(DT)とランダムフォレスト(RF)は、日々の機械学習実践者やデータ科学者にとって重要な、強力な識別学習者およびツールである。
本稿では、DTとRFは確率回路との接続を描画することで、自然に生成モデルと解釈できることを示す。
この再解釈は特徴空間に完全結合分布を持たせ、生成決定木(GeDT)と生成森林(GeF)へと導く。
- 参考スコア(独自算出の注目度): 13.096855747795303
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: Decision Trees (DTs) and Random Forests (RFs) are powerful discriminative
learners and tools of central importance to the everyday machine learning
practitioner and data scientist. Due to their discriminative nature, however,
they lack principled methods to process inputs with missing features or to
detect outliers, which requires pairing them with imputation techniques or a
separate generative model. In this paper, we demonstrate that DTs and RFs can
naturally be interpreted as generative models, by drawing a connection to
Probabilistic Circuits, a prominent class of tractable probabilistic models.
This reinterpretation equips them with a full joint distribution over the
feature space and leads to Generative Decision Trees (GeDTs) and Generative
Forests (GeFs), a family of novel hybrid generative-discriminative models. This
family of models retains the overall characteristics of DTs and RFs while
additionally being able to handle missing features by means of marginalisation.
Under certain assumptions, frequently made for Bayes consistency results, we
show that consistency in GeDTs and GeFs extend to any pattern of missing input
features, if missing at random. Empirically, we show that our models often
outperform common routines to treat missing data, such as K-nearest neighbour
imputation, and moreover, that our models can naturally detect outliers by
monitoring the marginal probability of input features.
- Abstract(参考訳): 決定木(DT)とランダムフォレスト(RF)は、日々の機械学習実践者やデータ科学者にとって重要な、強力な識別学習者およびツールである。
しかし、その差別的な性質のため、特徴の欠如した入力を処理したり、外れ値を検出するための原則的な方法が欠如しているため、計算技術や別個の生成モデルと組み合わせる必要がある。
本稿では,DTとRFが自然に生成モデルとして解釈可能であることを示す。
この再解釈は、それらに特徴空間上の完全な合同分布を与え、新しいハイブリッド生成判別モデル群である生成決定木(gedts)と生成森林(gefs)をもたらす。
このモデルのファミリはDTとRFの全体的な特性を保持しつつ、余剰化によって欠落した特徴を扱える。
ベイズ整合性の結果に対して頻繁に行われる仮定では、GeDTとGeFの整合性は、ランダムに欠落した場合に、欠落した入力特徴のパターンに拡張される。
経験的に、我々のモデルは、K-アネレスト近接計算のような欠落データを扱う一般的なルーチンよりも優れており、また、入力特徴の限界確率を監視して自然に外れ値を検出することができることを示す。
関連論文リスト
- Gaussian Mixture Models for Affordance Learning using Bayesian Networks [50.18477618198277]
Affordancesはアクション、オブジェクト、エフェクト間の関係の基本的な記述である。
本稿では,世界を探究し,その感覚経験から自律的にこれらの余裕を学習するエンボディエージェントの問題にアプローチする。
論文 参考訳(メタデータ) (2024-02-08T22:05:45Z) - Accurate generation of stochastic dynamics based on multi-model
Generative Adversarial Networks [0.0]
GAN(Generative Adversarial Networks)は、テキストや画像生成などの分野において大きな可能性を秘めている。
ここでは、格子上の原型過程に適用することにより、このアプローチを定量的に検証する。
重要なことに、ノイズにもかかわらずモデルの離散性は維持される。
論文 参考訳(メタデータ) (2023-05-25T10:41:02Z) - Bayesian Networks for the robust and unbiased prediction of depression
and its symptoms utilizing speech and multimodal data [65.28160163774274]
我々は,抑うつ,抑うつ症状,および,胸腺で収集された音声,表情,認知ゲームデータから得られる特徴の関連性を把握するためにベイズ的枠組みを適用した。
論文 参考訳(メタデータ) (2022-11-09T14:48:13Z) - Relational Neural Markov Random Fields [29.43155380361715]
複雑なハイブリッドドメインの処理が可能な Markov Random Fields (RN-MRFs) を導入する。
本稿では,潜在的なパラメータを学習する上で重要となる擬似的推定に基づく学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-10-18T22:52:54Z) - Continual Learning with Fully Probabilistic Models [70.3497683558609]
機械学習の完全確率的(または生成的)モデルに基づく継続的学習のアプローチを提案する。
生成器と分類器の両方に対してガウス混合モデル(GMM)インスタンスを用いた擬似リハーサル手法を提案する。
我々は,GMRが,クラス増分学習問題に対して,非常に競合的な時間とメモリの複雑さで,最先端のパフォーマンスを達成することを示す。
論文 参考訳(メタデータ) (2021-04-19T12:26:26Z) - Dense open-set recognition with synthetic outliers generated by Real NVP [1.278093617645299]
我々は,共同学習型合成外乱器を用いた識別訓練に基づく外乱検出手法を検討する。
本手法は, 同時セマンティックセグメンテーションと高密度外乱検出に適応可能であることを示す。
フォワードパスが1つしかない予測を生成するにもかかわらず、我々のモデルは、最先端技術に関して競争的に機能する。
論文 参考訳(メタデータ) (2020-11-22T19:40:26Z) - Identification of Probability weighted ARX models with arbitrary domains [75.91002178647165]
PieceWise Affineモデルは、ハイブリッドシステムの他のクラスに対する普遍近似、局所線型性、同値性を保証する。
本研究では,任意の領域を持つ固有入力モデル(NPWARX)を用いたPieceWise Auto Regressiveの同定に着目する。
このアーキテクチャは、機械学習の分野で開発されたMixture of Expertの概念に従って考案された。
論文 参考訳(メタデータ) (2020-09-29T12:50:33Z) - Open Set Recognition with Conditional Probabilistic Generative Models [51.40872765917125]
オープンセット認識のための条件付き確率生成モデル(CPGM)を提案する。
CPGMは未知のサンプルを検出できるが、異なる潜在特徴を条件付きガウス分布に近似させることで、既知のクラスを分類できる。
複数のベンチマークデータセットの実験結果から,提案手法がベースラインを著しく上回ることがわかった。
論文 参考訳(メタデータ) (2020-08-12T06:23:49Z) - Towards Robust Classification with Deep Generative Forests [13.096855747795303]
決定木とランダムフォレストは最も広く使われている機械学習モデルの一つである。
主に識別モデルであるため、予測の不確実性を操作するための原則的な方法が欠けている。
我々はジェネレーティブフォレスト(GeF)を利用してランダムフォレストを特徴空間上の全関節分布を表す生成モデルに拡張する。
論文 参考訳(メタデータ) (2020-07-11T08:57:52Z) - GANs with Conditional Independence Graphs: On Subadditivity of
Probability Divergences [70.30467057209405]
GAN(Generative Adversarial Networks)は、データセットの基盤となる分布を学習するための現代的な手法である。
GANは、基礎となるディストリビューションに関する追加情報がないモデルフリーで設計されている。
本稿では,ベイズネット/MRFの近傍に単純な識別器群を用いたモデルベースGANの設計を提案する。
論文 参考訳(メタデータ) (2020-03-02T04:31:22Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。