論文の概要: Local Multi-Label Explanations for Random Forest
- arxiv url: http://arxiv.org/abs/2207.01994v1
- Date: Tue, 5 Jul 2022 12:21:55 GMT
- ステータス: 処理完了
- システム内更新日: 2022-07-06 13:57:12.644324
- Title: Local Multi-Label Explanations for Random Forest
- Title(参考訳): ランダム森林の局所的マルチラベル説明
- Authors: Nikolaos Mylonas, Ioannis Mollas, Nick Bassiliades, Grigorios
Tsoumakas
- Abstract要約: マルチラベル分類は、特に予測されるラベルの数が大きい領域では難しい課題である。
本研究では,この手法を多ラベル分類問題に適用し,説明がカバーするラベルに関する3つの異なる戦略を採用する。
- 参考スコア(独自算出の注目度): 9.966945442218554
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Multi-label classification is a challenging task, particularly in domains
where the number of labels to be predicted is large. Deep neural networks are
often effective at multi-label classification of images and textual data. When
dealing with tabular data, however, conventional machine learning algorithms,
such as tree ensembles, appear to outperform competition. Random forest, being
a popular ensemble algorithm, has found use in a wide range of real-world
problems. Such problems include fraud detection in the financial domain, crime
hotspot detection in the legal sector, and in the biomedical field, disease
probability prediction when patient records are accessible. Since they have an
impact on people's lives, these domains usually require decision-making systems
to be explainable. Random Forest falls short on this property, especially when
a large number of tree predictors are used. This issue was addressed in a
recent research named LionForests, regarding single label classification and
regression. In this work, we adapt this technique to multi-label classification
problems, by employing three different strategies regarding the labels that the
explanation covers. Finally, we provide a set of qualitative and quantitative
experiments to assess the efficacy of this approach.
- Abstract(参考訳): マルチラベル分類は、特に予測されるラベルの数が大きい領域では難しい課題である。
ディープニューラルネットワークはしばしば画像とテキストデータのマルチラベル分類に有効である。
しかし、表データを扱う場合、ツリーアンサンブルのような従来の機械学習アルゴリズムは、競合を上回っているように見える。
ランダムフォレストは、一般的なアンサンブルアルゴリズムであり、様々な現実世界の問題に使われている。
このような問題には、金融分野における不正検出、法律分野における犯罪ホットスポット検出、医療分野における患者記録にアクセス可能な場合の疾病確率予測などが含まれる。
人々の生活に影響を及ぼすため、これらのドメインは説明可能な意思決定システムを必要とする。
ランダムフォレストはこの性質に欠けており、特に多くの樹木予測器が使用される場合である。
この問題は、シングルラベルの分類と回帰に関するLionForestsという最近の研究で解決された。
本研究では,この手法をマルチラベル分類問題に適用し,説明がカバーするラベルに関する3つの異なる戦略を採用する。
最後に,本手法の有効性を評価するための質的,定量的な実験のセットを提案する。
関連論文リスト
- A Review of Pseudo-Labeling for Computer Vision [2.79239659248295]
ディープニューラルネットワークは、しばしば効果的に一般化するためにラベル付きサンプルの大きなデータセットを必要とする。
活発な研究の重要な領域は半教師あり学習であり、代わりに大量の(容易に取得された)未ラベルのサンプルを使おうとする。
本研究では,自己監督手法と教師なし手法の両方において,擬似ラベルのより広範な解釈について検討する。
論文 参考訳(メタデータ) (2024-08-13T22:17:48Z) - Multi-task Explainable Skin Lesion Classification [54.76511683427566]
少ないラベル付きデータでよく一般化する皮膚病変に対する数発のショットベースアプローチを提案する。
提案手法は,アテンションモジュールや分類ネットワークとして機能するセグメンテーションネットワークの融合を含む。
論文 参考訳(メタデータ) (2023-10-11T05:49:47Z) - Class-Distribution-Aware Pseudo Labeling for Semi-Supervised Multi-Label
Learning [97.88458953075205]
Pseudo-labelingは、ラベルなしデータを利用するための人気で効果的なアプローチとして登場した。
本稿では,クラスアウェアの擬似ラベル処理を行うCAP(Class-Aware Pseudo-Labeling)という新しい手法を提案する。
論文 参考訳(メタデータ) (2023-05-04T12:52:18Z) - Neuroevolutionary algorithms driven by neuron coverage metrics for
semi-supervised classification [60.60571130467197]
一部の機械学習アプリケーションでは、ラベル付けされていないインスタンスが豊富であるのに対して、教師付き分類のためのラベル付きインスタンスの可用性は制限されている。
本稿では、ニューラルネットワークアーキテクチャ上で計算されたニューラルネットワークカバレッジメトリクスを用いて、未ラベルのインスタンスを利用する神経進化的アプローチを提案する。
論文 参考訳(メタデータ) (2023-03-05T23:38:44Z) - Multi-Label Quantification [78.83284164605473]
定量化とは、教師なしデータサンプルにおいて、興味あるクラスの相対周波数の予測子を生成する教師付き学習課題である。
本研究では,その相対頻度をより正確に予測するために,興味あるクラス間の依存関係を活用しようとするクラス有病率値の推定手法を提案する。
論文 参考訳(メタデータ) (2022-11-15T11:29:59Z) - Deep learning for understanding multilabel imbalanced Chest X-ray
datasets [7.885207996427683]
本稿では,不均衡な胸部X線データセットに対するディープラーニング手法を提案する。
現在使用されていないPadChestデータセットと、ヒートマップに基づいた新しいeXplainable AIテクニックのベースラインを確立する。
特にラベルの数を考えると,本システムの結果は有望である。
論文 参考訳(メタデータ) (2022-07-28T23:19:53Z) - Decision-forest voting scheme for classification of rare classes in
network intrusion detection [0.0]
本研究の目的は,オペレーティングマルウェア検出システムの検出能力を向上することである。
このアルゴリズムは、大量のデータを効果的に処理し、意思決定林の訓練に使用される最先端のアルゴリズムのほとんどと併用することができる。
論文 参考訳(メタデータ) (2021-07-25T18:01:12Z) - Theoretical Insights Into Multiclass Classification: A High-dimensional
Asymptotic View [82.80085730891126]
線形多クラス分類の最初の現代的精度解析を行う。
分析の結果,分類精度は分布に依存していることがわかった。
得られた洞察は、他の分類アルゴリズムの正確な理解の道を開くかもしれない。
論文 参考訳(メタデータ) (2020-11-16T05:17:29Z) - Joint Visual and Temporal Consistency for Unsupervised Domain Adaptive
Person Re-Identification [64.37745443119942]
本稿では,局所的なワンホット分類とグローバルなマルチクラス分類を組み合わせることで,視覚的・時間的整合性を両立させる。
3つの大規模ReIDデータセットの実験結果は、教師なしと教師なしの両方のドメイン適応型ReIDタスクにおいて提案手法の優位性を示す。
論文 参考訳(メタデータ) (2020-07-21T14:31:27Z) - Exemplar Auditing for Multi-Label Biomedical Text Classification [0.4873362301533824]
我々は、最近提案されたゼロショットシーケンスラベリング手法「畳み込み分解による教師付きラベリング」を一般化する。
この手法は"イントロスペクション(introspection)"と分類され、推論時間予測のきめ細かい特徴を最も近い隣人に関連付ける。
提案手法は,医療従事者に対して,モデルの予測を駆動する健全な特徴を理解する上で,競争力のある分類モデルと尋問メカニズムの両方を提供する。
論文 参考訳(メタデータ) (2020-04-07T02:54:20Z) - Multi-label Prediction in Time Series Data using Deep Neural Networks [19.950094635430048]
本稿では,多次元時系列データに対するマルチラベル予測故障分類問題に対処する。
提案アルゴリズムは2つの公開ベンチマークデータセットで検証される。
論文 参考訳(メタデータ) (2020-01-27T21:35:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。