論文の概要: Shapley-based Explainable AI for Clustering Applications in Fault
Diagnosis and Prognosis
- arxiv url: http://arxiv.org/abs/2303.14581v1
- Date: Sat, 25 Mar 2023 23:13:11 GMT
- ステータス: 処理完了
- システム内更新日: 2023-03-28 18:56:33.886548
- Title: Shapley-based Explainable AI for Clustering Applications in Fault
Diagnosis and Prognosis
- Title(参考訳): shapleyベースの説明可能なaiによる障害診断と予後のクラスタリング
- Authors: Joseph Cohen, Xun Huan, Jun Ni
- Abstract要約: 本稿では,半教師付き学習問題に対応する新しいクラスタリングフレームワークとして,Shapley値を活用する可能性について検討する。
Shapley値に基づく半教師付きクラスタリングは、完全に教師なしの場合と比較してクラスタリング品質を大幅に改善する。
これらのクラスタは、元の特徴値の観点から、高精度な決定ルールを特徴付けることもできる。
- 参考スコア(独自算出の注目度): 1.0742675209112622
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Data-driven artificial intelligence models require explainability in
intelligent manufacturing to streamline adoption and trust in modern industry.
However, recently developed explainable artificial intelligence (XAI)
techniques that estimate feature contributions on a model-agnostic level such
as SHapley Additive exPlanations (SHAP) have not yet been evaluated for
semi-supervised fault diagnosis and prognosis problems characterized by class
imbalance and weakly labeled datasets. This paper explores the potential of
utilizing Shapley values for a new clustering framework compatible with
semi-supervised learning problems, loosening the strict supervision requirement
of current XAI techniques. This broad methodology is validated on two case
studies: a heatmap image dataset obtained from a semiconductor manufacturing
process featuring class imbalance, and a benchmark dataset utilized in the 2021
Prognostics and Health Management (PHM) Data Challenge. Semi-supervised
clustering based on Shapley values significantly improves upon clustering
quality compared to the fully unsupervised case, deriving information-dense and
meaningful clusters that relate to underlying fault diagnosis model
predictions. These clusters can also be characterized by high-precision
decision rules in terms of original feature values, as demonstrated in the
second case study. The rules, limited to 1-2 terms utilizing original feature
scales, describe 12 out of the 16 derived equipment failure clusters with
precision exceeding 0.85, showcasing the promising utility of the explainable
clustering framework for intelligent manufacturing applications.
- Abstract(参考訳): データ駆動人工知能モデルは、現代産業の採用と信頼を合理化するために、インテリジェントな製造における説明可能性を必要とする。
しかし、最近開発されたXAI技術は、SHAP(SHapley Additive exPlanations)のようなモデル非依存レベルでの特徴的貢献を推定し、半教師付き断層診断や、クラス不均衡と弱いラベル付きデータセットを特徴とする予後問題に対してはまだ評価されていない。
本稿では、半教師付き学習問題に対応する新しいクラスタリングフレームワークにShapley値を活用する可能性について検討し、現在のXAI技術の厳格な監督要件を緩和する。
本手法は, クラス不均衡を特徴とする半導体製造プロセスから得られた熱マップ画像データセットと, 2021 Prognostics and Health Management (PHM) Data Challengeで使用されるベンチマークデータセットの2つのケーススタディで検証された。
シェープリー値に基づく半教師付きクラスタリングは、完全な教師なしケースと比較してクラスタリング品質を著しく改善し、基盤となる故障診断モデル予測に関連する情報密度と意味のあるクラスタを導出する。
これらのクラスターは、第2のケーススタディで示されるように、元の特徴量の観点から高い精度の決定規則によって特徴づけられる。
このルールは、オリジナルの特徴尺度を利用した1-2項に限定されており、0.85を超える精度の16の機器故障クラスタのうち12が記述されており、インテリジェントな製造アプリケーションのための説明可能なクラスタリングフレームワークの有望な有用性を示している。
関連論文リスト
- Intuitionistic Fuzzy Universum Twin Support Vector Machine for Imbalanced Data [0.0]
機械学習手法の大きな問題の1つは、不均衡なデータセットを分類することである。
不均衡データ(IFUTSVM-ID)のための直観的ファジィユニバームツインサポートベクトルマシンを提案する。
雑音や外周の影響を軽減するため,直観主義的なファジィ・メンバシップ・スキームを用いる。
論文 参考訳(メタデータ) (2024-10-27T04:25:42Z) - High-dimensional Analysis of Knowledge Distillation: Weak-to-Strong Generalization and Scaling Laws [32.61980466814528]
隆起のない高次元回帰のために, このプロセスの鋭い特徴付けを行う。
弱い特徴を捨てることの利点と限界を明らかにする最適代理モデルの形式を同定する。
我々は、リッジレス回帰とニューラルネットワークアーキテクチャの両方に関する数値実験の結果を検証する。
論文 参考訳(メタデータ) (2024-10-24T15:22:53Z) - Directly Handling Missing Data in Linear Discriminant Analysis for Enhancing Classification Accuracy and Interpretability [1.4840867281815378]
重み付き欠失線形判別分析(WLDA)と呼ばれる新しい頑健な分類法を提案する。
WLDAは線形判別分析(LDA)を拡張して、計算不要な値でデータセットを処理する。
我々はWLDAの特性を確立するために詳細な理論解析を行い、その説明可能性について徹底的に評価する。
論文 参考訳(メタデータ) (2024-06-30T14:21:32Z) - TWINS: A Fine-Tuning Framework for Improved Transferability of
Adversarial Robustness and Generalization [89.54947228958494]
本稿では,様々な分類タスクにおいて,逆向きに事前訓練されたモデルの微調整に焦点を当てる。
本稿では,TWINS(Two-WIng NormliSation)ファインチューニングフレームワークを提案する。
TWINSは、一般化とロバスト性の両方の観点から、幅広い画像分類データセットに有効であることが示されている。
論文 参考訳(メタデータ) (2023-03-20T14:12:55Z) - Rethinking Log Odds: Linear Probability Modelling and Expert Advice in
Interpretable Machine Learning [8.831954614241234]
線形化付加モデル(LAM)とSubscaleHedgeの2つの拡張を含む、解釈可能な機械学習モデルのファミリーを紹介する。
LAMは、GAM(General Additive Models)におけるユビキタスなロジスティックリンク関数を置き換えるものであり、SubscaleHedgeはサブスケールと呼ばれる機能のサブセットでトレーニングされたベースモデルを組み合わせるためのエキスパートアドバイスアルゴリズムである。
論文 参考訳(メタデータ) (2022-11-11T17:21:57Z) - Tree-Guided Rare Feature Selection and Logic Aggregation with Electronic
Health Records Data [7.422597776308963]
希少な二項特徴を持つ大規模回帰のための木誘導的特徴選択と論理集約手法を提案する。
EHRデータを用いた自殺リスクスタディでは、我々のアプローチは、以前のメンタルヘルス診断を選択して集約することができる。
論文 参考訳(メタデータ) (2022-06-18T03:52:43Z) - Generative Modeling Helps Weak Supervision (and Vice Versa) [87.62271390571837]
本稿では,弱い監督と生成的敵ネットワークを融合したモデルを提案する。
弱い監督によるラベル推定と並行して、データの離散変数をキャプチャする。
これは、弱い教師付き合成画像と擬似ラベルによるデータ拡張を可能にする最初のアプローチである。
論文 参考訳(メタデータ) (2022-03-22T20:24:21Z) - Pessimistic Q-Learning for Offline Reinforcement Learning: Towards
Optimal Sample Complexity [51.476337785345436]
有限水平マルコフ決定過程の文脈におけるQ-ラーニングの悲観的変種について検討する。
ほぼ最適サンプル複雑性を実現するために,分散再現型悲観的Q-ラーニングアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-02-28T15:39:36Z) - A multi-stage machine learning model on diagnosis of esophageal
manometry [50.591267188664666]
このフレームワークには、飲み込みレベルにおけるディープラーニングモデルと、学習レベルにおける機能ベースの機械学習モデルが含まれている。
これは、生のマルチスワローデータからHRM研究のCC診断を自動的に予測する最初の人工知能モデルである。
論文 参考訳(メタデータ) (2021-06-25T20:09:23Z) - Good Classifiers are Abundant in the Interpolating Regime [64.72044662855612]
補間分類器間のテストエラーの完全な分布を正確に計算する手法を開発した。
テストエラーは、最悪の補間モデルのテストエラーから大きく逸脱する、小さな典型的な$varepsilon*$に集中する傾向にある。
以上の結果から,統計的学習理論における通常の解析手法は,実際に観測された優れた一般化性能を捉えるのに十分な粒度にはならない可能性が示唆された。
論文 参考訳(メタデータ) (2020-06-22T21:12:31Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。