論文の概要: Explaining dimensionality reduction results using Shapley values
- arxiv url: http://arxiv.org/abs/2103.05678v1
- Date: Tue, 9 Mar 2021 19:28:10 GMT
- ステータス: 処理完了
- システム内更新日: 2021-03-11 14:42:56.157374
- Title: Explaining dimensionality reduction results using Shapley values
- Title(参考訳): Shapley値を用いた寸法低減結果の説明
- Authors: Wilson Est\'ecio Marc\'ilio J\'unior and Danilo Medeiros Eler
- Abstract要約: 次元還元(dr)技術は様々な応用において一貫して高次元データ分析をサポートする。
DR技法を解釈するために設計された現在の文献的アプローチは、低次元表現のみに焦点を当てたり、特徴間の関係を考慮しないため、特徴の寄与をうまく説明できない。
本稿では,これらの問題に対処するために,Shapley値を用いて次元削減手法の説明を生成し,クラスタ指向解析を用いてこれらのアルゴリズムを解釈する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Dimensionality reduction (DR) techniques have been consistently supporting
high-dimensional data analysis in various applications. Besides the patterns
uncovered by these techniques, the interpretation of DR results based on each
feature's contribution to the low-dimensional representation supports new finds
through exploratory analysis. Current literature approaches designed to
interpret DR techniques do not explain the features' contributions well since
they focus only on the low-dimensional representation or do not consider the
relationship among features. This paper presents ClusterShapley to address
these problems, using Shapley values to generate explanations of dimensionality
reduction techniques and interpret these algorithms using a cluster-oriented
analysis. ClusterShapley explains the formation of clusters and the meaning of
their relationship, which is useful for exploratory data analysis in various
domains. We propose novel visualization techniques to guide the interpretation
of features' contributions on clustering formation and validate our methodology
through case studies of publicly available datasets. The results demonstrate
our approach's interpretability and analysis power to generate insights about
pathologies and patients in different conditions using DR results.
- Abstract(参考訳): 次元還元(dr)技術は様々な応用において一貫して高次元データ分析をサポートする。
これらの手法によって発見されたパターンの他に、各特徴の低次元表現への寄与に基づくdr結果の解釈は探索分析を通じて新たな発見を支持する。
DR技法を解釈するために設計された現在の文献的アプローチは、低次元表現のみに焦点を当てたり、特徴間の関係を考慮しないため、特徴の寄与をうまく説明できない。
本稿では,これらの問題に対処するために,Shapley値を用いて次元削減手法の説明を生成し,クラスタ指向解析を用いてこれらのアルゴリズムを解釈する。
ClusterShapleyは、クラスタの形成とその関係の意味を説明し、さまざまなドメインの探索データ分析に有用である。
クラスター形成における特徴の解釈をガイドし、公開データセットのケーススタディを通じて方法論を検証するための新しい可視化技術を提案する。
その結果、DR結果を用いて病状や患者の状態に関する洞察を生成するアプローチの解釈可能性と分析力を示しています。
関連論文リスト
- Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - The Multiverse of Dynamic Mode Decomposition Algorithms [0.0]
動的モード分解(Dynamic Mode Decomposition, DMD)は、複雑で非線形なシステムをモードに分解するために使われる一般的なデータ駆動分析技術である。
このレビューでは、複雑な非線形力学を線形フレームワークに変換する上でのクープマン作用素の役割を強調した。
論文 参考訳(メタデータ) (2023-11-30T19:00:50Z) - Enhancing Deep Learning Models through Tensorization: A Comprehensive
Survey and Framework [0.0]
本稿では,多次元データソース,様々なマルチウェイ解析手法,およびこれらの手法の利点について考察する。
2次元アルゴリズムとPythonのマルチウェイアルゴリズムを比較したBlind Source separation(BSS)の小さな例を示す。
その結果,マルチウェイ解析の方が表現力が高いことが示唆された。
論文 参考訳(メタデータ) (2023-09-05T17:56:22Z) - Towards a mathematical understanding of learning from few examples with
nonlinear feature maps [68.8204255655161]
トレーニングセットがわずか数個のデータポイントから構成されるデータ分類の問題を考える。
我々は、AIモデルの特徴空間の幾何学、基礎となるデータ分布の構造、モデルの一般化能力との間の重要な関係を明らかにする。
論文 参考訳(メタデータ) (2022-11-07T14:52:58Z) - An Experimental Study of Dimension Reduction Methods on Machine Learning
Algorithms with Applications to Psychometrics [77.34726150561087]
次元の減少は、変数の減少を伴わないのと同じ精度で減少、増大、あるいは達成できることを示す。
我々の暫定的な結果は、次元の減少が分類タスクに使用する場合、より良い性能をもたらす傾向があることを見出した。
論文 参考訳(メタデータ) (2022-10-19T22:07:13Z) - Interactive Dimensionality Reduction for Comparative Analysis [28.52130400665133]
我々は,新しいDR手法であるULCAをインタラクティブなビジュアルインターフェースと統合する,インタラクティブなDRフレームワークを導入する。
ULCAは差別分析とコントラスト学習という2つのDRスキームを統合し、様々な比較分析タスクをサポートする。
我々は,ULCA結果を対話的に洗練する最適化アルゴリズムを開発した。
論文 参考訳(メタデータ) (2021-06-29T15:05:36Z) - HUMAP: Hierarchical Uniform Manifold Approximation and Projection [42.50219822975012]
HUMAPは、局所的・大域的構造の保存に柔軟であるように設計された、新しい階層的次元削減技術である。
提案手法の優位性を示す実証的証拠を現在の階層的アプローチと比較し,データセットラベリングにHUMAPを適用したケーススタディを示す。
論文 参考訳(メタデータ) (2021-06-14T19:27:54Z) - Transforming Feature Space to Interpret Machine Learning Models [91.62936410696409]
この貢献は、特徴空間変換のレンズを通して機械学習モデルを解釈する新しいアプローチを提案する。
非条件的および条件付きポストホック診断ツールの拡張に使用できる。
提案手法の可能性を実証するために,46特徴のリモートセンシング土地被覆分類の事例研究を行った。
論文 参考訳(メタデータ) (2021-04-09T10:48:11Z) - Deep Co-Attention Network for Multi-View Subspace Learning [73.3450258002607]
マルチビューサブスペース学習のための深層コアテンションネットワークを提案する。
共通情報と相補情報の両方を敵意で抽出することを目的としている。
特に、新しいクロス再構成損失を使用し、ラベル情報を利用して潜在表現の構築を誘導する。
論文 参考訳(メタデータ) (2021-02-15T18:46:44Z) - Contrastive analysis for scatter plot-based representations of
dimensionality reduction [0.0]
本稿では,マルチ次元データセットを探索し,クラスタの形成を解釈する手法を提案する。
また,属性がクラスタ形成にどのように影響するかを理解するために使用される統計変数間の関係を視覚的に解釈し,探索する二部グラフも導入する。
論文 参考訳(メタデータ) (2021-01-26T01:16:31Z) - A Diagnostic Study of Explainability Techniques for Text Classification [52.879658637466605]
既存の説明可能性技術を評価するための診断特性のリストを作成する。
そこで本研究では, モデルの性能と有理性との整合性の関係を明らかにするために, 説明可能性手法によって割り当てられた有理性スコアと有理性入力領域の人間のアノテーションを比較した。
論文 参考訳(メタデータ) (2020-09-25T12:01:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。