論文の概要: Attribute-based Explanations of Non-Linear Embeddings of
High-Dimensional Data
- arxiv url: http://arxiv.org/abs/2108.08706v1
- Date: Wed, 28 Jul 2021 12:09:29 GMT
- ステータス: 処理完了
- システム内更新日: 2021-08-22 14:35:45.137400
- Title: Attribute-based Explanations of Non-Linear Embeddings of
High-Dimensional Data
- Title(参考訳): 高次元データの非線形埋め込みの属性に基づく説明
- Authors: Jan-Tobias Sohns, Michaela Schmitt, Fabian Jirasek, Hans Hasse, and
Heike Leitte
- Abstract要約: NoLiES(Non-linear Embeddings Surveyor)は、投影されたデータ(レンジセット)に対する新しい拡張戦略と、小さな多重環境でのインタラクティブな分析を組み合わせたものである。
Rangesetsはバイナリ属性値に対して,セットベースの視覚化アプローチを使用する。
- 参考スコア(独自算出の注目度): 2.397739143553337
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Embeddings of high-dimensional data are widely used to explore data, to
verify analysis results, and to communicate information. Their explanation, in
particular with respect to the input attributes, is often difficult. With
linear projects like PCA the axes can still be annotated meaningfully. With
non-linear projections this is no longer possible and alternative strategies
such as attribute-based color coding are required. In this paper, we review
existing augmentation techniques and discuss their limitations. We present the
Non-Linear Embeddings Surveyor (NoLiES) that combines a novel augmentation
strategy for projected data (rangesets) with interactive analysis in a small
multiples setting. Rangesets use a set-based visualization approach for binned
attribute values that enable the user to quickly observe structure and detect
outliers. We detail the link between algebraic topology and rangesets and
demonstrate the utility of NoLiES in case studies with various challenges
(complex attribute value distribution, many attributes, many data points) and a
real-world application to understand latent features of matrix completion in
thermodynamics.
- Abstract(参考訳): 高次元データの埋め込みは、データ探索、分析結果の検証、情報伝達に広く利用されている。
それらの説明は、特に入力属性に関して、しばしば困難である。
pcaのような線形プロジェクトでは、軸は意味のある注釈を付けることができる。
非線形投影では、これはもはや不可能であり、属性ベースのカラーコーディングのような代替戦略が必要である。
本稿では,既存の拡張手法を概観し,その限界について論じる。
本稿では,投影データ (rangesets) に対する新しい拡張戦略と,小さな多重化環境での対話的解析を組み合わせた非線形埋め込みサーベイヤー(nolies)を提案する。
rangesetは、binned属性値のセットベースの視覚化アプローチを使用して、ユーザが構造をすばやく観察し、異常値を検出することができる。
代数トポロジーとレンジセットの関係を詳述し、様々な課題(複合属性値分布、多くの属性、多くのデータポイント)と熱力学における行列完備の潜在的特徴を理解するための実世界応用に関するケーススタディにおいて、ノリーの有用性を実証する。
関連論文リスト
- Prospector Heads: Generalized Feature Attribution for Large Models & Data [82.02696069543454]
本稿では,説明に基づく帰属手法の効率的かつ解釈可能な代替手段であるプロスペクタヘッドを紹介する。
入力データにおけるクラス固有のパターンの解釈と発見を、プロファイラヘッドがいかに改善できるかを実証する。
論文 参考訳(メタデータ) (2024-02-18T23:01:28Z) - FATE: Feature-Agnostic Transformer-based Encoder for learning
generalized embedding spaces in flow cytometry data [4.550634499956126]
我々は,潜在的な特徴集合の交わりに入力空間を拘束することなく,様々な特徴を持つデータを有効に活用することを目的としている。
特徴量の整合を必要とせずに直接データを処理できる新しいアーキテクチャを提案する。
本モデルの利点は, 急性骨髄性白血病の血流データにおける癌細胞の自動検出である。
論文 参考訳(メタデータ) (2023-11-06T18:06:38Z) - Learning Representations without Compositional Assumptions [79.12273403390311]
本稿では,特徴集合をグラフノードとして表現し,それらの関係を学習可能なエッジとして表現することで,特徴集合の依存関係を学習するデータ駆動型アプローチを提案する。
また,複数のビューから情報を動的に集約するために,より小さな潜在グラフを学習する新しい階層グラフオートエンコーダLEGATOを導入する。
論文 参考訳(メタデータ) (2023-05-31T10:36:10Z) - infoVerse: A Universal Framework for Dataset Characterization with
Multidimensional Meta-information [68.76707843019886]
infoVerseは、データセットの特徴付けのための普遍的なフレームワークである。
infoVerseは、様々なモデル駆動メタ情報を統合することで、データセットの多次元特性をキャプチャする。
実世界の3つのアプリケーション(データプルーニング、アクティブラーニング、データアノテーション)において、infoVerse空間で選択されたサンプルは、強いベースラインを一貫して上回る。
論文 参考訳(メタデータ) (2023-05-30T18:12:48Z) - Feature construction using explanations of individual predictions [0.0]
本稿では,予測モデルのインスタンスベース説明の集約に基づく探索空間の削減手法を提案する。
これらのグループに対する探索の削減が特徴構築の時間を大幅に短縮することを実証的に示す。
いくつかの分類器の分類精度を大幅に向上させ,大規模データセットにおいても提案する特徴構築の実現可能性を示した。
論文 参考訳(メタデータ) (2023-01-23T18:59:01Z) - Siamese Attribute-missing Graph Auto-encoder [35.79233150253881]
我々は,Samese Attribute-missing Graph Auto-Encoder (SAGA)を提案する。
まず、両方のプロセスで学習したパラメータを共有するために、シアムネットワーク構造を導入することで、属性の埋め込みと構造埋め込みを絡み合わせる。
第二に, K-nearest neighbor (KNN) と構造制約強化学習機構を導入し, 欠落属性の潜伏特性の質を向上させる。
論文 参考訳(メタデータ) (2021-12-09T11:21:31Z) - Adaptive Attribute and Structure Subspace Clustering Network [49.040136530379094]
自己表現型サブスペースクラスタリングネットワークを提案する。
まず、入力データサンプルを表現する自動エンコーダについて検討する。
そこで我々は, 局所的な幾何学的構造を捉えるために, 混合符号と対称構造行列を構築した。
構築された属性構造と行列に対して自己表現を行い、親和性グラフを学習する。
論文 参考訳(メタデータ) (2021-09-28T14:00:57Z) - Transforming Feature Space to Interpret Machine Learning Models [91.62936410696409]
この貢献は、特徴空間変換のレンズを通して機械学習モデルを解釈する新しいアプローチを提案する。
非条件的および条件付きポストホック診断ツールの拡張に使用できる。
提案手法の可能性を実証するために,46特徴のリモートセンシング土地被覆分類の事例研究を行った。
論文 参考訳(メタデータ) (2021-04-09T10:48:11Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。