論文の概要: Assessing and improving reliability of neighbor embedding methods: a map-continuity perspective
- arxiv url: http://arxiv.org/abs/2410.16608v1
- Date: Tue, 22 Oct 2024 01:40:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-10-23 14:29:41.676172
- Title: Assessing and improving reliability of neighbor embedding methods: a map-continuity perspective
- Title(参考訳): 隣接埋め込み法の信頼性評価と信頼性向上--地図連続性の観点から
- Authors: Zhexuan Liu, Rong Ma, Yiqiao Zhong,
- Abstract要約: 隣接する t-SNE, UMAP, LargeVis などの埋め込み手法は、一般的な可視化手法のファミリーである。
近年の研究では、これらの手法がしばしば視覚的な人工物を生み出し、誤った科学的結論につながる可能性が示唆されている。
本稿では,古典的な統計的概念に基づいて埋め込みマップを学習する,新しい概念的・計算的枠組み LOO-map を紹介する。
- 参考スコア(独自算出の注目度): 2.969441406380581
- License:
- Abstract: Visualizing high-dimensional data is an important routine for understanding biomedical data and interpreting deep learning models. Neighbor embedding methods, such as t-SNE, UMAP, and LargeVis, among others, are a family of popular visualization methods which reduce high-dimensional data to two dimensions. However, recent studies suggest that these methods often produce visual artifacts, potentially leading to incorrect scientific conclusions. Recognizing that the current limitation stems from a lack of data-independent notions of embedding maps, we introduce a novel conceptual and computational framework, LOO-map, that learns the embedding maps based on a classical statistical idea known as the leave-one-out. LOO-map extends the embedding over a discrete set of input points to the entire input space, enabling a systematic assessment of map continuity, and thus the reliability of the visualizations. We find for many neighbor embedding methods, their embedding maps can be intrinsically discontinuous. The discontinuity induces two types of observed map distortion: ``overconfidence-inducing discontinuity," which exaggerates cluster separation, and ``fracture-inducing discontinuity," which creates spurious local structures. Building upon LOO-map, we propose two diagnostic point-wise scores -- perturbation score and singularity score -- to address these limitations. These scores can help identify unreliable embedding points, detect out-of-distribution data, and guide hyperparameter selection. Our approach is flexible and works as a wrapper around many neighbor embedding algorithms. We test our methods across multiple real-world datasets from computer vision and single-cell omics to demonstrate their effectiveness in enhancing the interpretability and accuracy of visualizations.
- Abstract(参考訳): 高次元データの可視化は、バイオメディカルデータを理解し、ディープラーニングモデルを解釈するための重要なルーチンである。
t-SNE、UMAP、LargeVisなどの隣接埋め込み手法は、高次元データを2次元に縮小する一般的な可視化手法のファミリーである。
しかし、最近の研究では、これらの手法がしばしば視覚的な人工物を生み出し、誤った科学的結論につながる可能性が示唆されている。
現在の制限は、埋め込みマップというデータに依存しない概念の欠如に起因していると認識し、古典的な統計的概念であるLeft-one-outに基づいて埋め込みマップを学習する新しい概念的・計算的枠組みであるLOO-mapを導入する。
LOO-mapは、個別の入力点の集合に埋め込まれた埋め込みを入力空間全体に拡張し、マップの連続性を体系的に評価し、視覚化の信頼性を高める。
多くの隣接埋め込み法について、それらの埋め込み写像は本質的に不連続である。
この不連続性は、クラスタ分離を誇張する‘overconfidence-inducing discontinuity’と、急激な局所構造を生み出す‘`fracture-inducing discontinuity’という2つの種類の観測地図歪みを誘導する。
LOO-mapに基づいて、これらの制限に対処するために、摂動スコアと特異点スコアという2つの診断点スコアを提案する。
これらのスコアは、信頼できない埋め込みポイントを特定し、配布外データを検出し、ハイパーパラメータの選択をガイドするのに役立ちます。
私たちのアプローチは柔軟で、多くの隣人の埋め込みアルゴリズムのラッパーとして機能します。
我々は,コンピュータビジョンと単一セルオミクスから複数の実世界のデータセットにまたがる手法を検証し,可視化の解釈可能性と精度を高める上での有効性を実証する。
関連論文リスト
- Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - Supervised Manifold Learning via Random Forest Geometry-Preserving
Proximities [0.0]
クラス条件付き多様体学習手法の弱点を定量的かつ視覚的に示す。
本稿では,ランダムな森の近さをデータジオメトリ保存した変種を用いて,教師付き次元減少のためのカーネルの代替選択を提案する。
論文 参考訳(メタデータ) (2023-07-03T14:55:11Z) - Vacant Holes for Unsupervised Detection of the Outliers in Compact
Latent Representation [0.6091702876917279]
現実世界にデプロイされ、運用される機械学習モデルにとって、アウトレーヤの検出は重要なものだ。
本研究では,これらのモデルの特定のタイプに焦点をあてる: 変分オートエンコーダ(VAE)。
論文 参考訳(メタデータ) (2023-06-16T06:21:48Z) - Focus for Free in Density-Based Counting [56.961229110268036]
利用可能なポイントアノテーションを再利用して、カウント性能を向上させる2つの方法を紹介します。
1つ目は、ポイントアノテーションを利用して、入力画像と密度画像の両方で隠蔽されたオブジェクトをシミュレートするカウント固有の拡張である。
第2の方法である前景蒸留は点アノテーションから前景マスクを生成し,黒色背景を持つ画像上で補助的ネットワークを訓練する。
論文 参考訳(メタデータ) (2023-06-08T11:54:37Z) - Hyperbolic Self-supervised Contrastive Learning Based Network Anomaly
Detection [0.0]
属性ネットワーク上の異常検出は近年,多くの研究分野において注目されている。
双曲型自己教師付きコントラスト学習を用いた効率的な異常検出フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-12T07:08:34Z) - Generating detailed saliency maps using model-agnostic methods [0.0]
本稿では, モデルに依存しない RISE 法に着目し, グリッドベースアプローチの欠点を詳細に考察する。
VRISE (Voronoi-RISE) と呼ばれる修正は、大きなオクルージョンを用いて生成された地図の精度を向上させることを目的としている。
ILSVRC2012の検証分割において, VRISE と RISE が生成したサリエンシマップの精度を比較した。
論文 参考訳(メタデータ) (2022-09-04T21:34:46Z) - Smoothed Embeddings for Certified Few-Shot Learning [63.68667303948808]
我々はランダムな平滑化を数ショットの学習モデルに拡張し、入力を正規化された埋め込みにマッピングする。
この結果は、異なるデータセットの実験によって確認される。
論文 参考訳(メタデータ) (2022-02-02T18:19:04Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Holistic Guidance for Occluded Person Re-Identification [7.662745552551165]
実世界のビデオ監視アプリケーションでは、人物の再識別(ReID)は、閉塞や検出エラーの影響に悩まされる。
個人識別ラベルにのみ依存するHG(Holistic Guidance)手法を提案する。
提案手法は, 包括的(非包括的)標本と, 包括的(非包括的)標本の包括的(包括的)な距離(DCD)分布を一致させることにより, この問題に対処する。
これに加えて、共同生成-識別的バックボーンは、デノナイジングオートエンコーダで訓練され、システムが制御される。
論文 参考訳(メタデータ) (2021-04-13T21:50:29Z) - Semi-Supervised Crowd Counting via Self-Training on Surrogate Tasks [50.78037828213118]
本稿では,機能学習の観点から,半教師付き群集カウント問題に取り組む。
本稿では,2つの革新的なコンポーネント上に構築された,新しい半教師付き群集カウント手法を提案する。
論文 参考訳(メタデータ) (2020-07-07T05:30:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。