論文の概要: Assessing and improving reliability of neighbor embedding methods: a map-continuity perspective
- arxiv url: http://arxiv.org/abs/2410.16608v1
- Date: Tue, 22 Oct 2024 01:40:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-11-28 17:07:38.827857
- Title: Assessing and improving reliability of neighbor embedding methods: a map-continuity perspective
- Title(参考訳): 隣接埋め込み法の信頼性評価と信頼性向上--地図連続性の観点から
- Authors: Zhexuan Liu, Rong Ma, Yiqiao Zhong,
- Abstract要約: 隣接する t-SNE, UMAP, LargeVis などの埋め込み手法は、一般的な可視化手法のファミリーである。
近年の研究では、これらの手法がしばしば視覚的な人工物を生み出し、誤った科学的結論につながる可能性が示唆されている。
本稿では,古典的な統計的概念に基づいて埋め込みマップを学習する,新しい概念的・計算的枠組み LOO-map を紹介する。
- 参考スコア(独自算出の注目度): 2.969441406380581
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visualizing high-dimensional data is an important routine for understanding biomedical data and interpreting deep learning models. Neighbor embedding methods, such as t-SNE, UMAP, and LargeVis, among others, are a family of popular visualization methods which reduce high-dimensional data to two dimensions. However, recent studies suggest that these methods often produce visual artifacts, potentially leading to incorrect scientific conclusions. Recognizing that the current limitation stems from a lack of data-independent notions of embedding maps, we introduce a novel conceptual and computational framework, LOO-map, that learns the embedding maps based on a classical statistical idea known as the leave-one-out. LOO-map extends the embedding over a discrete set of input points to the entire input space, enabling a systematic assessment of map continuity, and thus the reliability of the visualizations. We find for many neighbor embedding methods, their embedding maps can be intrinsically discontinuous. The discontinuity induces two types of observed map distortion: ``overconfidence-inducing discontinuity," which exaggerates cluster separation, and ``fracture-inducing discontinuity," which creates spurious local structures. Building upon LOO-map, we propose two diagnostic point-wise scores -- perturbation score and singularity score -- to address these limitations. These scores can help identify unreliable embedding points, detect out-of-distribution data, and guide hyperparameter selection. Our approach is flexible and works as a wrapper around many neighbor embedding algorithms. We test our methods across multiple real-world datasets from computer vision and single-cell omics to demonstrate their effectiveness in enhancing the interpretability and accuracy of visualizations.
- Abstract(参考訳): 高次元データの可視化は、バイオメディカルデータを理解し、ディープラーニングモデルを解釈するための重要なルーチンである。
t-SNE、UMAP、LargeVisなどの隣接埋め込み手法は、高次元データを2次元に縮小する一般的な可視化手法のファミリーである。
しかし、最近の研究では、これらの手法がしばしば視覚的な人工物を生み出し、誤った科学的結論につながる可能性が示唆されている。
現在の制限は、埋め込みマップというデータに依存しない概念の欠如に起因していると認識し、古典的な統計的概念であるLeft-one-outに基づいて埋め込みマップを学習する新しい概念的・計算的枠組みであるLOO-mapを導入する。
LOO-mapは、個別の入力点の集合に埋め込まれた埋め込みを入力空間全体に拡張し、マップの連続性を体系的に評価し、視覚化の信頼性を高める。
多くの隣接埋め込み法について、それらの埋め込み写像は本質的に不連続である。
この不連続性は、クラスタ分離を誇張する‘overconfidence-inducing discontinuity’と、急激な局所構造を生み出す‘`fracture-inducing discontinuity’という2つの種類の観測地図歪みを誘導する。
LOO-mapに基づいて、これらの制限に対処するために、摂動スコアと特異点スコアという2つの診断点スコアを提案する。
これらのスコアは、信頼できない埋め込みポイントを特定し、配布外データを検出し、ハイパーパラメータの選択をガイドするのに役立ちます。
私たちのアプローチは柔軟で、多くの隣人の埋め込みアルゴリズムのラッパーとして機能します。
我々は,コンピュータビジョンと単一セルオミクスから複数の実世界のデータセットにまたがる手法を検証し,可視化の解釈可能性と精度を高める上での有効性を実証する。
関連論文リスト
- Interpreting Object-level Foundation Models via Visual Precision Search [53.807678972967224]
より少ない領域で正確な属性マップを生成する視覚的精度探索法を提案する。
本手法は,マルチモーダル融合による帰属問題を克服するために,内部モデルパラメータをバイパスする。
提案手法は,複数の評価指標にまたがる既存の手法を超越して,視覚的接地や物体検出タスクにおける障害を解釈することができる。
論文 参考訳(メタデータ) (2024-11-25T08:54:54Z) - Dissecting embedding method: learning higher-order structures from data [0.0]
データ学習のための幾何学的深層学習法は、しばしば特徴空間の幾何学に関する仮定のセットを含む。
これらの仮定と、データが離散的で有限であるという仮定は、いくつかの一般化を引き起こし、データとモデルの出力の間違った解釈を生み出す可能性がある。
論文 参考訳(メタデータ) (2024-10-14T08:19:39Z) - Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Neural Semantic Surface Maps [52.61017226479506]
本稿では,2つの属とゼロの形状の地図を自動計算する手法を提案する。
提案手法は,手動のアノテーションや3Dトレーニングデータ要求を排除し,意味的表面-表面マップを生成する。
論文 参考訳(メタデータ) (2023-09-09T16:21:56Z) - Supervised Manifold Learning via Random Forest Geometry-Preserving
Proximities [0.0]
クラス条件付き多様体学習手法の弱点を定量的かつ視覚的に示す。
本稿では,ランダムな森の近さをデータジオメトリ保存した変種を用いて,教師付き次元減少のためのカーネルの代替選択を提案する。
論文 参考訳(メタデータ) (2023-07-03T14:55:11Z) - Vacant Holes for Unsupervised Detection of the Outliers in Compact
Latent Representation [0.6091702876917279]
現実世界にデプロイされ、運用される機械学習モデルにとって、アウトレーヤの検出は重要なものだ。
本研究では,これらのモデルの特定のタイプに焦点をあてる: 変分オートエンコーダ(VAE)。
論文 参考訳(メタデータ) (2023-06-16T06:21:48Z) - Focus for Free in Density-Based Counting [56.961229110268036]
利用可能なポイントアノテーションを再利用して、カウント性能を向上させる2つの方法を紹介します。
1つ目は、ポイントアノテーションを利用して、入力画像と密度画像の両方で隠蔽されたオブジェクトをシミュレートするカウント固有の拡張である。
第2の方法である前景蒸留は点アノテーションから前景マスクを生成し,黒色背景を持つ画像上で補助的ネットワークを訓練する。
論文 参考訳(メタデータ) (2023-06-08T11:54:37Z) - Linking data separation, visual separation, and classifier performance
using pseudo-labeling by contrastive learning [125.99533416395765]
最終分類器の性能は、潜在空間に存在するデータ分離と、射影に存在する視覚的分離に依存すると論じる。
本研究は,ヒト腸管寄生虫の5つの現実的課題の画像データセットを1%の教師付きサンプルで分類し,その結果を実証する。
論文 参考訳(メタデータ) (2023-02-06T10:01:38Z) - Hyperbolic Self-supervised Contrastive Learning Based Network Anomaly
Detection [0.0]
属性ネットワーク上の異常検出は近年,多くの研究分野において注目されている。
双曲型自己教師付きコントラスト学習を用いた効率的な異常検出フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-12T07:08:34Z) - Generating detailed saliency maps using model-agnostic methods [0.0]
本稿では, モデルに依存しない RISE 法に着目し, グリッドベースアプローチの欠点を詳細に考察する。
VRISE (Voronoi-RISE) と呼ばれる修正は、大きなオクルージョンを用いて生成された地図の精度を向上させることを目的としている。
ILSVRC2012の検証分割において, VRISE と RISE が生成したサリエンシマップの精度を比較した。
論文 参考訳(メタデータ) (2022-09-04T21:34:46Z) - Smoothed Embeddings for Certified Few-Shot Learning [63.68667303948808]
我々はランダムな平滑化を数ショットの学習モデルに拡張し、入力を正規化された埋め込みにマッピングする。
この結果は、異なるデータセットの実験によって確認される。
論文 参考訳(メタデータ) (2022-02-02T18:19:04Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Residual Moment Loss for Medical Image Segmentation [56.72261489147506]
位置情報は,対象物体の多様体構造を捉えた深層学習モデルに有効であることが証明された。
既存のほとんどの手法は、ネットワークが学習するために、位置情報を暗黙的にエンコードする。
セグメント化対象の位置情報を明示的に埋め込むために,新しい損失関数,すなわち残差モーメント(RM)損失を提案する。
論文 参考訳(メタデータ) (2021-06-27T09:31:49Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Holistic Guidance for Occluded Person Re-Identification [7.662745552551165]
実世界のビデオ監視アプリケーションでは、人物の再識別(ReID)は、閉塞や検出エラーの影響に悩まされる。
個人識別ラベルにのみ依存するHG(Holistic Guidance)手法を提案する。
提案手法は, 包括的(非包括的)標本と, 包括的(非包括的)標本の包括的(包括的)な距離(DCD)分布を一致させることにより, この問題に対処する。
これに加えて、共同生成-識別的バックボーンは、デノナイジングオートエンコーダで訓練され、システムが制御される。
論文 参考訳(メタデータ) (2021-04-13T21:50:29Z) - Contrastive analysis for scatter plot-based representations of
dimensionality reduction [0.0]
本稿では,マルチ次元データセットを探索し,クラスタの形成を解釈する手法を提案する。
また,属性がクラスタ形成にどのように影響するかを理解するために使用される統計変数間の関係を視覚的に解釈し,探索する二部グラフも導入する。
論文 参考訳(メタデータ) (2021-01-26T01:16:31Z) - Label Decoupling Framework for Salient Object Detection [157.96262922808245]
近年の手法は, 畳み込みネットワーク(FCN)からの多層的特徴の集約と, エッジ情報の導入に重点を置いている。
ラベルデカップリング手順と機能相互作用ネットワーク(FIN)からなるラベルデカップリングフレームワーク(LDF)を提案する。
6つのベンチマークデータセットの実験では、LDFはさまざまな評価指標における最先端のアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-08-25T14:23:38Z) - Dimensionality Reduction via Diffusion Map Improved with Supervised
Linear Projection [1.7513645771137178]
本稿では、データサンプルが1つの基礎となる滑らかな多様体上に存在すると仮定する。
ペアワイズローカルカーネル距離を用いてクラス内およびクラス間類似性を定義する。
クラス内類似度を最大化し、クラス間類似度を同時に最小化する線形射影を求める。
論文 参考訳(メタデータ) (2020-08-08T04:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。