論文の概要: Assessing and improving reliability of neighbor embedding methods: a map-continuity perspective
- arxiv url: http://arxiv.org/abs/2410.16608v2
- Date: Tue, 01 Apr 2025 02:20:44 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-04-02 16:16:39.825338
- Title: Assessing and improving reliability of neighbor embedding methods: a map-continuity perspective
- Title(参考訳): 隣接埋め込み法の信頼性評価と信頼性向上--地図連続性の観点から
- Authors: Zhexuan Liu, Rong Ma, Yiqiao Zhong,
- Abstract要約: 近隣の t-SNE や UMAP などの埋め込み法は広く用いられているが、誤解を招く視覚的アーティファクトを導入することがある。
LOO-mapは,個々の点から入力空間全体への埋め込みマップを拡張するフレームワークである。
- 参考スコア(独自算出の注目度): 2.969441406380581
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Visualizing high-dimensional data is essential for understanding biomedical data and deep learning models. Neighbor embedding methods, such as t-SNE and UMAP, are widely used but can introduce misleading visual artifacts. We find that the manifold learning interpretations from many prior works are inaccurate and that the misuse stems from a lack of data-independent notions of embedding maps, which project high-dimensional data into a lower-dimensional space. Leveraging the leave-one-out principle, we introduce LOO-map, a framework that extends embedding maps beyond discrete points to the entire input space. We identify two forms of map discontinuity that distort visualizations: one exaggerates cluster separation and the other creates spurious local structures. As a remedy, we develop two types of point-wise diagnostic scores to detect unreliable embedding points and improve hyperparameter selection, which are validated on datasets from computer vision and single-cell omics.
- Abstract(参考訳): バイオメディカルデータとディープラーニングモデルを理解するためには,高次元データの可視化が不可欠である。
近隣の t-SNE や UMAP などの埋め込み法は広く用いられているが、誤解を招く視覚的アーティファクトを導入することがある。
多くの先行研究から得られた多様体学習の解釈は不正確であり、その誤用は、高次元データを低次元空間に投影する埋め込み写像というデータ非依存の概念の欠如に起因する。
LOO-mapは、個々の点から入力空間全体への埋め込みマップを拡張するフレームワークである。
可視化を歪ませる地図の不連続性の2つの形態を同定する。一方はクラスタ分離を誇張し、もう一方は急激な局所構造を生成する。
そこで我々は,コンピュータビジョンと単一セルオミクスのデータセットを用いて,信頼できない埋め込み点を検出し,ハイパーパラメータ選択を改善するための2種類のポイントワイド診断スコアを開発した。
関連論文リスト
- Interpreting Object-level Foundation Models via Visual Precision Search [53.807678972967224]
より少ない領域で正確な属性マップを生成する視覚的精度探索法を提案する。
本手法は,マルチモーダル融合による帰属問題を克服するために,内部モデルパラメータをバイパスする。
提案手法は,複数の評価指標にまたがる既存の手法を超越して,視覚的接地や物体検出タスクにおける障害を解釈することができる。
論文 参考訳(メタデータ) (2024-11-25T08:54:54Z) - Dissecting embedding method: learning higher-order structures from data [0.0]
データ学習のための幾何学的深層学習法は、しばしば特徴空間の幾何学に関する仮定のセットを含む。
これらの仮定と、データが離散的で有限であるという仮定は、いくつかの一般化を引き起こし、データとモデルの出力の間違った解釈を生み出す可能性がある。
論文 参考訳(メタデータ) (2024-10-14T08:19:39Z) - Regularized Contrastive Partial Multi-view Outlier Detection [76.77036536484114]
RCPMOD(Regularized Contrastive partial Multi-view Outlier Detection)と呼ばれる新しい手法を提案する。
このフレームワークでは、コントラスト学習を利用して、ビュー一貫性のある情報を学び、一貫性の度合いでアウトレイラを識別する。
4つのベンチマークデータセットによる実験結果から,提案手法が最先端の競合より優れていることが示された。
論文 参考訳(メタデータ) (2024-08-02T14:34:27Z) - Diffusion-based Data Augmentation for Object Counting Problems [62.63346162144445]
拡散モデルを用いて広範なトレーニングデータを生成するパイプラインを開発する。
拡散モデルを用いて位置ドットマップ上に条件付き画像を生成するのはこれが初めてである。
提案した拡散モデルにおけるカウント損失は,位置ドットマップと生成した群集画像との差を効果的に最小化する。
論文 参考訳(メタデータ) (2024-01-25T07:28:22Z) - Neural Semantic Surface Maps [52.61017226479506]
本稿では,2つの属とゼロの形状の地図を自動計算する手法を提案する。
提案手法は,手動のアノテーションや3Dトレーニングデータ要求を排除し,意味的表面-表面マップを生成する。
論文 参考訳(メタデータ) (2023-09-09T16:21:56Z) - Supervised Manifold Learning via Random Forest Geometry-Preserving
Proximities [0.0]
クラス条件付き多様体学習手法の弱点を定量的かつ視覚的に示す。
本稿では,ランダムな森の近さをデータジオメトリ保存した変種を用いて,教師付き次元減少のためのカーネルの代替選択を提案する。
論文 参考訳(メタデータ) (2023-07-03T14:55:11Z) - Vacant Holes for Unsupervised Detection of the Outliers in Compact
Latent Representation [0.6091702876917279]
現実世界にデプロイされ、運用される機械学習モデルにとって、アウトレーヤの検出は重要なものだ。
本研究では,これらのモデルの特定のタイプに焦点をあてる: 変分オートエンコーダ(VAE)。
論文 参考訳(メタデータ) (2023-06-16T06:21:48Z) - Focus for Free in Density-Based Counting [56.961229110268036]
利用可能なポイントアノテーションを再利用して、カウント性能を向上させる2つの方法を紹介します。
1つ目は、ポイントアノテーションを利用して、入力画像と密度画像の両方で隠蔽されたオブジェクトをシミュレートするカウント固有の拡張である。
第2の方法である前景蒸留は点アノテーションから前景マスクを生成し,黒色背景を持つ画像上で補助的ネットワークを訓練する。
論文 参考訳(メタデータ) (2023-06-08T11:54:37Z) - Linking data separation, visual separation, and classifier performance
using pseudo-labeling by contrastive learning [125.99533416395765]
最終分類器の性能は、潜在空間に存在するデータ分離と、射影に存在する視覚的分離に依存すると論じる。
本研究は,ヒト腸管寄生虫の5つの現実的課題の画像データセットを1%の教師付きサンプルで分類し,その結果を実証する。
論文 参考訳(メタデータ) (2023-02-06T10:01:38Z) - Hyperbolic Self-supervised Contrastive Learning Based Network Anomaly
Detection [0.0]
属性ネットワーク上の異常検出は近年,多くの研究分野において注目されている。
双曲型自己教師付きコントラスト学習を用いた効率的な異常検出フレームワークを提案する。
論文 参考訳(メタデータ) (2022-09-12T07:08:34Z) - Generating detailed saliency maps using model-agnostic methods [0.0]
本稿では, モデルに依存しない RISE 法に着目し, グリッドベースアプローチの欠点を詳細に考察する。
VRISE (Voronoi-RISE) と呼ばれる修正は、大きなオクルージョンを用いて生成された地図の精度を向上させることを目的としている。
ILSVRC2012の検証分割において, VRISE と RISE が生成したサリエンシマップの精度を比較した。
論文 参考訳(メタデータ) (2022-09-04T21:34:46Z) - Smoothed Embeddings for Certified Few-Shot Learning [63.68667303948808]
我々はランダムな平滑化を数ショットの学習モデルに拡張し、入力を正規化された埋め込みにマッピングする。
この結果は、異なるデータセットの実験によって確認される。
論文 参考訳(メタデータ) (2022-02-02T18:19:04Z) - PANet: Perspective-Aware Network with Dynamic Receptive Fields and
Self-Distilling Supervision for Crowd Counting [63.84828478688975]
本稿では,視点問題に対処するため,PANetと呼ばれる新しい視点認識手法を提案する。
対象物のサイズが視点効果によって1つの画像で大きく変化するという観測に基づいて,動的受容場(DRF)フレームワークを提案する。
このフレームワークは、入力画像に応じて拡張畳み込みパラメータによって受容野を調整することができ、モデルが各局所領域についてより識別的な特徴を抽出するのに役立つ。
論文 参考訳(メタデータ) (2021-10-31T04:43:05Z) - Residual Moment Loss for Medical Image Segmentation [56.72261489147506]
位置情報は,対象物体の多様体構造を捉えた深層学習モデルに有効であることが証明された。
既存のほとんどの手法は、ネットワークが学習するために、位置情報を暗黙的にエンコードする。
セグメント化対象の位置情報を明示的に埋め込むために,新しい損失関数,すなわち残差モーメント(RM)損失を提案する。
論文 参考訳(メタデータ) (2021-06-27T09:31:49Z) - CAMERAS: Enhanced Resolution And Sanity preserving Class Activation
Mapping for image saliency [61.40511574314069]
バックプロパゲーション画像のサリエンシは、入力中の個々のピクセルのモデル中心の重要性を推定することにより、モデル予測を説明することを目的としている。
CAMERASは、外部の事前処理を必要とせずに、高忠実度バックプロパゲーション・サリエンシ・マップを計算できる手法である。
論文 参考訳(メタデータ) (2021-06-20T08:20:56Z) - Holistic Guidance for Occluded Person Re-Identification [7.662745552551165]
実世界のビデオ監視アプリケーションでは、人物の再識別(ReID)は、閉塞や検出エラーの影響に悩まされる。
個人識別ラベルにのみ依存するHG(Holistic Guidance)手法を提案する。
提案手法は, 包括的(非包括的)標本と, 包括的(非包括的)標本の包括的(包括的)な距離(DCD)分布を一致させることにより, この問題に対処する。
これに加えて、共同生成-識別的バックボーンは、デノナイジングオートエンコーダで訓練され、システムが制御される。
論文 参考訳(メタデータ) (2021-04-13T21:50:29Z) - Contrastive analysis for scatter plot-based representations of
dimensionality reduction [0.0]
本稿では,マルチ次元データセットを探索し,クラスタの形成を解釈する手法を提案する。
また,属性がクラスタ形成にどのように影響するかを理解するために使用される統計変数間の関係を視覚的に解釈し,探索する二部グラフも導入する。
論文 参考訳(メタデータ) (2021-01-26T01:16:31Z) - Label Decoupling Framework for Salient Object Detection [157.96262922808245]
近年の手法は, 畳み込みネットワーク(FCN)からの多層的特徴の集約と, エッジ情報の導入に重点を置いている。
ラベルデカップリング手順と機能相互作用ネットワーク(FIN)からなるラベルデカップリングフレームワーク(LDF)を提案する。
6つのベンチマークデータセットの実験では、LDFはさまざまな評価指標における最先端のアプローチよりも優れていることが示されている。
論文 参考訳(メタデータ) (2020-08-25T14:23:38Z) - Dimensionality Reduction via Diffusion Map Improved with Supervised
Linear Projection [1.7513645771137178]
本稿では、データサンプルが1つの基礎となる滑らかな多様体上に存在すると仮定する。
ペアワイズローカルカーネル距離を用いてクラス内およびクラス間類似性を定義する。
クラス内類似度を最大化し、クラス間類似度を同時に最小化する線形射影を求める。
論文 参考訳(メタデータ) (2020-08-08T04:26:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。