論文の概要: Revised Conditional t-SNE: Looking Beyond the Nearest Neighbors
- arxiv url: http://arxiv.org/abs/2302.03493v2
- Date: Tue, 11 Apr 2023 08:36:09 GMT
- ステータス: 処理完了
- システム内更新日: 2023-04-12 18:11:30.944159
- Title: Revised Conditional t-SNE: Looking Beyond the Nearest Neighbors
- Title(参考訳): 修正条件付きt-sne:最寄りの近傍を見渡す
- Authors: Edith Heiter, Bo Kang, Ruth Seurinck, Jefrey Lijffijt
- Abstract要約: Conditional t-SNE (ct-SNE) は、既知のクラスタ情報を埋め込みから削除できる t-SNE の最近の拡張である。
ct-SNEは多くの現実的な設定で失敗することを示す。
低次元の類似性の代わりに,高次元の類似性を条件づけた修正手法を導入する。
- 参考スコア(独自算出の注目度): 6.918364447822299
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Conditional t-SNE (ct-SNE) is a recent extension to t-SNE that allows removal
of known cluster information from the embedding, to obtain a visualization
revealing structure beyond label information. This is useful, for example, when
one wants to factor out unwanted differences between a set of classes. We show
that ct-SNE fails in many realistic settings, namely if the data is well
clustered over the labels in the original high-dimensional space. We introduce
a revised method by conditioning the high-dimensional similarities instead of
the low-dimensional similarities and storing within- and across-label nearest
neighbors separately. This also enables the use of recently proposed speedups
for t-SNE, improving the scalability. From experiments on synthetic data, we
find that our proposed method resolves the considered problems and improves the
embedding quality. On real data containing batch effects, the expected
improvement is not always there. We argue revised ct-SNE is preferable overall,
given its improved scalability. The results also highlight new open questions,
such as how to handle distance variations between clusters.
- Abstract(参考訳): Conditional t-SNE (ct-SNE) は t-SNE の最近の拡張で、既知のクラスタ情報を埋め込みから取り除き、ラベル情報以外の可視化構造が得られる。
これは例えば、クラスのセット間の望ましくない違いを解決したい場合に便利である。
その結果、ct-sneは多くの現実的な設定、すなわちデータが元の高次元空間のラベル上によくクラスター化されている場合に失敗することが分かった。
我々は,低次元の類似性の代わりに高次元の類似性を条件付けし,近辺と近辺を別々に保存する改良手法を提案する。
これにより、最近提案されたt-SNEのスピードアップが利用可能になり、スケーラビリティが向上した。
合成データ実験から,提案手法は検討された課題を解決し,組込み品質を向上することがわかった。
バッチ効果を含む実データでは、期待される改善が常に存在するとは限らない。
スケーラビリティが向上していることから,ct-sneの改訂が全体として望ましいと論じる。
結果はまた、クラスタ間の距離変化を処理する方法など、新しいオープンな質問も強調している。
関連論文リスト
- Continuous Contrastive Learning for Long-Tailed Semi-Supervised Recognition [50.61991746981703]
現在の最先端のLTSSLアプローチは、大規模な未ラベルデータに対して高品質な擬似ラベルに依存している。
本稿では,長期学習における様々な提案を統一する新しい確率的枠組みを提案する。
我々は、信頼度とスムーズな擬似ラベルを用いて、我々のフレームワークをラベルなしデータに拡張する、連続的コントラスト学習手法であるCCLを導入する。
論文 参考訳(メタデータ) (2024-10-08T15:06:10Z) - Contrastive Continual Multi-view Clustering with Filtered Structural
Fusion [57.193645780552565]
ビューが事前に収集されるアプリケーションでは、マルチビュークラスタリングが成功します。
データビューがシーケンシャルに収集されるシナリオ、すなわちリアルタイムデータを見落としている。
いくつかの方法が提案されているが、安定塑性ジレンマに閉じ込められている。
フィルタ構造融合を用いたコントラスト連続多視点クラスタリングを提案する。
論文 参考訳(メタデータ) (2023-09-26T14:18:29Z) - Supervised Stochastic Neighbor Embedding Using Contrastive Learning [4.560284382063488]
同じクラスに属するサンプルのクラスタは、低次元の埋め込み空間にまとめられる。
我々は、自己教師付きコントラスト的アプローチを完全教師付き設定に拡張し、ラベル情報を効果的に活用する。
論文 参考訳(メタデータ) (2023-09-15T00:26:21Z) - CEnt: An Entropy-based Model-agnostic Explainability Framework to
Contrast Classifiers' Decisions [2.543865489517869]
我々は任意の分類器の予測を局所的に対比する新しい手法を提案する。
コントラストエントロピーに基づく説明法CEntは、決定木によって局所的にモデルを近似し、異なる特徴分割のエントロピー情報を算出する。
CEntは、不変性(人種など)と半不変性(年齢が増加する方向にしか変化しない)を満足しながら、トレーニングデータに必ずしも存在しない多様な反事実を生成する最初の非漸進的コントラスト法である。
論文 参考訳(メタデータ) (2023-01-19T08:23:34Z) - Combating Mode Collapse in GANs via Manifold Entropy Estimation [70.06639443446545]
Generative Adversarial Networks (GAN) は、様々なタスクやアプリケーションにおいて魅力的な結果を示している。
GANのモード崩壊問題に対処するための新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-08-25T12:33:31Z) - Active Learning by Feature Mixing [52.16150629234465]
本稿では,ALFA-Mixと呼ばれるバッチ能動学習手法を提案する。
予測の不整合を求めることにより,不整合な特徴を持つインスタンスを同定する。
これらの予測の不整合は、モデルが未認識のインスタンスで認識できない特徴を発見するのに役立ちます。
論文 参考訳(メタデータ) (2022-03-14T12:20:54Z) - T-SNE Is Not Optimized to Reveal Clusters in Data [4.03823460330412]
データ解析ツールとしての非線形次元低減には,クラスタ可視化が不可欠である。
学生t-Distributed Neighbor Embedding (t-SNE) は、よくクラスタ可能なデータに対してクラスタを表示することができるとよく信じられている。
データに強い信号があるにもかかわらず、t-SNEはクラスタリングパターンを隠蔽する可能性がある。
論文 参考訳(メタデータ) (2021-10-06T08:35:39Z) - Index $t$-SNE: Tracking Dynamics of High-Dimensional Datasets with
Coherent Embeddings [1.7188280334580195]
本稿では,クラスタの位置を保存した新しいものを作成するために,埋め込みを再利用する手法を提案する。
提案アルゴリズムは,新しい項目を埋め込むために$t$-SNEと同じ複雑さを持つ。
論文 参考訳(メタデータ) (2021-09-22T06:45:37Z) - Stochastic Cluster Embedding [14.485496311015398]
Neighbor Embedding (NE)は、データ項目間のペアの類似性を維持することを目的としている。
Neighbor Embedding (SNE)のようなNEメソッドは、クラスタなどの大規模パターンを隠蔽する可能性がある。
隣り合う埋め込みに基づく新しいクラスタ可視化手法を提案する。
論文 参考訳(メタデータ) (2021-08-18T07:07:28Z) - Hard-label Manifolds: Unexpected Advantages of Query Efficiency for
Finding On-manifold Adversarial Examples [67.23103682776049]
画像分類モデルに対する最近のゼロオーダーのハードラベル攻撃は、ファーストオーダーのグラデーションレベルの代替品に匹敵する性能を示している。
最近、グラデーションレベルの設定では、通常の敵対的な例がデータ多様体から離れ、オンマニホールドの例が実際には一般化エラーであることが示されている。
雑音の多い多様体距離オラクルに基づく情報理論論的議論を提案し、敵の勾配推定を通じて多様体情報を漏洩させる。
論文 参考訳(メタデータ) (2021-03-04T20:53:06Z) - Classify and Generate Reciprocally: Simultaneous Positive-Unlabelled
Learning and Conditional Generation with Extra Data [77.31213472792088]
クラスラベルデータの不足は、多くの機械学習問題において、ユビキタスなボトルネックとなっている。
本稿では, 正負ラベル付き(PU)分類と, 余分なラベル付きデータによる条件生成を活用することで, この問題に対処する。
本稿では,PU分類と条件生成を併用した新たなトレーニングフレームワークを提案する。
論文 参考訳(メタデータ) (2020-06-14T08:27:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。