論文の概要: t-SNE Exaggerates Clusters, Provably
- arxiv url: http://arxiv.org/abs/2510.07746v1
- Date: Thu, 09 Oct 2025 03:34:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.848739
- Title: t-SNE Exaggerates Clusters, Provably
- Title(参考訳): t-SNEはおそらくクラスタを誇張する
- Authors: Noah Bergam, Szymon Snoeck, Nakul Verma,
- Abstract要約: 入力クラスタリングの強度と極端点の外れ値がt-SNE出力から確実に推定できないことを示す。
実際にこれらの障害モードの頻度も示す。
- 参考スコア(独自算出の注目度): 1.0744613450114762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Central to the widespread use of t-distributed stochastic neighbor embedding (t-SNE) is the conviction that it produces visualizations whose structure roughly matches that of the input. To the contrary, we prove that (1) the strength of the input clustering, and (2) the extremity of outlier points, cannot be reliably inferred from the t-SNE output. We demonstrate the prevalence of these failure modes in practice as well.
- Abstract(参考訳): t分散確率的隣接埋め込み (t-SNE) が広く使われる中核となるのは、その構造が入力とほぼ一致するような可視化を生成するという信念である。
逆に,(1)入力クラスタリングの強度,(2)外部点の極限性がt-SNE出力から確実に推定できないことを証明する。
実際にこれらの障害モードの頻度も示す。
関連論文リスト
- Parallel Test-Time Scaling for Latent Reasoning Models [58.428340345068214]
並列テスト時間スケーリング(TTS)は、大規模言語モデル(LLM)の拡張のための重要なアプローチである。
連続ベクトル空間において中間的推論が展開する潜在的推論の最近の進歩は、明示的なチェーン・オブ・サート(Chain-of-Thought)に対するより効率的な代替手段を提供する。
この作業は、上記の問題に対処することで、潜在推論モデルに対する並列TSを可能にする。
論文 参考訳(メタデータ) (2025-10-09T03:33:00Z) - Dual Debiasing for Noisy In-Context Learning for Text Generation [35.57978360647332]
文脈学習では、大きな注釈付きコーパスから引き出された高品質なデモンストレーションに大きく依存する。
既存のアプローチでは、ノイズのあるサンプルがクリーンなアノテーションよりも高いパープレキシティをもたらすと仮定して、局所的なパープレキシティをランク付けすることでノイズの多いアノテーションを検出する。
我々は、ノイズの多いアノテーションの下でテキスト生成のためのパープレキシティに基づくパラダイムを再検討し、パープレキシティの2つのバイアス源を強調した。
合成された隣接体を用いて、パープレキシティ推定を明示的に補正し、ロバストなサンプルクリーンネススコアを生成する双対脱バイアスフレームワークを導入する。
論文 参考訳(メタデータ) (2025-05-31T06:44:48Z) - Equilibrium Distribution for t-Distributed Stochastic Neighbor Embedding with Generalized Kernels [10.044705222110732]
一般化されたカーネルによるt-SNEの収束について検討し、2023年に Auffinger と Fletcher の結果を拡張した。
特定の条件下では、データポイントの数が分散するにつれて、t-SNEアルゴリズムは幅広い入出力カーネルの平衡分布に収束することを示す。
論文 参考訳(メタデータ) (2025-05-30T07:50:09Z) - Fractured Chain-of-Thought Reasoning [61.647243580650446]
完全CoTと解のみのサンプリングを補間する統合推論時間戦略であるフラクチャードサンプリングを導入する。
フラクチャードサンプリングは、Pass@kとトークンの予算に対して、急激なログ線形スケーリングゲインをもたらすため、優れた精度とコストのトレードオフを一貫して達成できることを示す。
論文 参考訳(メタデータ) (2025-05-19T11:30:41Z) - Reasoning Models Don't Always Say What They Think [48.05987314492555]
CoT(Chain-of-Thought)は、モデルの意図と推論プロセスの監視を可能にする。
提案する6つの推論ヒントにまたがる最先端推論モデルのCoT忠実度を評価した。
論文 参考訳(メタデータ) (2025-05-08T16:51:43Z) - T-SNE Is Not Optimized to Reveal Clusters in Data [4.03823460330412]
データ解析ツールとしての非線形次元低減には,クラスタ可視化が不可欠である。
学生t-Distributed Neighbor Embedding (t-SNE) は、よくクラスタ可能なデータに対してクラスタを表示することができるとよく信じられている。
データに強い信号があるにもかかわらず、t-SNEはクラスタリングパターンを隠蔽する可能性がある。
論文 参考訳(メタデータ) (2021-10-06T08:35:39Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。