論文の概要: t-SNE Exaggerates Clusters, Provably
- arxiv url: http://arxiv.org/abs/2510.07746v1
- Date: Thu, 09 Oct 2025 03:34:36 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-10-10 17:54:14.848739
- Title: t-SNE Exaggerates Clusters, Provably
- Title(参考訳): t-SNEはおそらくクラスタを誇張する
- Authors: Noah Bergam, Szymon Snoeck, Nakul Verma,
- Abstract要約: 入力クラスタリングの強度と極端点の外れ値がt-SNE出力から確実に推定できないことを示す。
実際にこれらの障害モードの頻度も示す。
- 参考スコア(独自算出の注目度): 1.0744613450114762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Central to the widespread use of t-distributed stochastic neighbor embedding (t-SNE) is the conviction that it produces visualizations whose structure roughly matches that of the input. To the contrary, we prove that (1) the strength of the input clustering, and (2) the extremity of outlier points, cannot be reliably inferred from the t-SNE output. We demonstrate the prevalence of these failure modes in practice as well.
- Abstract(参考訳): t分散確率的隣接埋め込み (t-SNE) が広く使われる中核となるのは、その構造が入力とほぼ一致するような可視化を生成するという信念である。
逆に,(1)入力クラスタリングの強度,(2)外部点の極限性がt-SNE出力から確実に推定できないことを証明する。
実際にこれらの障害モードの頻度も示す。
関連論文リスト
- CrystaL: Spontaneous Emergence of Visual Latents in MLLMs [55.34169914483764]
CrystaL(Crystallized Latent Reasoning)は,静止画像と劣化画像を処理するための2つの経路を持つ単一ステージフレームワークである。
CrystaLは2つの経路にまたがる注意パターンと予測分布を明確に調整することで、潜在表現をタスク関連視覚意味論に結晶化する。
知覚集約ベンチマークの実験では、CrystaLは最先端のベースラインを一貫して上回っている。
論文 参考訳(メタデータ) (2026-02-24T15:01:30Z) - Why not Collaborative Filtering in Dual View? Bridging Sparse and Dense Models [17.01882282913444]
協調フィルタリングは現代のレコメンデーターシステムの基盤となっている。
密埋め込みのセマンティック表現性とスパース相互作用パターンの構造的信頼性を統合した統合フレームワークSaD(Sparse and Dense)を提案する。
これら2つの視点を整合させることで、より優れたグローバルSNRが得られることを示す。
論文 参考訳(メタデータ) (2026-01-14T08:47:07Z) - Silence the Judge: Reinforcement Learning with Self-Verifier via Latent Geometric Clustering [28.35101062722637]
グループ相対政策最適化(GRPO)は大規模言語モデル(LLM)の推論性能を大幅に向上させる
我々は、潜在空間幾何学から直接本質的な報酬を導出するフレームワークであるLatent-GRPOを提案する。
本手法は,ベースラインに比べて2倍以上のトレーニング高速化を実現しつつ,モデル性能を維持していることを示す。
論文 参考訳(メタデータ) (2026-01-13T10:55:08Z) - Hallucination Detection via Internal States and Structured Reasoning Consistency in Large Language Models [7.18947815679122]
内部状態探索と整合検証は、大きな言語モデルにおける幻覚を検出するために用いられる。
両手法のギャップを埋める統一的なフレームワークを開発する。
私たちのフレームワークは一貫して、強力なベースラインをはるかに上回ります。
論文 参考訳(メタデータ) (2025-10-13T15:31:21Z) - Parallel Test-Time Scaling for Latent Reasoning Models [58.428340345068214]
並列テスト時間スケーリング(TTS)は、大規模言語モデル(LLM)の拡張のための重要なアプローチである。
連続ベクトル空間において中間的推論が展開する潜在的推論の最近の進歩は、明示的なチェーン・オブ・サート(Chain-of-Thought)に対するより効率的な代替手段を提供する。
この作業は、上記の問題に対処することで、潜在推論モデルに対する並列TSを可能にする。
論文 参考訳(メタデータ) (2025-10-09T03:33:00Z) - Dual Debiasing for Noisy In-Context Learning for Text Generation [35.57978360647332]
文脈学習では、大きな注釈付きコーパスから引き出された高品質なデモンストレーションに大きく依存する。
既存のアプローチでは、ノイズのあるサンプルがクリーンなアノテーションよりも高いパープレキシティをもたらすと仮定して、局所的なパープレキシティをランク付けすることでノイズの多いアノテーションを検出する。
我々は、ノイズの多いアノテーションの下でテキスト生成のためのパープレキシティに基づくパラダイムを再検討し、パープレキシティの2つのバイアス源を強調した。
合成された隣接体を用いて、パープレキシティ推定を明示的に補正し、ロバストなサンプルクリーンネススコアを生成する双対脱バイアスフレームワークを導入する。
論文 参考訳(メタデータ) (2025-05-31T06:44:48Z) - Equilibrium Distribution for t-Distributed Stochastic Neighbor Embedding with Generalized Kernels [10.044705222110732]
一般化されたカーネルによるt-SNEの収束について検討し、2023年に Auffinger と Fletcher の結果を拡張した。
特定の条件下では、データポイントの数が分散するにつれて、t-SNEアルゴリズムは幅広い入出力カーネルの平衡分布に収束することを示す。
論文 参考訳(メタデータ) (2025-05-30T07:50:09Z) - Fractured Chain-of-Thought Reasoning [61.647243580650446]
完全CoTと解のみのサンプリングを補間する統合推論時間戦略であるフラクチャードサンプリングを導入する。
フラクチャードサンプリングは、Pass@kとトークンの予算に対して、急激なログ線形スケーリングゲインをもたらすため、優れた精度とコストのトレードオフを一貫して達成できることを示す。
論文 参考訳(メタデータ) (2025-05-19T11:30:41Z) - Reasoning Models Don't Always Say What They Think [48.05987314492555]
CoT(Chain-of-Thought)は、モデルの意図と推論プロセスの監視を可能にする。
提案する6つの推論ヒントにまたがる最先端推論モデルのCoT忠実度を評価した。
論文 参考訳(メタデータ) (2025-05-08T16:51:43Z) - Latent Feature Relation Consistency for Adversarial Robustness [80.24334635105829]
深層ニューラルネットワークは、人間の知覚できない敵のノイズを自然の例に付加する敵の例を予測するときに、誤分類が起こる。
textbfLatent textbfFeature textbfRelation textbfConsistency (textbfLFRC)を提案する。
LFRCは、潜在空間における逆例の関係を、自然例と整合性に制約する。
論文 参考訳(メタデータ) (2023-03-29T13:50:01Z) - T-SNE Is Not Optimized to Reveal Clusters in Data [4.03823460330412]
データ解析ツールとしての非線形次元低減には,クラスタ可視化が不可欠である。
学生t-Distributed Neighbor Embedding (t-SNE) は、よくクラスタ可能なデータに対してクラスタを表示することができるとよく信じられている。
データに強い信号があるにもかかわらず、t-SNEはクラスタリングパターンを隠蔽する可能性がある。
論文 参考訳(メタデータ) (2021-10-06T08:35:39Z) - Deconfounding Scores: Feature Representations for Causal Effect
Estimation with Weak Overlap [140.98628848491146]
推定対象の偏りを伴わずに高い重なりを生じさせる,デコンファウンディングスコアを導入する。
分離スコアは観測データで識別可能なゼロ共分散条件を満たすことを示す。
特に,この手法が標準正規化の魅力的な代替となることを示す。
論文 参考訳(メタデータ) (2021-04-12T18:50:11Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。