論文の概要: DRtool: An Interactive Tool for Analyzing High-Dimensional Clusterings
- arxiv url: http://arxiv.org/abs/2509.04603v2
- Date: Thu, 11 Sep 2025 18:37:27 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-09-15 14:04:03.100089
- Title: DRtool: An Interactive Tool for Analyzing High-Dimensional Clusterings
- Title(参考訳): DRtool:高次元クラスタリング分析のためのインタラクティブツール
- Authors: Justin Lin, Julia Fukuyama,
- Abstract要約: DRtoolはインタラクティブなツールで、分析者がその次元削減結果をよりよく理解し、診断することができる。
様々な分析プロットを使用して、結果に対する多面的な視点を提供し、正当性を決定する。
- 参考スコア(独自算出の注目度): 1.3965477771846408
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Technological advances have spurred an increase in data complexity and dimensionality. We are now in an era in which data sets containing thousands of features are commonplace. To digest and analyze such high-dimensional data, dimension reduction techniques have been developed and advanced along with computational power. Of these techniques, nonlinear methods are most commonly employed because of their ability to construct visually interpretable embeddings. Unlike linear methods, these methods non-uniformly stretch and shrink space to create a visual impression of the high-dimensional data. Since capturing high-dimensional structures in a significantly lower number of dimensions requires drastic manipulation of space, nonlinear dimension reduction methods are known to occasionally produce false structures, especially in noisy settings. In an effort to deal with this phenomenon, we developed an interactive tool that enables analysts to better understand and diagnose their dimension reduction results. It uses various analytical plots to provide a multi-faceted perspective on results to determine legitimacy. The tool is available via an R package named DRtool.
- Abstract(参考訳): 技術的進歩は、データの複雑さと次元性の増大を引き起こした。
私たちは現在、何千もの機能を含むデータセットが一般的である時代にあります。
このような高次元データを消化・解析するために,計算力とともに次元低減技術が開発・開発されている。
これらの手法のうち、非線形手法が最も一般的に用いられるのは、視覚的に解釈可能な埋め込みを構築する能力のためである。
線形手法とは異なり、これらの手法は空間を一様に伸縮させ、高次元データの視覚的印象を生み出す。
非常に少ない次元で高次元構造をキャプチャするには空間の劇的な操作が必要であるため、非線形次元の縮小法は時折、特にノイズの多い環境で偽構造を生成することが知られている。
そこで我々は,この現象に対処するために,分析者が次元削減結果をよりよく理解し,診断できるインタラクティブツールを開発した。
様々な分析プロットを使用して、結果に対する多面的な視点を提供し、正当性を決定する。
このツールはDRtoolというRパッケージを通じて利用できる。
関連論文リスト
- An Incremental Non-Linear Manifold Approximation Method [0.0]
本研究では, GMRA(Geometric Multi-Resolution Analysis) フレームワークを用いて, ストリーミングデータに対する漸進的非線形次元低減法を開発した。
提案手法は,クラスタマップ,PCAベクトル,ウェーブレット係数を漸進的に更新することで,リアルタイムなデータ解析と可視化を可能にする。
論文 参考訳(メタデータ) (2025-04-12T03:54:05Z) - A Novel Approach for Intrinsic Dimension Estimation [0.0]
実生活データは、その性質から複雑で非線形な構造を持つ。
低次元空間におけるデータセットのほぼ最適な表現を見つけることは、機械学習タスクの成功を改善するための適切なメカニズムを提供する。
本研究では,高効率で頑健な内在次元推定手法を提案する。
論文 参考訳(メタデータ) (2025-03-12T15:42:39Z) - Noisy Data Visualization using Functional Data Analysis [14.255424476694946]
動的プロセスのための関数情報幾何 (FIG) と呼ばれる新しいデータ可視化手法を提案する。
提案手法は,可視化のために設計されたEIGの変種よりも優れていることを示す。
次に、脳波による睡眠活動の測定を可視化するために、我々の手法を使用します。
論文 参考訳(メタデータ) (2024-06-05T15:53:25Z) - Distributional Reduction: Unifying Dimensionality Reduction and Clustering with Gromov-Wasserstein [56.62376364594194]
教師なし学習は、潜在的に大きな高次元データセットの基盤構造を捉えることを目的としている。
本研究では、最適輸送のレンズの下でこれらのアプローチを再検討し、Gromov-Wasserstein問題と関係を示す。
これにより、分散還元と呼ばれる新しい一般的なフレームワークが公開され、DRとクラスタリングを特別なケースとして回復し、単一の最適化問題内でそれらに共同で対処することができる。
論文 参考訳(メタデータ) (2024-02-03T19:00:19Z) - Intrinsic dimension estimation for discrete metrics [65.5438227932088]
本稿では,離散空間に埋め込まれたデータセットの内在次元(ID)を推定するアルゴリズムを提案する。
我々は,その精度をベンチマークデータセットで示すとともに,種鑑定のためのメダゲノミクスデータセットの分析に応用する。
このことは、列の空間の高次元性にもかかわらず、蒸発圧が低次元多様体に作用することを示唆している。
論文 参考訳(メタデータ) (2022-07-20T06:38:36Z) - A geometric framework for outlier detection in high-dimensional data [0.0]
異常検出はデータ分析において重要な課題である。
データセットのメトリック構造を利用するフレームワークを提供する。
この構造を利用することで,高次元データにおける外部観測の検出が大幅に向上することを示す。
論文 参考訳(メタデータ) (2022-07-01T12:07:51Z) - The Intrinsic Dimension of Images and Its Impact on Learning [60.811039723427676]
自然画像データは従来の画素表現の高次元にもかかわらず低次元構造を示すと広く信じられている。
本研究では,一般的なデータセットに次元推定ツールを適用し,深層学習における低次元構造の役割を検討する。
論文 参考訳(メタデータ) (2021-04-18T16:29:23Z) - A Local Similarity-Preserving Framework for Nonlinear Dimensionality
Reduction with Neural Networks [56.068488417457935]
本稿では,Vec2vecという新しい局所非線形手法を提案する。
ニューラルネットワークを訓練するために、マトリックスの近傍類似度グラフを構築し、データポイントのコンテキストを定義します。
8つの実データセットにおけるデータ分類とクラスタリングの実験により、Vec2vecは統計仮説テストにおける古典的な次元削減法よりも優れていることが示された。
論文 参考訳(メタデータ) (2021-03-10T23:10:47Z) - Manifold Learning via Manifold Deflation [105.7418091051558]
次元削減法は、高次元データの可視化と解釈に有用な手段を提供する。
多くの一般的な手法は単純な2次元のマニフォールドでも劇的に失敗する。
本稿では,グローバルな構造を座標として組み込んだ,新しいインクリメンタルな空間推定器の埋め込み手法を提案する。
実験により,本アルゴリズムは実世界および合成データセットに新規で興味深い埋め込みを復元することを示した。
論文 参考訳(メタデータ) (2020-07-07T10:04:28Z) - NCVis: Noise Contrastive Approach for Scalable Visualization [79.44177623781043]
NCVisはノイズコントラスト推定の音響統計的基礎の上に構築された高性能次元減少法である。
NCVisは,他の手法の表現品質を保ちながら,速度の観点から最先端技術よりも優れていることを示す。
論文 参考訳(メタデータ) (2020-01-30T15:43:50Z) - Multi-Objective Genetic Programming for Manifold Learning: Balancing
Quality and Dimensionality [4.4181317696554325]
最先端の多様体学習アルゴリズムはこの変換の実行方法において不透明である。
多様体の品質と次元の競合する目的を自動的にバランスさせる多目的アプローチを導入する。
提案手法は,基礎および最先端の多様体学習手法と競合する。
論文 参考訳(メタデータ) (2020-01-05T23:24:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。