論文の概要: Prototype Selection Using Topological Data Analysis
- arxiv url: http://arxiv.org/abs/2511.04873v1
- Date: Thu, 06 Nov 2025 23:21:43 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-11-10 21:00:44.618929
- Title: Prototype Selection Using Topological Data Analysis
- Title(参考訳): トポロジカルデータ解析を用いたプロトタイプ選択
- Authors: Jordan Eckert, Elvan Ceyhan, Henry Schenck,
- Abstract要約: Topological Prototype Selector (TPS) は、大規模なデータセットから代表的なサブセット(プロトタイプ)を選択するためのフレームワークである。
TPSは、データサイズを大幅に削減しながら、分類性能を著しく維持または改善する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Recently, there has been an explosion in statistical learning literature to represent data using topological principles to capture structure and relationships. We propose a topological data analysis (TDA)-based framework, named Topological Prototype Selector (TPS), for selecting representative subsets (prototypes) from large datasets. We demonstrate the effectiveness of TPS on simulated data under different data intrinsic characteristics, and compare TPS against other currently used prototype selection methods in real data settings. In all simulated and real data settings, TPS significantly preserves or improves classification performance while substantially reducing data size. These contributions advance both algorithmic and geometric aspects of prototype learning and offer practical tools for parallelized, interpretable, and efficient classification.
- Abstract(参考訳): 近年,構造や関係を捉えたトポロジカルな原理を用いてデータを表現する統計学習文献が爆発的に増えている。
大規模データセットから代表的なサブセット(プロトタイプ)を選択するためのトポロジカルデータ分析(TDA)ベースのフレームワークであるトポロジカルプロトタイプセレクタ(TPS)を提案する。
異なるデータ固有の特性下でのシミュレーションデータに対するTPSの有効性を実証し、実データ設定で現在使われている他のプロトタイプ選択方法と比較する。
すべてのシミュレートされた実データ設定において、TPSはデータサイズを大幅に削減しながら、分類性能を著しく維持または改善する。
これらの貢献は、プロトタイプ学習のアルゴリズム的側面と幾何学的側面の両方を前進させ、並列化、解釈可能、効率的な分類のための実用的なツールを提供する。
関連論文リスト
- Minimally Supervised Learning using Topological Projections in
Self-Organizing Maps [55.31182147885694]
自己組織化マップ(SOM)におけるトポロジカルプロジェクションに基づく半教師付き学習手法を提案する。
提案手法は,まずラベル付きデータ上でSOMを訓練し,最小限のラベル付きデータポイントをキーベストマッチングユニット(BMU)に割り当てる。
提案した最小教師付きモデルが従来の回帰手法を大幅に上回ることを示す。
論文 参考訳(メタデータ) (2024-01-12T22:51:48Z) - TRIAGE: Characterizing and auditing training data for improved
regression [80.11415390605215]
TRIAGEは回帰タスクに適した新しいデータキャラクタリゼーションフレームワークで、広範囲の回帰器と互換性がある。
TRIAGEは、共形予測分布を利用して、モデルに依存しないスコアリング方法、TRIAGEスコアを提供する。
TRIAGEの特徴は一貫性があり、複数の回帰設定においてデータの彫刻/フィルタリングによるパフォーマンス向上に有効であることを示す。
論文 参考訳(メタデータ) (2023-10-29T10:31:59Z) - Natural Language-Based Synthetic Data Generation for Cluster Analysis [4.13592995550836]
クラスタ分析は、異なるアルゴリズムの評価と比較に有効なベンチマークに依存している。
本研究では,高レベルシナリオの直接仕様に基づく合成データ生成を提案する。
私たちのオープンソースのPythonパッケージは、このワークフローを実装しています。
論文 参考訳(メタデータ) (2023-03-24T23:45:27Z) - Detection and Evaluation of Clusters within Sequential Data [58.720142291102135]
Block Markov Chainsのクラスタリングアルゴリズムは理論的最適性を保証する。
特に、私たちのシーケンシャルデータは、ヒトのDNA、テキスト、動物運動データ、金融市場から派生しています。
ブロックマルコフ連鎖モデルの仮定は、実際に探索データ解析において有意義な洞察を得られることが判明した。
論文 参考訳(メタデータ) (2022-10-04T15:22:39Z) - On topological data analysis for structural dynamics: an introduction to
persistent homology [0.0]
トポロジカル・データ分析(トポロジカル・データ・アナリティクス)は、長さのスケールでデータの形状を定量化する手法である。
永続ホモロジー(Persistent homology)は、長さのスケールでデータの形状を定量化する手法である。
論文 参考訳(メタデータ) (2022-09-12T10:39:38Z) - Capturing patterns of variation unique to a specific dataset [68.8204255655161]
対象データセットの1つ以上の比較データセットに対する低次元表現を同定するチューニングフリー手法を提案する。
複数の実験で、単一のバックグラウンドデータセットを持つUCAが、様々なチューニングパラメータを持つcPCAと同じような結果を達成することを示しました。
論文 参考訳(メタデータ) (2021-04-16T15:07:32Z) - Joint Geometric and Topological Analysis of Hierarchical Datasets [7.098759778181621]
本稿では,複数の階層的データセットに整理された高次元データに注目する。
この研究の主な新規性は、トポロジカルデータ分析と幾何多様体学習という、2つの強力なデータ分析アプローチの組み合わせにある。
本手法は, 最新手法と比較して優れた分類結果をもたらすことを示した。
論文 参考訳(メタデータ) (2021-04-03T13:02:00Z) - Few-Shot Named Entity Recognition: A Comprehensive Study [92.40991050806544]
マルチショット設定のモデル一般化能力を向上させるための3つの手法を検討する。
ラベル付きデータの比率の異なる10の公開nerデータセットについて経験的比較を行う。
マルチショットとトレーニングフリーの両方の設定で最新の結果を作成します。
論文 参考訳(メタデータ) (2020-12-29T23:43:16Z) - Data Segmentation via t-SNE, DBSCAN, and Random Forest [0.0]
本研究では、データを自然クラスタに分割し、最も重要な特徴に基づいて各クラスタの特徴プロファイルを生成するデータセグメンテーションアルゴリズムを提案する。
このアルゴリズムを解説し、Instagramの実際のソーシャルメディアサイトデータと同様に、IrisとMNISTデータセットを用いてケーススタディを提供する。
論文 参考訳(メタデータ) (2020-10-26T15:59:15Z) - Classification Algorithm of Speech Data of Parkinsons Disease Based on
Convolution Sparse Kernel Transfer Learning with Optimal Kernel and Parallel
Sample Feature Selection [14.1270098940551]
スパースカーネル転送学習に基づく新しいPD分類アルゴリズムを提案する。
スパース伝達学習は公共データセットからPD音声の特徴構造情報を抽出するために用いられる。
提案アルゴリズムは、分類精度が明らかに向上する。
論文 参考訳(メタデータ) (2020-02-10T13:20:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。