論文の概要: Kernel distance measures for time series, random fields and other
structured data
- arxiv url: http://arxiv.org/abs/2109.14752v1
- Date: Wed, 29 Sep 2021 22:54:17 GMT
- ステータス: 処理完了
- システム内更新日: 2021-10-01 15:03:43.587301
- Title: Kernel distance measures for time series, random fields and other
structured data
- Title(参考訳): 時系列、ランダムフィールドおよびその他の構造化データに対するカーネル距離測定
- Authors: Srinjoy Das, Hrushikesh Mhaskar, Alexander Cloninger
- Abstract要約: kdiffは、構造化データのインスタンス間の距離を推定するためのカーネルベースの新しい尺度である。
これはインスタンス間の自己類似性と交差類似性の両方を考慮し、距離分布の低い定量値を用いて定義される。
kdiffをクラスタリングと分類問題のための距離尺度として用いた分離性条件について,いくつかの理論的結果が得られた。
- 参考スコア(独自算出の注目度): 71.61147615789537
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: This paper introduces kdiff, a novel kernel-based measure for estimating
distances between instances of time series, random fields and other forms of
structured data. This measure is based on the idea of matching distributions
that only overlap over a portion of their region of support. Our proposed
measure is inspired by MPdist which has been previously proposed for such
datasets and is constructed using Euclidean metrics, whereas kdiff is
constructed using non-linear kernel distances. Also, kdiff accounts for both
self and cross similarities across the instances and is defined using a lower
quantile of the distance distribution. Comparing the cross similarity to self
similarity allows for measures of similarity that are more robust to noise and
partial occlusions of the relevant signals. Our proposed measure kdiff is a
more general form of the well known kernel-based Maximum Mean Discrepancy (MMD)
distance estimated over the embeddings. Some theoretical results are provided
for separability conditions using kdiff as a distance measure for clustering
and classification problems where the embedding distributions can be modeled as
two component mixtures. Applications are demonstrated for clustering of
synthetic and real-life time series and image data, and the performance of
kdiff is compared to competing distance measures for clustering.
- Abstract(参考訳): 本稿では,時系列,確率場,その他の構造化データ間の距離を推定するカーネルベース手法であるkdiffを提案する。
この尺度は、サポートの領域の一部にのみ重なる分布をマッチングするという考え方に基づいている。
提案手法は,従来,ユークリッド計量を用いて提案してきたmpdistに触発され,kdiffは非線形カーネル距離を用いて構築されている。
また、kdiff はインスタンス間の自己類似性と交差類似性の両方を説明でき、距離分布の低い量子を用いて定義される。
自己類似性とクロス類似性を比較することで、関連する信号のノイズや部分的閉塞に対してより堅牢な類似性の測定が可能になる。
提案した測度kdiffは、埋め込みから推定されるカーネル上の最大平均離散距離(MMD)のより一般的な形式である。
kdiffをクラスタリングのための距離測度として用いる分離性条件と、埋め込み分布を2つの成分混合としてモデル化できる分類問題について理論的に検討した。
合成および実時間時系列および画像データのクラスタリングに応用例を示し、kdiffの性能をクラスタリングの競合する距離測定値と比較した。
関連論文リスト
- Convergence of Score-Based Discrete Diffusion Models: A Discrete-Time Analysis [56.442307356162864]
連続時間マルコフ連鎖(CTMC)に基づくスコアベース離散拡散モデルの理論的側面について検討する。
本稿では,事前定義された時間点におけるスコア推定値を利用する離散時間サンプリングアルゴリズムを一般状態空間$[S]d$に導入する。
我々の収束解析はジルサノフ法を用いて離散スコア関数の重要な性質を確立する。
論文 参考訳(メタデータ) (2024-10-03T09:07:13Z) - Mixed-type Distance Shrinkage and Selection for Clustering via Kernel Metric Learning [0.0]
我々は、混合カーネルを用いて異種性を測定するKDSUMと呼ばれる計量を提案する。
我々は、KDSUMが既存の混合型メトリクスから均一な異性度メトリクスへの縮小法であることを実証した。
論文 参考訳(メタデータ) (2023-06-02T19:51:48Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - A Robust and Flexible EM Algorithm for Mixtures of Elliptical
Distributions with Missing Data [71.9573352891936]
本稿では、ノイズや非ガウス的なデータに対するデータ計算の欠如に対処する。
楕円分布と潜在的な欠落データを扱う特性を混合した新しいEMアルゴリズムについて検討した。
合成データの実験的結果は,提案アルゴリズムが外れ値に対して頑健であり,非ガウスデータで使用可能であることを示す。
論文 参考訳(メタデータ) (2022-01-28T10:01:37Z) - Density Ratio Estimation via Infinitesimal Classification [85.08255198145304]
そこで我々は, DRE-inftyを提案する。 DRE-inftyは, 密度比推定(DRE)を, より簡単なサブプロブレムに還元する手法である。
モンテカルロ法にインスパイアされ、中間ブリッジ分布の無限連続体を介して2つの分布の間を滑らかに補間する。
提案手法は,複雑な高次元データセット上での相互情報推定やエネルギーベースモデリングなどの下流タスクにおいて良好に動作することを示す。
論文 参考訳(メタデータ) (2021-11-22T06:26:29Z) - Tangent Space and Dimension Estimation with the Wasserstein Distance [10.118241139691952]
ユークリッド空間の滑らかなコンパクト部分多様体の近くで独立にサンプリングされた点の集合を考える。
我々は、その多様体の次元と接空間の両方を推定するために必要なサンプル点の数について数学的に厳密な境界を与える。
論文 参考訳(メタデータ) (2021-10-12T21:02:06Z) - The Exploitation of Distance Distributions for Clustering [3.42658286826597]
クラスタ分析では、距離分布の異なる特性が適切な距離選択に関係していると判断される。
ミラー化密度プロットを用いて分布解析を用いて,この仕様を体系的に検討することにより,クラスタ解析においてマルチモーダル距離分布が好ましいことを示す。
実験は、クラスタリングのタスクのために、いくつかの人工データセットと自然なデータセットで行われます。
論文 参考訳(メタデータ) (2021-08-22T06:22:08Z) - Spatially relaxed inference on high-dimensional linear models [48.989769153211995]
本研究では,空間的に制約されたクラスタリング,統計的推論,アンサンブルを組み合わせ,複数のクラスタリング推論解を集約するアンサンブルクラスタリング推論アルゴリズムの特性について検討する。
アンサンブルクラスタ推論アルゴリズムは,最大クラスター径に等しい$delta$-FWERの標準仮定で$delta$-FWERを制御することを示す。
論文 参考訳(メタデータ) (2021-06-04T16:37:19Z) - Depth-based pseudo-metrics between probability distributions [1.1470070927586016]
本研究では,データ深度に基づく連続確率測度と関連する中央領域の2つの疑似測度を提案する。
Wasserstein距離とは対照的に、提案された疑似メトリックは次元の呪いに苦しむことはない。
地域ベースの擬似メトリックは堅牢なw.r.tである。
両端と尾が重い。
論文 参考訳(メタデータ) (2021-03-23T17:33:18Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。