論文の概要: Clustering multivariate functional data using unsupervised binary trees
- arxiv url: http://arxiv.org/abs/2012.05973v2
- Date: Mon, 14 Dec 2020 09:10:03 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-15 08:48:49.357950
- Title: Clustering multivariate functional data using unsupervised binary trees
- Title(参考訳): 教師なし二分木を用いた多変量関数データのクラスタリング
- Authors: Steven Golovkine and Nicolas Klutchnikoff and Valentin Patilea
- Abstract要約: 本研究では,汎用関数データに対するモデルに基づくクラスタリングアルゴリズムを提案する。
ランダム関数データ実現は、定義領域内の離散的、おそらくランダムな点において誤差で測定することができる。
新しいアルゴリズムは、簡単に解釈可能な結果とオンラインデータセットの迅速な予測を提供します。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: We propose a model-based clustering algorithm for a general class of
functional data for which the components could be curves or images. The random
functional data realizations could be measured with error at discrete, and
possibly random, points in the definition domain. The idea is to build a set of
binary trees by recursive splitting of the observations. The number of groups
are determined in a data-driven way. The new algorithm provides easily
interpretable results and fast predictions for online data sets. Results on
simulated datasets reveal good performance in various complex settings. The
methodology is applied to the analysis of vehicle trajectories on a German
roundabout.
- Abstract(参考訳): 本稿では,各成分が曲線や画像となるような関数データの一般クラスに対するモデルベースクラスタリングアルゴリズムを提案する。
ランダム関数データ実現は、定義領域内の離散的、おそらくランダムな点において誤差で測定することができる。
この考え方は、観測を再帰的に分割することでバイナリツリーの集合を構築することである。
グループの数はデータ駆動の方法で決定される。
この新しいアルゴリズムは、オンラインデータセットに対して容易に解釈可能な結果と高速な予測を提供する。
シミュレーションデータセットの結果は、様々な複雑な設定で良いパフォーマンスを示す。
この手法はドイツのラウンドアバウトにおける車両軌道の解析に適用される。
関連論文リスト
- Topological Quality of Subsets via Persistence Matching Diagrams [0.196629787330046]
我々は、トポロジカルデータ解析技術を用いて、そのデータセットに関するサブセットの品質を測定する。
特に,本手法では,選択したサブセットが教師付き学習モデルの貧弱な性能をもたらす可能性がある理由を説明することができる。
論文 参考訳(メタデータ) (2023-06-04T17:08:41Z) - funLOCI: a local clustering algorithm for functional data [0.0]
funLOCIは、分割階層クラスタリングに基づく3段階のアルゴリズムである。
大量のローカルクラスタを扱うために、結果の最小化のために余分なステップが実装されている。
論文 参考訳(メタデータ) (2023-05-22T12:51:58Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Learning from aggregated data with a maximum entropy model [73.63512438583375]
我々は,観測されていない特徴分布を最大エントロピー仮説で近似することにより,ロジスティック回帰と類似した新しいモデルが,集約データからのみ学習されることを示す。
我々は、この方法で学習したモデルが、完全な非凝集データでトレーニングされたロジスティックモデルに匹敵するパフォーマンスを達成することができるという、いくつかの公開データセットに関する実証的な証拠を提示する。
論文 参考訳(メタデータ) (2022-10-05T09:17:27Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Towards Improved and Interpretable Deep Metric Learning via Attentive
Grouping [103.71992720794421]
グループ化は、様々な特徴の計算にディープ・メトリック・ラーニングでよく用いられてきた。
本稿では,任意のメトリクス学習フレームワークと柔軟に統合可能な,改良された解釈可能なグループ化手法を提案する。
論文 参考訳(メタデータ) (2020-11-17T19:08:24Z) - Model Fusion with Kullback--Leibler Divergence [58.20269014662046]
異種データセットから学習した後続分布を融合する手法を提案する。
我々のアルゴリズムは、融合モデルと個々のデータセット後部の両方に対する平均場仮定に依存している。
論文 参考訳(メタデータ) (2020-07-13T03:27:45Z) - Clustering with Tangles: Algorithmic Framework and Theoretical
Guarantees [10.992467680364962]
本稿では,機械学習応用におけるトライアングルの実用可能性を示す。
任意のデータセットのカットの集合が与えられたとき、トライアングルはこれらのカットを密集構造の方向を指し示すために集約する。
タングルを用いたクラスタリングのためのアルゴリズムフレームワークを構築し、様々な設定で理論的保証を証明し、広範囲なシミュレーションとユースケースを提供する。
論文 参考訳(メタデータ) (2020-06-25T14:23:56Z) - New advances in enumerative biclustering algorithms with online
partitioning [80.22629846165306]
さらに、数値データセットの列に定数値を持つ最大二クラスタの効率的で完全で正しい非冗長列挙を実現できる二クラスタリングアルゴリズムであるRIn-Close_CVCを拡張した。
改良されたアルゴリズムはRIn-Close_CVC3と呼ばれ、RIn-Close_CVCの魅力的な特性を保ちます。
論文 参考訳(メタデータ) (2020-03-07T14:54:26Z) - Data Structures & Algorithms for Exact Inference in Hierarchical
Clustering [41.24805506595378]
本稿では,新しいトレリスデータ構造に基づく階層クラスタリングにおける表現型推論のための動的プログラミングアルゴリズムを提案する。
我々のアルゴリズムは時間と空間に比例してN$要素のパワーセットをスケールし、これは(2N-3)! 可能な階層のそれぞれを明示的に考慮するよりも指数関数的に効率的である。
論文 参考訳(メタデータ) (2020-02-26T17:43:53Z) - Heterogeneous Transfer Learning in Ensemble Clustering [0.0]
類似したラベル付きデータが利用できるクラスタリング問題を考える。
本手法は,データの構造的特徴を記述したメタ機能の構築に基づく。
モンテカルロモデルを用いた実験により,その効率性が確認された。
論文 参考訳(メタデータ) (2020-01-20T16:03:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。