論文の概要: HLoOP -- Hyperbolic 2-space Local Outlier Probabilities
- arxiv url: http://arxiv.org/abs/2312.03895v1
- Date: Wed, 6 Dec 2023 20:38:39 GMT
- ステータス: 処理完了
- システム内更新日: 2023-12-08 16:52:56.882019
- Title: HLoOP -- Hyperbolic 2-space Local Outlier Probabilities
- Title(参考訳): HLoOP - 双曲型2空間局所外乱確率
- Authors: Cl\'emence Allietta, Jean-Philippe Condomines, Jean-Yves Tourneret,
Emmanuel Lochin
- Abstract要約: 本稿では,双曲型2次元空間に接地したデータセットに対して,局所的な外れ値を検出するための簡単なフレームワークを提案する。
開発されたHLoOPは、密度に基づく外れ値スコアリングと確率論的、統計的指向のアプローチを組み合わせたものである。
HLoOPアルゴリズムはWordNetデータセット上でテストされ、有望な結果が得られる。
- 参考スコア(独自算出の注目度): 4.030910640265943
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: Hyperbolic geometry has recently garnered considerable attention in machine
learning due to its capacity to embed hierarchical graph structures with low
distortions for further downstream processing. This paper introduces a simple
framework to detect local outliers for datasets grounded in hyperbolic 2-space
referred to as HLoOP (Hyperbolic Local Outlier Probability). Within a Euclidean
space, well-known techniques for local outlier detection are based on the Local
Outlier Factor (LOF) and its variant, the LoOP (Local Outlier Probability),
which incorporates probabilistic concepts to model the outlier level of a data
vector. The developed HLoOP combines the idea of finding nearest neighbors,
density-based outlier scoring with a probabilistic, statistically oriented
approach. Therefore, the method consists in computing the Riemmanian distance
of a data point to its nearest neighbors following a Gaussian probability
density function expressed in a hyperbolic space. This is achieved by defining
a Gaussian cumulative distribution in this space. The HLoOP algorithm is tested
on the WordNet dataset yielding promising results. Code and data will be made
available on request for reproductibility.
- Abstract(参考訳): ハイパーボリック幾何は、下流処理のために低歪みの階層グラフ構造を埋め込む能力があるため、機械学習において大きな注目を集めている。
本稿では,hloop (hyperbolic local outlier probability) と呼ばれる双曲型2次元空間に接するデータセットの局所的外れ値を検出するための簡易なフレームワークを提案する。
ユークリッド空間内では、局所外乱検出のためのよく知られたテクニックは、局所外乱係数(LOF)とその変種であるLoOP(Local Outlier Probability)に基づいており、これはデータベクトルの外乱レベルをモデル化するための確率論的概念を取り入れている。
開発されたhloopは、密度に基づくアウトリアースコアと確率的、統計的指向のアプローチを組み合わせることで、最も近い隣人を見つけることができる。
したがって、この方法は、双曲空間で表されるガウス確率密度関数に従って、データポイントからその近傍へのリームマン距離を計算することである。
これは、この空間におけるガウス累積分布を定義することによって達成される。
HLoOPアルゴリズムはWordNetデータセット上でテストされ、有望な結果が得られる。
コードとデータは、再生産の要求に応じて利用可能になる。
関連論文リスト
- Hyperspectral Target Detection Based on Low-Rank Background Subspace
Learning and Graph Laplacian Regularization [2.9626402880497267]
ハイパースペクトル目標検出は、スペクトル特性に基づく薄暗い物体や小さな物体の発見に有効である。
既存の表現に基づく手法は、未知の背景辞書の問題によって妨げられる。
本稿では低ランク表現(LRR)とグラフラプラシア正規化(GLR)に基づく効率的な最適化手法を提案する。
論文 参考訳(メタデータ) (2023-06-01T13:51:08Z) - Approximating a RUM from Distributions on k-Slates [88.32814292632675]
与えられた分布を平均で最もよく近似するRUMを求める一般化時間アルゴリズムを求める。
我々の理論的結果は、実世界のデータセットに効果的でスケール可能なものを得るという、実践的な結果も得られます。
論文 参考訳(メタデータ) (2023-05-22T17:43:34Z) - Combating Mode Collapse in GANs via Manifold Entropy Estimation [70.06639443446545]
Generative Adversarial Networks (GAN) は、様々なタスクやアプリケーションにおいて魅力的な結果を示している。
GANのモード崩壊問題に対処するための新しいトレーニングパイプラインを提案する。
論文 参考訳(メタデータ) (2022-08-25T12:33:31Z) - Subspace clustering in high-dimensions: Phase transitions \&
Statistical-to-Computational gap [24.073221004661427]
部分空間クラスタリングを研究するための単純なモデルは、高次元の$k$-ガウス混合モデルである。
広帯域な高次元状態における統計的に最適な再構成誤差を正確に評価する。
論文 参考訳(メタデータ) (2022-05-26T17:47:35Z) - Riemannian classification of EEG signals with missing values [67.90148548467762]
本稿では脳波の分類に欠落したデータを扱うための2つの方法を提案する。
第1のアプローチでは、インプットされたデータと$k$-nearestの隣人アルゴリズムとの共分散を推定し、第2のアプローチでは、期待最大化アルゴリズム内で観測データの可能性を活用することにより、観測データに依存する。
その結果, 提案手法は観測データに基づく分類よりも優れており, 欠落したデータ比が増大しても高い精度を維持することができることがわかった。
論文 参考訳(メタデータ) (2021-10-19T14:24:50Z) - Featurized Density Ratio Estimation [82.40706152910292]
本研究では,2つの分布を推定前の共通特徴空間にマッピングするために,可逆生成モデルを活用することを提案する。
この偉業化は、学習された入力空間の密度比が任意に不正確な場合、潜在空間において密度が密接な関係をもたらす。
同時に、特徴写像の可逆性は、特徴空間で計算された比が入力空間で計算された比と同値であることを保証する。
論文 参考訳(メタデータ) (2021-07-05T18:30:26Z) - Tensor Laplacian Regularized Low-Rank Representation for Non-uniformly
Distributed Data Subspace Clustering [2.578242050187029]
低ランク表現(LRR)は、サブスペースクラスタリングにおけるデータポイントの局所性情報を破棄する。
本稿では,隣接ノードの変動数を容易にし,データの局所性情報を組み込むハイパーグラフモデルを提案する。
人工および実データを用いた実験により,提案手法の精度と精度が向上した。
論文 参考訳(メタデータ) (2021-03-06T08:22:24Z) - Probabilistic Outlier Detection and Generation [11.35109169978955]
Wasserstein 二重オートエンコーダは、インリエとアウトプライヤの検出と生成の両方に使用されます。
WALDOは、検出精度とロバスト性のために古典的なデータセットで評価される。
論文 参考訳(メタデータ) (2020-12-22T22:42:56Z) - Improving Generative Adversarial Networks with Local Coordinate Coding [150.24880482480455]
GAN(Generative Adversarial Network)は、事前定義された事前分布から現実的なデータを生成することに成功している。
実際には、意味情報はデータから学んだ潜在的な分布によって表現される。
ローカル座標符号化(LCC)を用いたLCCGANモデルを提案する。
論文 参考訳(メタデータ) (2020-07-28T09:17:50Z) - Learning while Respecting Privacy and Robustness to Distributional
Uncertainties and Adversarial Data [66.78671826743884]
分散ロバストな最適化フレームワークはパラメトリックモデルのトレーニングのために検討されている。
目的は、逆操作された入力データに対して頑健なトレーニングモデルを提供することである。
提案されたアルゴリズムは、オーバーヘッドがほとんどない堅牢性を提供する。
論文 参考訳(メタデータ) (2020-07-07T18:25:25Z) - Outlier Detection Using a Novel method: Quantum Clustering [24.11904406960212]
通常のデータインスタンスは、データ密度の変動がほとんどない領域に常駐する。
我々は、教師なし外乱検出に新しい密度に基づくアプローチを適用した。
論文 参考訳(メタデータ) (2020-06-08T17:19:41Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。