論文の概要: Outlier Detection Using Vector Cosine Similarity by Adding a Dimension
- arxiv url: http://arxiv.org/abs/2601.00883v1
- Date: Wed, 31 Dec 2025 08:18:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-01-06 16:25:21.820408
- Title: Outlier Detection Using Vector Cosine Similarity by Adding a Dimension
- Title(参考訳): ベクトルコサイン類似度を用いた次元付加による外乱検出
- Authors: Zhongyang Shen,
- Abstract要約: 本稿では,多次元データに対する新しい外れ値検出手法を提案する。
本手法は,元データにゼロ値の次元を付加して構築した新しいデータセットを用いて,ベクトルコサイン類似度に基づいて外れ値を検出する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We propose a new outlier detection method for multi-dimensional data. The method detects outliers based on vector cosine similarity, using a new dataset constructed by adding a dimension with zero values to the original data. When a point in the new dataset is selected as the measured point, an observation point is created as the origin, differing only in the new dimension by having a non-zero value compared to the measured point. Vectors are then formed from the observation point to the measured point and to other points in the dataset. By comparing the cosine similarities of these vectors, abnormal data can be identified. An optimized implementation (MDOD) is available on PyPI: https://pypi.org/project/mdod/.
- Abstract(参考訳): 本稿では,多次元データに対する新しい外れ値検出手法を提案する。
本手法は,元データにゼロ値の次元を付加して構築した新しいデータセットを用いて,ベクトルコサイン類似度に基づいて外れ値を検出する。
新しいデータセット内の点が測定点として選択されると、観測点が原点として生成され、測定点と非ゼロ値を有することにより、新しい次元においてのみ異なる。
次に、ベクトルは観測点から測定点、およびデータセット内の他の点まで形成される。
これらのベクトルのコサイン類似性を比較することで、異常なデータを同定することができる。
最適化実装(MDOD)は、PyPIで利用可能である。
関連論文リスト
- Noncommutative Model Selection for Data Clustering and Dimension Reduction Using Relative von Neumann Entropy [0.0]
教師なし分類と次元削減のためのデータ駆動型アルゴリズムのペアを提案する。
我々の実験では、クラスタリングアルゴリズムは、非自明な幾何学とトポロジを持つデータセット上の$k$-meansクラスタリングよりも優れています。
論文 参考訳(メタデータ) (2024-11-29T18:04:11Z) - Influence functions and regularity tangents for efficient active learning [0.0]
本稿では,データに対する好奇心を持つ回帰モデルを提供するための効率的な方法について述べる。
提案手法では,潜在的な問合せデータポイントに関する「好奇心」の評価を,モデルの損失勾配を計算すると同時に迅速に行うことができる。
本手法により計算された量は,「影響関数」の例であり,モデル複雑性の2乗変化が期待できる値であることを示す。
論文 参考訳(メタデータ) (2024-11-22T18:14:26Z) - ACEV: Unsupervised Intersecting Manifold Segmentation using Adaptation to Angular Change of Eigenvectors in Intrinsic Dimension [3.2839905453386153]
内在次元の$d$次元の多様体が他の多様体と交わるとき、データ分散は$d$方向以上で成長する。
提案手法は局所的なデータ分散を測定し,そのベクトル方向を決定する。
非ゼロ分散を持つベクトルの数を数え、多様体の内在次元を決定する。
論文 参考訳(メタデータ) (2024-09-30T20:37:47Z) - Rethinking k-means from manifold learning perspective [122.38667613245151]
平均推定なしで直接データのクラスタを検出する新しいクラスタリングアルゴリズムを提案する。
具体的には,バタワースフィルタを用いてデータ点間の距離行列を構成する。
異なる視点に埋め込まれた相補的な情報をうまく活用するために、テンソルのSchatten p-norm正規化を利用する。
論文 参考訳(メタデータ) (2023-05-12T03:01:41Z) - Kernel distance measures for time series, random fields and other
structured data [71.61147615789537]
kdiffは、構造化データのインスタンス間の距離を推定するためのカーネルベースの新しい尺度である。
これはインスタンス間の自己類似性と交差類似性の両方を考慮し、距離分布の低い定量値を用いて定義される。
kdiffをクラスタリングと分類問題のための距離尺度として用いた分離性条件について,いくつかの理論的結果が得られた。
論文 参考訳(メタデータ) (2021-09-29T22:54:17Z) - Manifold Hypothesis in Data Analysis: Double Geometrically-Probabilistic
Approach to Manifold Dimension Estimation [92.81218653234669]
本稿では, 多様体仮説の検証と基礎となる多様体次元推定に対する新しいアプローチを提案する。
我々の幾何学的手法はミンコフスキー次元計算のためのよく知られたボックスカウントアルゴリズムのスパースデータの修正である。
実データセットの実験では、2つの手法の組み合わせに基づく提案されたアプローチが強力で効果的であることが示されている。
論文 参考訳(メタデータ) (2021-07-08T15:35:54Z) - Evaluating representations by the complexity of learning low-loss
predictors [55.94170724668857]
下流タスクの解決に使用されるデータの表現を評価することの問題点を考察する。
本稿では,関心のあるタスクにおける低損失を実現する表現の上に,予測器を学習する複雑性によって表現の質を測定することを提案する。
論文 参考訳(メタデータ) (2020-09-15T22:06:58Z) - LOCA: LOcal Conformal Autoencoder for standardized data coordinates [6.608924227377152]
多様体の潜在変数に等長な $mathbbRd$ の埋め込みを学ぶ方法を提案する。
我々の埋め込みは, 変形を補正する埋め込みを構成するアルゴリズムであるLOCA (Local Conformal Autoencoder) を用いて得られる。
また、単一サイトWi-FiのローカライゼーションデータにLOCAを適用し、曲面推定を3ドルで行う。
論文 参考訳(メタデータ) (2020-04-15T17:49:37Z) - Robust 6D Object Pose Estimation by Learning RGB-D Features [59.580366107770764]
本稿では、この局所最適問題を解くために、回転回帰のための離散連続的な新しい定式化を提案する。
我々はSO(3)の回転アンカーを均一にサンプリングし、各アンカーから目標への制約付き偏差を予測し、最適な予測を選択するための不確実性スコアを出力する。
LINEMOD と YCB-Video の2つのベンチマーク実験により,提案手法が最先端の手法より優れていることが示された。
論文 参考訳(メタデータ) (2020-02-29T06:24:55Z) - CONSAC: Robust Multi-Model Fitting by Conditional Sample Consensus [62.86856923633923]
我々は,同じ形状の複数のパラメトリックモデルを雑音測定に適合させる頑健な推定器を提案する。
複数のモデル検出のための手作り検索戦略を利用する従来の研究とは対照的に,データから検索戦略を学習する。
探索の自己教師付き学習において,提案したアルゴリズムをマルチホログラフィー推定で評価し,最先端手法よりも優れた精度を示す。
論文 参考訳(メタデータ) (2020-01-08T17:37:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。