論文の概要: A flexible outlier detector based on a topology given by graph
communities
- arxiv url: http://arxiv.org/abs/2002.07791v1
- Date: Tue, 18 Feb 2020 18:40:31 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-30 19:51:54.515920
- Title: A flexible outlier detector based on a topology given by graph
communities
- Title(参考訳): グラフ群が与える位相に基づくフレキシブル・アウトリー検出器
- Authors: O. Ramos Terrades, A. Berenguel, D. Gil
- Abstract要約: 異常検出は機械学習手法と統計的予測モデルの最適性能に不可欠である。
トポロジーは、特徴空間内の互いに隣接する近傍を成す重み付きグラフのコミュニティを用いて計算される。
当社のアプローチは、ローカル戦略とグローバル戦略の両方において、複数のビュー設定と単一ビュー設定で総合的に優れています。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Outlier, or anomaly, detection is essential for optimal performance of
machine learning methods and statistical predictive models. It is not just a
technical step in a data cleaning process but a key topic in many fields such
as fraudulent document detection, in medical applications and assisted
diagnosis systems or detecting security threats. In contrast to
population-based methods, neighborhood based local approaches are simple
flexible methods that have the potential to perform well in small sample size
unbalanced problems. However, a main concern of local approaches is the impact
that the computation of each sample neighborhood has on the method performance.
Most approaches use a distance in the feature space to define a single
neighborhood that requires careful selection of several parameters. This work
presents a local approach based on a local measure of the heterogeneity of
sample labels in the feature space considered as a topological manifold.
Topology is computed using the communities of a weighted graph codifying mutual
nearest neighbors in the feature space. This way, we provide with a set of
multiple neighborhoods able to describe the structure of complex spaces without
parameter fine tuning. The extensive experiments on real-world data sets show
that our approach overall outperforms, both, local and global strategies in
multi and single view settings.
- Abstract(参考訳): 異常検出は、機械学習手法と統計的予測モデルの最適性能に不可欠である。
データクリーニングプロセスにおける単なる技術的ステップではなく、不正な文書検出、医療応用、診断支援システム、セキュリティ脅威の検出など、多くの分野で重要なトピックである。
人口ベースの手法とは対照的に、近傍ベースの局所的なアプローチは、小さなサンプルサイズの不均衡問題でうまく機能する可能性を持つ単純な柔軟な手法である。
しかし、局所的なアプローチの主な関心事は、各サンプル地区の計算がメソッド性能に与える影響である。
ほとんどのアプローチでは特徴空間内の距離を使い、いくつかのパラメータを慎重に選択する必要がある1つの近傍を定義する。
この研究は、位相多様体と見なされる特徴空間におけるサンプルラベルの不均一性の局所測度に基づく局所的アプローチを示す。
トポロジーは、特徴空間内の互いに隣接する近傍を成す重み付きグラフのコミュニティを用いて計算される。
この方法では、パラメータの微調整なしに複素空間の構造を記述できる複数の近傍の集合を提供する。
実世界のデータセットに関する広範な実験は、マルチビューとシングルビューの設定において、我々のアプローチが、ローカルとグローバルの両方の戦略よりも優れていることを示している。
関連論文リスト
- PeFAD: A Parameter-Efficient Federated Framework for Time Series Anomaly Detection [51.20479454379662]
私たちはaを提案します。
フェデレートされた異常検出フレームワークであるPeFADは、プライバシーの懸念が高まっている。
我々は、4つの実際のデータセットに対して広範な評価を行い、PeFADは既存の最先端ベースラインを最大28.74%上回っている。
論文 参考訳(メタデータ) (2024-06-04T13:51:08Z) - Large-scale Fully-Unsupervised Re-Identification [78.47108158030213]
大規模未ラベルデータから学ぶための2つの戦略を提案する。
第1の戦略は、近傍関係に違反することなく、それぞれのデータセットサイズを減らすために、局所的な近傍サンプリングを行う。
第2の戦略は、低時間上限の複雑さを持ち、メモリの複雑さを O(n2) から O(kn) に k n で還元する新しい再帰的手法を利用する。
論文 参考訳(メタデータ) (2023-07-26T16:19:19Z) - A One-shot Framework for Distributed Clustered Learning in Heterogeneous
Environments [54.172993875654015]
異種環境における分散学習のためのコミュニケーション効率化手法のファミリーを提案する。
ユーザによるローカル計算に基づくワンショットアプローチと、サーバにおけるクラスタリングベースのアグリゲーションステップは、強力な学習保証を提供する。
厳密な凸問題に対しては,ユーザ毎のデータ点数がしきい値を超える限り,提案手法はサンプルサイズの観点から順序最適平均二乗誤差率を達成する。
論文 参考訳(メタデータ) (2022-09-22T09:04:10Z) - Learning-based Localizability Estimation for Robust LiDAR Localization [13.298113481670038]
LiDARベースのローカライゼーションとマッピングは、多くの現代のロボットシステムにおける中核的なコンポーネントの1つである。
本研究では,ロボット動作中の(非)局所性を検出するニューラルネットワークに基づく推定手法を提案する。
論文 参考訳(メタデータ) (2022-03-11T01:12:00Z) - Local Learning Matters: Rethinking Data Heterogeneity in Federated
Learning [61.488646649045215]
フェデレートラーニング(FL)は、クライアントのネットワーク(エッジデバイス)でプライバシ保護、分散ラーニングを行うための有望な戦略である。
論文 参考訳(メタデータ) (2021-11-28T19:03:39Z) - An Information-Theoretic Approach to Persistent Environment Monitoring
Through Low Rank Model Based Planning and Prediction [19.95989053853125]
本研究では,大面積の観測点を限定的に選択する手法を提案する。
対象属性の低ランクモデルと情報最大化パスプランナを組み合わせて,属性の状態を予測する。
2つの実環境データセットのシミュレーションにおいて,本手法の評価を行った。
論文 参考訳(メタデータ) (2020-09-02T16:19:55Z) - Locally induced Gaussian processes for large-scale simulation
experiments [0.0]
本稿では,ポイントの配置とその多さを病理学的に抑制できることを示す。
提案手法は,グローバルなインジェクションポイントとデータサブセットに基づく局所GP近似をハイブリダイズする。
計算効率のフロンティアにおいて,局所誘導点がグローバルおよびデータサブセットの構成要素を拡張していることを示す。
論文 参考訳(メタデータ) (2020-08-28T21:37:46Z) - Spatial Classification With Limited Observations Based On Physics-Aware
Structural Constraint [18.070762916388272]
限られた特徴観察による空間分類は、機械学習において難しい問題である。
本稿では,各クラスにおけるサンプルの特徴値にマルチモーダル分布を従わせることによって,最近のアプローチを拡張した。
マルチモーダル分布を持つ拡張モデルの学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-08-25T20:07:28Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Guided Uncertainty-Aware Policy Optimization: Combining Learning and
Model-Based Strategies for Sample-Efficient Policy Learning [75.56839075060819]
従来のロボットのアプローチは、環境の正確なモデル、タスクの実行方法の詳細な説明、現在の状態を追跡するための堅牢な認識システムに依存している。
強化学習アプローチは、タスクを記述するための報酬信号だけで、生の感覚入力から直接操作することができるが、非常にサンプル非効率で脆弱である。
本研究では,ロボットの知覚・運動パイプラインにおける不正確さを克服できる一般的な手法を得るために,モデルに基づく手法の強みと学習に基づく手法の柔軟性を組み合わせる。
論文 参考訳(メタデータ) (2020-05-21T19:47:05Z) - Mean shift cluster recognition method implementation in the nested
sampling algorithm [0.0]
ネストサンプリングはベイズ証拠と後続パラメータ確率分布の計算に有効なアルゴリズムである。
本稿では,ランダムウォークサーチアルゴリズムに実装された平均シフトクラスタ認識法に基づく新しい解を提案する。
論文 参考訳(メタデータ) (2020-01-31T15:04:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。