論文の概要: Outlier Detection and Spatial Analysis Algorithms
- arxiv url: http://arxiv.org/abs/2106.10669v1
- Date: Sun, 20 Jun 2021 10:00:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-23 10:32:06.139727
- Title: Outlier Detection and Spatial Analysis Algorithms
- Title(参考訳): 外乱検出と空間解析アルゴリズム
- Authors: Jacob John
- Abstract要約: 異常検出はデータマイニングにおいて重要な領域である。
外乱検出は、クレジットカード詐欺の検出、ネットワーク侵入、機械故障予測、潜在的なテロ攻撃など、いくつかの分野に及んでいる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Outlier detection is a significant area in data mining. It can be either used
to pre-process the data prior to an analysis or post the processing phase
(before visualization) depending on the effectiveness of the outlier and its
importance. Outlier detection extends to several fields such as detection of
credit card fraud, network intrusions, machine failure prediction, potential
terrorist attacks, and so on. Outliers are those data points with
characteristics considerably different. They deviate from the data set causing
inconsistencies, noise and anomalies during analysis and result in modification
of the original points However, a common misconception is that outliers have to
be immediately eliminated or replaced from the data set. Such points could be
considered useful if analyzed separately as they could be obtained from a
separate mechanism entirely making it important to the research question. This
study surveys the different methods of outlier detection for spatial analysis.
Spatial data or geospatial data are those that exhibit geographic properties or
attributes such as position or areas. An example would be weather data such as
precipitation, temperature, wind velocity, and so on collected for a defined
region.
- Abstract(参考訳): 異常検出はデータマイニングにおいて重要な領域である。
分析に先立ってデータを前処理したり、アウトレーヤの有効性やその重要性に応じて処理フェーズ(視覚化前)をポストするために使用することができる。
外乱検出は、クレジットカード詐欺の検出、ネットワーク侵入、機械故障予測、潜在的なテロ攻撃など、いくつかの分野に及んでいる。
外れ値(outlier)は、特性がかなり異なるデータポイントである。
彼らは分析中に不整合、ノイズ、異常を引き起こすデータセットから逸脱し、元のポイントを変更するが、一般的な誤解は、アウトレーヤはデータセットから即座に削除または置き換えなければならないということである。
このような点は、研究問題に完全に重要となる別のメカニズムから得ることができるので、別々に分析すれば有用であると考えられる。
本研究では,空間解析のための異常検出法について検討する。
空間データまたは地理空間データは、位置や領域などの地理的特性や特性を示すものである。
例えば、降水量、気温、風速などの気象データが特定の地域で収集される。
関連論文リスト
- Research on Dynamic Data Flow Anomaly Detection based on Machine Learning [11.526496773281938]
本研究では,非教師なし学習法を用いて動的データフローの異常を同定する。
類似したデータをクラスタリングすることで、ラベル付きデータを必要とせずに、通常のトラフィックから著しく逸脱するデータ挙動を検出することができる。
特に、不均衡なデータのコンテキストにおいて、堅牢で適応可能なパフォーマンスを示す。
論文 参考訳(メタデータ) (2024-09-23T08:19:15Z) - On the Detection of Anomalous or Out-Of-Distribution Data in Vision Models Using Statistical Techniques [0.6554326244334868]
我々は、実際の入力と破損した入力の差を定量化する手法として、ベンフォードの法則(英語版)を評価する。
多くの設定では、異常なデータポイントのフィルタとして機能し、アウト・オブ・ディストリビューションデータのシグナリングとして機能する。
論文 参考訳(メタデータ) (2024-03-21T18:31:47Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - WePaMaDM-Outlier Detection: Weighted Outlier Detection using Pattern
Approaches for Mass Data Mining [0.6754597324022876]
外乱検出は、システム障害、不正行為、およびデータ内のパターンに関する重要な情報を明らかにすることができる。
本稿では、異なる質量データマイニング領域を持つWePaMaDM-Outlier Detectionを提案する。
また, 監視, 故障検出, 傾向解析において, 異常検出技術におけるデータモデリングの重要性についても検討した。
論文 参考訳(メタデータ) (2023-06-09T07:00:00Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Anomaly detection using data depth: multivariate case [3.046315755726937]
異常検出はデータ分析と機械学習の一分野である。
データ深度(Data depth)は、データセットへの空間の任意の点の帰属度を測定する統計関数である。
本稿では、データ深度を効率的な異常検出ツールとして検討し、異常ラベルを低い深さの観測値に割り当てる。
論文 参考訳(メタデータ) (2022-10-06T12:14:25Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Comparison of Outlier Detection Techniques for Structured Data [2.2907341026741017]
外れ値(outlier)は、与えられたデータセットの残りのデータポイントから遠く離れた観測またはデータポイントである。
モデリングの前にトレーニングデータセットから外れ値を削除することで、より良い予測が可能になることが示されている。
この研究の目的は、データサイエンティストがその情報を使って外れ値のアルゴリズムの選択を行うために、既存の外れ値検出技術をいくつか強調し、比較することである。
論文 参考訳(メタデータ) (2021-06-16T13:40:02Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。