論文の概要: Outlier Detection and Spatial Analysis Algorithms
- arxiv url: http://arxiv.org/abs/2106.10669v1
- Date: Sun, 20 Jun 2021 10:00:49 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-23 10:32:06.139727
- Title: Outlier Detection and Spatial Analysis Algorithms
- Title(参考訳): 外乱検出と空間解析アルゴリズム
- Authors: Jacob John
- Abstract要約: 異常検出はデータマイニングにおいて重要な領域である。
外乱検出は、クレジットカード詐欺の検出、ネットワーク侵入、機械故障予測、潜在的なテロ攻撃など、いくつかの分野に及んでいる。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Outlier detection is a significant area in data mining. It can be either used
to pre-process the data prior to an analysis or post the processing phase
(before visualization) depending on the effectiveness of the outlier and its
importance. Outlier detection extends to several fields such as detection of
credit card fraud, network intrusions, machine failure prediction, potential
terrorist attacks, and so on. Outliers are those data points with
characteristics considerably different. They deviate from the data set causing
inconsistencies, noise and anomalies during analysis and result in modification
of the original points However, a common misconception is that outliers have to
be immediately eliminated or replaced from the data set. Such points could be
considered useful if analyzed separately as they could be obtained from a
separate mechanism entirely making it important to the research question. This
study surveys the different methods of outlier detection for spatial analysis.
Spatial data or geospatial data are those that exhibit geographic properties or
attributes such as position or areas. An example would be weather data such as
precipitation, temperature, wind velocity, and so on collected for a defined
region.
- Abstract(参考訳): 異常検出はデータマイニングにおいて重要な領域である。
分析に先立ってデータを前処理したり、アウトレーヤの有効性やその重要性に応じて処理フェーズ(視覚化前)をポストするために使用することができる。
外乱検出は、クレジットカード詐欺の検出、ネットワーク侵入、機械故障予測、潜在的なテロ攻撃など、いくつかの分野に及んでいる。
外れ値(outlier)は、特性がかなり異なるデータポイントである。
彼らは分析中に不整合、ノイズ、異常を引き起こすデータセットから逸脱し、元のポイントを変更するが、一般的な誤解は、アウトレーヤはデータセットから即座に削除または置き換えなければならないということである。
このような点は、研究問題に完全に重要となる別のメカニズムから得ることができるので、別々に分析すれば有用であると考えられる。
本研究では,空間解析のための異常検出法について検討する。
空間データまたは地理空間データは、位置や領域などの地理的特性や特性を示すものである。
例えば、降水量、気温、風速などの気象データが特定の地域で収集される。
関連論文リスト
- Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - WePaMaDM-Outlier Detection: Weighted Outlier Detection using Pattern
Approaches for Mass Data Mining [0.6754597324022876]
外乱検出は、システム障害、不正行為、およびデータ内のパターンに関する重要な情報を明らかにすることができる。
本稿では、異なる質量データマイニング領域を持つWePaMaDM-Outlier Detectionを提案する。
また, 監視, 故障検出, 傾向解析において, 異常検出技術におけるデータモデリングの重要性についても検討した。
論文 参考訳(メタデータ) (2023-06-09T07:00:00Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - Anomaly detection using data depth: multivariate case [1.1802674324027231]
異常検出は機械学習とデータ分析の一分野である。
データ深度(Data depth)は、データセットへの空間の任意の点の帰属度を測定する統計関数である。
本稿では,データ深度を効率的な異常検出ツールとして検討する。
論文 参考訳(メタデータ) (2022-10-06T12:14:25Z) - A Meta-level Analysis of Online Anomaly Detectors [4.852567314334134]
ストリーミングデータにおける異常のリアルタイム検出が注目されている。
しかし、ストリーミングデータに対する異常検出の有効性と効率を比較するには、ほとんど注意が払われていない。
本稿では,異なるアルゴリズム群から抽出した主要なオンライン検出器の質的,総合的な概要について述べる。
論文 参考訳(メタデータ) (2022-09-13T11:28:15Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Selecting the suitable resampling strategy for imbalanced data
classification regarding dataset properties [62.997667081978825]
医学、情報検索、サイバーセキュリティ、ソーシャルメディアなどの多くのアプリケーションドメインでは、分類モデルの導入に使用されるデータセットは、各クラスのインスタンスの不平等な分布を持つことが多い。
この状況は不均衡データ分類と呼ばれ、少数民族の例では予測性能が低い。
オーバーサンプリングとアンダーサンプリングの技術は、各クラスの例の数とバランスをとることでこの問題に対処する、よく知られた戦略である。
論文 参考訳(メタデータ) (2021-12-15T18:56:39Z) - Comparison of Outlier Detection Techniques for Structured Data [2.2907341026741017]
外れ値(outlier)は、与えられたデータセットの残りのデータポイントから遠く離れた観測またはデータポイントである。
モデリングの前にトレーニングデータセットから外れ値を削除することで、より良い予測が可能になることが示されている。
この研究の目的は、データサイエンティストがその情報を使って外れ値のアルゴリズムの選択を行うために、既存の外れ値検出技術をいくつか強調し、比較することである。
論文 参考訳(メタデータ) (2021-06-16T13:40:02Z) - Multi-Source Causal Inference Using Control Variates [81.57072928775509]
本稿では,複数のデータソースから因果効果を推定するアルゴリズムを提案する。
理論的には、これはATE推定値の分散を減少させる。
このフレームワークを結果選択バイアスの下で観測データからの推論に適用する。
論文 参考訳(メタデータ) (2021-03-30T21:20:51Z) - Graph Embedding with Data Uncertainty [113.39838145450007]
スペクトルベースのサブスペース学習は、多くの機械学習パイプラインにおいて、一般的なデータ前処理ステップである。
ほとんどの部分空間学習法は、不確実性の高いデータにつながる可能性のある測定の不正確さやアーティファクトを考慮していない。
論文 参考訳(メタデータ) (2020-09-01T15:08:23Z) - Meta Learning for Causal Direction [29.00522306460408]
小型データ設定における原因と効果の区別を可能にする新しい生成モデルを提案する。
提案手法は, 各種合成データと実世界のデータを用いて実証し, 種々のデータセットサイズにおける方向検出の精度を高い精度で維持可能であることを示す。
論文 参考訳(メタデータ) (2020-07-06T15:12:05Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。