論文の概要: An empirical comparison of some outlier detection methods with longitudinal data
- arxiv url: http://arxiv.org/abs/2507.21203v1
- Date: Mon, 28 Jul 2025 16:06:15 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-07-30 17:08:55.153317
- Title: An empirical comparison of some outlier detection methods with longitudinal data
- Title(参考訳): いくつかの外乱検出法と縦断データとの実証比較
- Authors: Marcello D'Orazio,
- Abstract要約: これは、公式統計で使われるよく知られた手法と、データマイニングと機械学習の分野からの提案を比較している。
この手法を適用して,異なるタイプの統計単位に関する調査データを調査する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-sa/4.0/
- Abstract: This note investigates the problem of detecting outliers in longitudinal data. It compares well-known methods used in official statistics with proposals from the fields of data mining and machine learning that are based on the distance between observations or binary partitioning trees. This is achieved by applying the methods to panel survey data related to different types of statistical units. Traditional methods are quite simple, enabling the direct identification of potential outliers, but they require specific assumptions. In contrast, recent methods provide only a score whose magnitude is directly related to the likelihood of an outlier being present. All the methods require the user to set a number of tuning parameters. However, the most recent methods are more flexible and sometimes more effective than traditional methods. In addition, these methods can be applied to multidimensional data.
- Abstract(参考訳): 本稿では,長手データにおける外れ値検出の問題について検討する。
これは、公式統計で使われるよく知られた手法と、観測と二分分割木の間の距離に基づくデータマイニングと機械学習の分野の提案を比較している。
この手法を適用して,異なるタイプの統計単位に関する調査データを調査する。
従来の手法は非常に単純で、潜在的な外れ値を直接特定できるが、特定の仮定を必要とする。
対照的に、最近の手法は、アウトリーチが存在する可能性に直接関係しているスコアのみを提供する。
すべてのメソッドは、ユーザがいくつかのチューニングパラメータを設定する必要があります。
しかし、最近の手法は従来の方法よりも柔軟で、時には効果的である。
さらに、これらの手法は多次元データに適用できる。
関連論文リスト
- Fuzzy Granule Density-Based Outlier Detection with Multi-Scale Granular Balls [65.44462297594308]
外乱検出は、正常なデータの分布から大きく逸脱する異常なサンプルの同定を指す。
ほとんどの教師なしの外れ値検出方法は、指定された外れ値を検出するために慎重に設計されている。
ファジィ粗集合に基づくマルチスケールアウトレイラ検出手法を提案し,様々な種類のアウトレイラを同定する。
論文 参考訳(メタデータ) (2025-01-06T12:35:51Z) - A Bayesian approach to uncertainty in word embedding bias estimation [0.0]
WEAT や MAC のような複数の測度は、単語の埋め込みに存在するバイアスの大きさを1つの数字のメートル法で定量化しようとする。
このような手法を用いて、意図したバイアスを欠いたnullモデルによってデータが生成される場合でも、同様の結果が容易に得られることを示す。
単語埋め込みにおけるバイアスのより不確実性に敏感な検査を可能にする階層型ベイズモデルを提案する。
論文 参考訳(メタデータ) (2023-06-15T11:48:50Z) - Auditing Fairness by Betting [43.515287900510934]
我々は,デプロイされた分類モデルと回帰モデルの公平性を評価するための,実用的で効率的で非パラメトリックな手法を提供する。
我々の手法は逐次的であり、入ってくるデータの継続的なモニタリングを可能にする。
提案手法の有効性を3つのベンチマークフェアネスデータセットに示す。
論文 参考訳(メタデータ) (2023-05-27T20:14:11Z) - A Coreset Learning Reality Check [33.002265576337486]
サブサンプリングアルゴリズムは、巨大なデータセットにモデルを適合させる前に、データサイズを減らすための自然なアプローチである。
近年,データ行列から行をサブサンプリングする手法がいくつか提案されている。
コアセットおよび最適サブサンプリング文献から引き出されたロジスティック回帰の複数の手法を比較し,その有効性の矛盾を明らかにする。
論文 参考訳(メタデータ) (2023-01-15T19:26:17Z) - Bias Mimicking: A Simple Sampling Approach for Bias Mitigation [57.17709477668213]
本稿では,新しいクラス条件サンプリング手法であるBias Mimickingを紹介する。
Bias Mimickingは、4つのベンチマークで3%の精度でサンプリングの精度を向上する。
論文 参考訳(メタデータ) (2022-09-30T17:33:00Z) - Approximate Bayesian Computation with Domain Expert in the Loop [13.801835670003008]
本稿では,ABC統計抽出のためのアクティブラーニング手法を提案する。
専門家を巻き込むことで、既存の次元縮小法とは異なり、不特定モデルを扱うことができる。
実験の結果 シミュレーション予算が制限された場合 既存の方法よりも 後方推定が 優れていることが分かりました
論文 参考訳(メタデータ) (2022-01-28T12:58:51Z) - Manifold Hypothesis in Data Analysis: Double Geometrically-Probabilistic
Approach to Manifold Dimension Estimation [92.81218653234669]
本稿では, 多様体仮説の検証と基礎となる多様体次元推定に対する新しいアプローチを提案する。
我々の幾何学的手法はミンコフスキー次元計算のためのよく知られたボックスカウントアルゴリズムのスパースデータの修正である。
実データセットの実験では、2つの手法の組み合わせに基づく提案されたアプローチが強力で効果的であることが示されている。
論文 参考訳(メタデータ) (2021-07-08T15:35:54Z) - DPER: Efficient Parameter Estimation for Randomly Missing Data [0.24466725954625884]
本稿では,1クラス・複数クラスのランダムに欠落したデータセットに対して,最大推定値(MLE)を求めるアルゴリズムを提案する。
我々のアルゴリズムは、データを通して複数のイテレーションを必要としないので、他の方法よりも時間のかかることを約束します。
論文 参考訳(メタデータ) (2021-06-06T16:37:48Z) - Overcoming the curse of dimensionality with Laplacian regularization in
semi-supervised learning [80.20302993614594]
ラプラシア正規化の欠点を克服するための統計的解析を提供する。
望ましい振る舞いを示すスペクトルフィルタリング法を多数発表する。
我々は,本手法を大量のデータで利用できるようにするために,現実的な計算ガイドラインを提供する。
論文 参考訳(メタデータ) (2020-09-09T14:28:54Z) - On Contrastive Learning for Likelihood-free Inference [20.49671736540948]
Likelihood-freeメソッドは、可能性を評価することができるシミュレータモデルでパラメータ推論を行う。
この可能性のない問題の方法の1つのクラスは、パラメータ観測サンプルのペアを区別するために分類器を使用する。
別の一般的な手法のクラスは、パラメータの後方に直接条件分布を適合させ、特に最近の変種はフレキシブルな神経密度推定器の使用を可能にする。
論文 参考訳(メタデータ) (2020-02-10T13:14:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。