論文の概要: An algorithm-based multiple detection influence measure for high
dimensional regression using expectile
- arxiv url: http://arxiv.org/abs/2105.12286v1
- Date: Wed, 26 May 2021 01:16:24 GMT
- ステータス: 処理完了
- システム内更新日: 2021-05-27 13:16:07.642546
- Title: An algorithm-based multiple detection influence measure for high
dimensional regression using expectile
- Title(参考訳): 期待値を用いた高次元回帰のためのアルゴリズムに基づく多重検出影響尺度
- Authors: Amadou Barry, Nikhil Bhagwat, Bratislav Misic, Jean-Baptiste Poline
and Celia M. T. Greenwood
- Abstract要約: 本稿では,アルゴリズムに基づく多段階多重検出手法を提案する。
データ中の望ましくない変数を識別し、キャプチャする3ステップのアルゴリズムである$asymMIP,$は2つの相補的な統計に基づく。
自閉症脳画像データ交換データセットへの本手法の適用により,脳の成熟度をよりバランスよく正確に予測することができた。
- 参考スコア(独自算出の注目度): 0.4999814847776096
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The identification of influential observations is an important part of data
analysis that can prevent erroneous conclusions drawn from biased estimators.
However, in high dimensional data, this identification is challenging.
Classical and recently-developed methods often perform poorly when there are
multiple influential observations in the same dataset. In particular, current
methods can fail when there is masking several influential observations with
similar characteristics, or swamping when the influential observations are near
the boundary of the space spanned by well-behaved observations. Therefore, we
propose an algorithm-based, multi-step, multiple detection procedure to
identify influential observations that addresses current limitations. Our
three-step algorithm to identify and capture undesirable variability in the
data, $\asymMIP,$ is based on two complementary statistics, inspired by
asymmetric correlations, and built on expectiles. Simulations demonstrate
higher detection power than competing methods. Use of the resulting asymptotic
distribution leads to detection of influential observations without the need
for computationally demanding procedures such as the bootstrap. The application
of our method to the Autism Brain Imaging Data Exchange neuroimaging dataset
resulted in a more balanced and accurate prediction of brain maturity based on
cortical thickness. See our GitHub for a free R package that implements our
algorithm: \texttt{asymMIP} (\url{github.com/AmBarry/hidetify}).
- Abstract(参考訳): 影響観測の同定は、偏りのある推定器から引き出された誤った結論を防止できるデータ分析の重要な部分である。
しかし、高次元データでは、この識別は困難である。
古典的および最近開発された手法は、同じデータセットに複数の影響のある観測がある場合、しばしば性能が良くない。
特に、現在の方法では、同様の特性を持ついくつかの影響観測を隠蔽している場合や、よく観測された観測によって広がる空間の境界付近にある影響観測が湿地を覆っている場合に失敗することがある。
そこで本研究では,現在の限界に対処する影響のある観測を識別するための,アルゴリズムに基づく多段階多重検出手法を提案する。
データ中の望ましくない変動を識別し、キャプチャする3段階のアルゴリズム、$\asymmip,$は、非対称相関にインスパイアされた2つの補完的な統計に基づいており、期待値に基づいている。
シミュレーションは競合する手法よりも高い検出力を示す。
結果として生じる漸近分布の使用は、ブートストラップのような計算的に要求される手順を必要とせずに、影響のある観測を検知する。
自閉症脳画像データ交換ニューロイメージングデータセットへの本手法の適用により、皮質厚みに基づくよりバランスよく正確な脳成熟度予測が可能となった。
github for a free r package that implements our algorithm: \texttt{asymmip} (\url{github.com/ambarry/hidetify})を参照。
関連論文リスト
- Estimating Causal Effects from Learned Causal Networks [56.14597641617531]
本稿では、離散可観測変数に対する因果影響クエリに応答する代替パラダイムを提案する。
観測データから直接因果ベイズネットワークとその共起潜伏変数を学習する。
本手法は, 推定手法よりも有効であることを示す。
論文 参考訳(メタデータ) (2024-08-26T08:39:09Z) - Approximating Counterfactual Bounds while Fusing Observational, Biased
and Randomised Data Sources [64.96984404868411]
我々は、複数の、偏見のある、観察的、介入的な研究からのデータを統合するという問題に対処する。
利用可能なデータの可能性は局所的な最大値を持たないことを示す。
次に、同じアプローチが複数のデータセットの一般的なケースにどのように対処できるかを示す。
論文 参考訳(メタデータ) (2023-07-31T11:28:24Z) - Robust Fitted-Q-Evaluation and Iteration under Sequentially Exogenous
Unobserved Confounders [16.193776814471768]
連続的に外生的でない共同設立者が存在する場合、ロバストな政策評価と政策最適化について検討する。
本研究は,敗血症治療のシミュレーションと実世界の縦断医療データの両方において,複雑性境界,洞察,有効性を示す。
論文 参考訳(メタデータ) (2023-02-01T18:40:53Z) - Learning to Bound Counterfactual Inference in Structural Causal Models
from Observational and Randomised Data [64.96984404868411]
我々は、従来のEMベースのアルゴリズムを拡張するための全体的なデータの特徴付けを導出する。
新しいアルゴリズムは、そのような混合データソースからモデルパラメータの(不特定性)領域を近似することを学ぶ。
反実的な結果に間隔近似を与え、それが特定可能な場合の点に崩壊する。
論文 参考訳(メタデータ) (2022-12-06T12:42:11Z) - MissDAG: Causal Discovery in the Presence of Missing Data with
Continuous Additive Noise Models [78.72682320019737]
不完全な観測データから因果発見を行うため,MissDAGと呼ばれる一般的な手法を開発した。
MissDAGは、期待-最大化の枠組みの下で観測の可視部分の期待される可能性を最大化する。
各種因果探索アルゴリズムを組み込んだMissDAGの柔軟性について,広範囲なシミュレーションと実データ実験により検証した。
論文 参考訳(メタデータ) (2022-05-27T09:59:46Z) - A Two-Block RNN-based Trajectory Prediction from Incomplete Trajectory [14.725386295605666]
本稿では,ベイズフィルタフレームワークの推論ステップを近似した2ブロックRNNモデルを提案する。
提案手法は,3つのベースライン計算法と比較して予測精度を向上することを示す。
また,提案手法は誤り検出がない場合の基準値よりも予測精度がよいことを示す。
論文 参考訳(メタデータ) (2022-03-14T13:39:44Z) - Combining Observational and Randomized Data for Estimating Heterogeneous
Treatment Effects [82.20189909620899]
不均一な治療効果を推定することは、多くの領域において重要な問題である。
現在、現存するほとんどの作品は観測データにのみ依存している。
本稿では、大量の観測データと少量のランダム化データを組み合わせることで、不均一な処理効果を推定する。
論文 参考訳(メタデータ) (2022-02-25T18:59:54Z) - Coherent False Seizure Prediction in Epilepsy, Coincidence or
Providence? [0.2770822269241973]
機械学習を用いた清水予測は可能であるが、その性能は理想的ではない。
本稿では,長期データセット上での2つのアルゴリズムの誤報と誤報について検討する。
論文 参考訳(メタデータ) (2021-10-26T10:25:14Z) - Graph Neural Network-Based Anomaly Detection in Multivariate Time Series [17.414474298706416]
我々は,高次元時系列データにおける異常を検出する新しい方法を開発した。
我々のアプローチは、構造学習アプローチとグラフニューラルネットワークを組み合わせている。
本研究では,本手法がベースラインアプローチよりも高精度に異常を検出することを示す。
論文 参考訳(メタデータ) (2021-06-13T09:07:30Z) - Interpretable Anomaly Detection with Mondrian P{\'o}lya Forests on Data
Streams [6.177270420667713]
スケールでの異常検出は、非常に困難な実用性の問題である。
最近の研究は、異常検出のためのデータを要約するために、(ランダムな)$k$emphd-treesのバリエーションを合体させてきた。
これらの手法は、容易に解釈できないアドホックスコア関数に依存している。
我々はこれらの手法をモンドリアンポリアフォレストと呼ぶ確率的枠組みでコンテキスト化する。
論文 参考訳(メタデータ) (2020-08-04T13:19:07Z) - A Robust Functional EM Algorithm for Incomplete Panel Count Data [66.07942227228014]
完全無作為な仮定(MCAR)の下での数え上げ過程の平均関数を推定する機能的EMアルゴリズムを提案する。
提案アルゴリズムは、いくつかの一般的なパネル数推定手法をラップし、不完全数にシームレスに対処し、ポアソン過程の仮定の誤特定に頑健である。
本稿では, 数値実験による提案アルゴリズムの有用性と喫煙停止データの解析について述べる。
論文 参考訳(メタデータ) (2020-03-02T20:04:38Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。