論文の概要: Reducing False Discoveries in Statistically-Significant Regional-Colocation Mining: A Summary of Results
- arxiv url: http://arxiv.org/abs/2407.02536v1
- Date: Mon, 1 Jul 2024 21:03:04 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-04 18:43:42.956924
- Title: Reducing False Discoveries in Statistically-Significant Regional-Colocation Mining: A Summary of Results
- Title(参考訳): 統計的に重要な地域コロケーションマイニングにおける偽発見の削減:調査結果の概要
- Authors: Subhankar Ghosh, Jayant Gupta, Arun Sharma, Shuai An, Shashi Shekhar,
- Abstract要約: 特徴型のセットemphSが与えられた場合、emphS>のサブセットemphCが$r_g$の統計的に重要な地域コロケーションパターンであるような$aリージョン(r_g$)を見つけることが目的である。
提案手法は,Bonferroni補正を用いた複数比較型地域鉱山(MultComp-RCM)を提案する。
- 参考スコア(独自算出の注目度): 4.32583920500711
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Given a set \emph{S} of spatial feature types, its feature instances, a study area, and a neighbor relationship, the goal is to find pairs $<$a region ($r_{g}$), a subset \emph{C} of \emph{S}$>$ such that \emph{C} is a statistically significant regional-colocation pattern in $r_{g}$. This problem is important for applications in various domains including ecology, economics, and sociology. The problem is computationally challenging due to the exponential number of regional colocation patterns and candidate regions. Previously, we proposed a miner \cite{10.1145/3557989.3566158} that finds statistically significant regional colocation patterns. However, the numerous simultaneous statistical inferences raise the risk of false discoveries (also known as the multiple comparisons problem) and carry a high computational cost. We propose a novel algorithm, namely, multiple comparisons regional colocation miner (MultComp-RCM) which uses a Bonferroni correction. Theoretical analysis, experimental evaluation, and case study results show that the proposed method reduces both the false discovery rate and computational cost.
- Abstract(参考訳): 空間的特徴型の集合 \emph{S}、その特徴例、研究領域、および近隣関係が与えられた場合、目的は、$<$a 領域 $r_{g}$, \emph{S}$>$ の部分集合 \emph{C} を見つけることであり、したがって \emph{C} は$r_{g}$ の統計的に重要な地域コロケーションパターンである。
この問題は、生態学、経済学、社会学など様々な分野の応用において重要である。
この問題は、地域的コロケーションパターンと候補領域の指数的な数によって、計算的に困難である。
従来, 統計学的に有意な地域的コロケーションパターンを見いだす鉱夫{10.1145/3557989.3566158} を提案した。
しかし、多くの同時統計推論は、偽の発見(多重比較問題としても知られる)のリスクを高め、高い計算コストをもたらす。
本稿では,Bonferroni補正を用いた新しいアルゴリズム,すなわち,複数比較の地域コロケーションマイナ(MultComp-RCM)を提案する。
理論的解析,実験,ケーススタディの結果から,提案手法は誤発見率と計算コストの両方を低減させることが示された。
関連論文リスト
- Adaptive $k$-nearest neighbor classifier based on the local estimation of the shape operator [49.87315310656657]
我々は, 局所曲率をサンプルで探索し, 周辺面積を適応的に定義する適応型$k$-nearest(kK$-NN)アルゴリズムを提案する。
多くの実世界のデータセットから、新しい$kK$-NNアルゴリズムは、確立された$k$-NN法と比較してバランスの取れた精度が優れていることが示されている。
論文 参考訳(メタデータ) (2024-09-08T13:08:45Z) - Causal Discovery from Poisson Branching Structural Causal Model Using High-Order Cumulant with Path Analysis [24.826219353338132]
カウントデータの最も一般的な特徴の1つは、二項化演算子によって記述される固有の分岐構造である。
単一の因果対はマルコフ同値、すなわち$Xrightarrow Y$ と $Yrightarrow X$ は分散同値である。
本稿では,ポアソン分岐構造因果モデル(PB-SCM)を提案し,高次累積を用いたPB-SCMの経路解析を行う。
論文 参考訳(メタデータ) (2024-03-25T08:06:08Z) - Compressed and distributed least-squares regression: convergence rates
with applications to Federated Learning [9.31522898261934]
機械学習の勾配アルゴリズムに対する圧縮の影響について検討する。
いくつかの非バイアス圧縮演算子間の収束率の差を強調した。
我々はその結果を連合学習の事例にまで拡張する。
論文 参考訳(メタデータ) (2023-08-02T18:02:00Z) - Nonlocality under Computational Assumptions [51.020610614131186]
相関の集合が非局所であるとは、空間的分離な当事者がランダム性を共有し、局所的な操作を実行することによって再現できないことである。
ランダム性や量子時間計算によって再現できない局所的な(効率のよい)測定結果が存在することを示す。
論文 参考訳(メタデータ) (2023-03-03T16:53:30Z) - A Statistical Learning View of Simple Kriging [0.0]
統計的学習の観点から,簡単なKrigingタスクを解析する。
目標は、最小2次リスクで他の場所にある未知の値を予測することである。
我々は、真の最小化を模倣するプラグイン予測則の過剰なリスクに対して、$O_mathbbP (1/sqrtn)$の非漸近境界を証明した。
論文 参考訳(メタデータ) (2022-02-15T12:46:43Z) - Acceleration in Distributed Optimization Under Similarity [72.54787082152278]
集中ノードを持たないエージェントネットワーク上での分散(強い凸)最適化問題について検討する。
$varepsilon$-solutionは$tildemathcalrhoObig(sqrtfracbeta/mu (1-)log1/varepsilonbig)$通信ステップ数で達成される。
この速度は、関心のクラスに適用される分散ゴシップ-アルゴリズムの、初めて(ポリログ因子まで)より低い複雑性の通信境界と一致する。
論文 参考訳(メタデータ) (2021-10-24T04:03:00Z) - Under-bagging Nearest Neighbors for Imbalanced Classification [63.026765294759876]
我々は,不均衡な分類問題に対して,textitunder-bagging $k$-NN (textitunder-bagging $k$-NN) というアンサンブル学習アルゴリズムを提案する。
論文 参考訳(メタデータ) (2021-09-01T14:10:38Z) - Making Affine Correspondences Work in Camera Geometry Computation [62.7633180470428]
局所的な特徴は、ポイント・ツー・ポイント対応ではなく、リージョン・ツー・リージョンを提供する。
本稿では,全モデル推定パイプラインにおいて,地域間マッチングを効果的に活用するためのガイドラインを提案する。
実験により、アフィンソルバはより高速な実行時にポイントベースソルバに匹敵する精度を達成できることが示された。
論文 参考訳(メタデータ) (2020-07-20T12:07:48Z) - Computationally efficient sparse clustering [67.95910835079825]
我々はPCAに基づく新しいクラスタリングアルゴリズムの有限サンプル解析を行う。
ここでは,ミニマックス最適誤クラスタ化率を,体制$|theta infty$で達成することを示す。
論文 参考訳(メタデータ) (2020-05-21T17:51:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。