論文の概要: Recursive random binning to detect and display pairwise dependence
- arxiv url: http://arxiv.org/abs/2311.08561v2
- Date: Tue, 29 Apr 2025 13:40:45 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-05-02 19:15:51.575503
- Title: Recursive random binning to detect and display pairwise dependence
- Title(参考訳): 相互依存の検出と表示のための再帰的ランダムビンニング
- Authors: Chris Salahub, Wayne Oldford,
- Abstract要約: 理論と実証的な研究はいくつかの近似を動機付けており、例えば、実価値はあるが直観的な自由度を持つ単純な$chi2$近似である。
異なる近似を持つ再帰的ランダムなビンニングは、様々な非ヌル依存パターンに関する最近のグリッドベースの手法と比較される。
これらの近似を持つ手法は、よく校正され、一般的なテスト代替品に対して比較的強力である。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Random binnings generated via recursive binary splits are introduced as a way to detect, measure the strength of, and to display the pattern of association between any two variates, whether one or both are continuous or categorical. This provides a single approach to ordering large numbers of variate pairs by their measure of dependence and then to examine any pattern of dependence via a common display, the departure display (colouring bins by a standardized Pearson residual). Continuous variates are first ranked and their rank pairs binned. The Pearson's goodness of fit statistic is applicable but the classic $\chi^2$ approximation to its null distribution is not. Theoretical and empirical investigations motivate several approximations, including a simple $\chi^2$ approximation with real-valued, yet intuitive, degrees of freedom. Alternatively, applying an inverse probability transform from the ranks before binning returns a simple Pearson statistic with the classic degrees of freedom. Recursive random binning with different approximations is compared to recent grid-based methods on a variety of non-null dependence patterns; the method with any of these approximations is found to be well-calibrated and relatively powerful against common test alternatives. Method and displays are illustrated by applying the screening methodology to a publicly available data set having several continuous and categorical measurements of each of 6,497 Portuguese wines. The software is publicly available as the R package AssocBin.
- Abstract(参考訳): 再帰的二分分割によって生成されるランダム双対は、連続的かカテゴリー的であるかにかかわらず、いずれかの変種間の関係パターンを検知し、測定し、示す方法として導入された。
これは、多数の変数対を依存度で順序付けし、共通のディスプレイ、出発ディスプレイ(標準化されたピアソン残基によるビンのカラー化)を介して依存パターンを調べるための単一のアプローチを提供する。
連続変数は最初にランク付けされ、そのランク付けペアはバイナリ化される。
ピアソンの適合統計学の良さは適用可能だが、古典的な $\chi^2$ の null 分布への近似は適用されない。
理論的および経験的調査はいくつかの近似を動機付けており、例えば、実数値で直観的だが直観的な自由度を持つ単純な$\chi^2$近似である。
あるいは、双対前の位置から逆確率変換を適用すると、古典的な自由度を持つ単純なピアソン統計が返される。
異なる近似を持つ再帰的ランダムビンニングは、様々な非ヌル依存パターンに関する最近のグリッドベースの手法と比較される。
ポルトガルの6,497種のワインの連続的および分類的な測定値を持つ公開データセットにスクリーニング手法を適用することにより、方法と表示を図示する。
このソフトウェアは、RパッケージのAssocBinとして公開されている。
関連論文リスト
- Towards Self-Supervised Covariance Estimation in Deep Heteroscedastic Regression [102.24287051757469]
深部異方性回帰における自己教師付き共分散推定について検討する。
正規分布の間の2-ワッサーシュタイン距離の上界を導出する。
幅広い合成データセットと実データセットに対する実験により、提案された2-ワッサーシュタインと擬似ラベルアノテーションが結合した結果、計算的に安価で正確な深部ヘテロ代用回帰が導かれることが示された。
論文 参考訳(メタデータ) (2025-02-14T22:37:11Z) - Truncating Trajectories in Monte Carlo Policy Evaluation: an Adaptive Approach [51.76826149868971]
モンテカルロシミュレーションによる政策評価は多くのMC強化学習(RL)アルゴリズムの中核にある。
本研究では,異なる長さの軌跡を用いた回帰推定器の平均二乗誤差のサロゲートとして品質指標を提案する。
本稿では,Robust and Iterative Data Collection Strategy Optimization (RIDO) という適応アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-17T11:47:56Z) - Computational-Statistical Gaps in Gaussian Single-Index Models [77.1473134227844]
単次元モデル(Single-Index Models)は、植木構造における高次元回帰問題である。
我々は,統計的クエリ (SQ) と低遅延多項式 (LDP) フレームワークの両方において,計算効率のよいアルゴリズムが必ずしも$Omega(dkstar/2)$サンプルを必要とすることを示した。
論文 参考訳(メタデータ) (2024-03-08T18:50:19Z) - Sample and Predict Your Latent: Modality-free Sequential Disentanglement
via Contrastive Estimation [2.7759072740347017]
外部信号のないコントラスト推定に基づく自己教師付きシーケンシャル・アンタングルメント・フレームワークを提案する。
実際に,データのセマンティックに類似し,異種なビューに対して,統一的で効率的かつ容易にサンプリングできる手法を提案する。
提案手法は,既存の手法と比較して最先端の結果を示す。
論文 参考訳(メタデータ) (2023-05-25T10:50:30Z) - Robust Detection of Lead-Lag Relationships in Lagged Multi-Factor Models [61.10851158749843]
データ固有のリード-ラグ関係を発見することで、重要な洞察を得ることができる。
階層化多要素モデルにおけるリードラグ関係のロバスト検出のためのクラスタリング駆動手法を開発した。
論文 参考訳(メタデータ) (2023-05-11T10:30:35Z) - Diffsurv: Differentiable sorting for censored time-to-event data [0.3303008003874494]
現在、生存分析における最も一般的なアプローチは、コックスの部分的可能性に基づいている。
我々は、検閲されたタスクを処理するためのDiffsurvと呼ばれる新しい手法を提案する。
実験の結果,Diffsurvは様々なシミュレーションおよび実世界のリスク予測シナリオにおいて,ベースラインの確立に優れていた。
論文 参考訳(メタデータ) (2023-04-26T14:42:31Z) - Improving Out-of-Distribution Generalization of Neural Rerankers with
Contextualized Late Interaction [52.63663547523033]
マルチベクトルの最も単純な形式である後期相互作用は、[]ベクトルのみを使用して類似度スコアを計算する神経リランカにも役立ちます。
異なるモデルサイズと多様な性質の第一段階のレトリバーに一貫性があることが示される。
論文 参考訳(メタデータ) (2023-02-13T18:42:17Z) - Counting Like Human: Anthropoid Crowd Counting on Modeling the
Similarity of Objects [92.80955339180119]
メインストリームの群衆計数法は 密度マップを補強して 計数結果を得るために統合する。
これに触発された我々は,合理的かつ人為的な集団カウントフレームワークを提案する。
論文 参考訳(メタデータ) (2022-12-02T07:00:53Z) - Composed Image Retrieval with Text Feedback via Multi-grained
Uncertainty Regularization [73.04187954213471]
粗い検索ときめ細かい検索を同時にモデル化する統合学習手法を提案する。
提案手法は、強いベースラインに対して+4.03%、+3.38%、+2.40%のRecall@50精度を達成した。
論文 参考訳(メタデータ) (2022-11-14T14:25:40Z) - Distributional Adaptive Soft Regression Trees [0.0]
本稿では,多変量ソフトスプリットルールを用いた分布回帰木の新しいタイプを提案する。
ソフトスプリットの大きな利点の1つは、滑らかな高次元函数を1つの木で見積もることができることである。
シミュレーションにより,アルゴリズムは優れた特性を有し,様々なベンチマーク手法より優れていることを示す。
論文 参考訳(メタデータ) (2022-10-19T08:59:02Z) - SRMD: Sparse Random Mode Decomposition [0.0]
スペクトル図へのスパース近似を構築し,時系列データをランダムに解析する手法を提案する。
スペクトル図のスペーサー化により、時間周波数クラスタの分離が急激になるため、固有モードの同定が容易になる。
応用例としては、信号表現、外乱除去、モード分解などがある。
論文 参考訳(メタデータ) (2022-04-12T22:40:10Z) - Comparing two samples through stochastic dominance: a graphical approach [2.867517731896504]
実世界のシナリオでは非決定論的測定が一般的である。
推定累積分布関数に従って2つのサンプルを視覚的に比較するフレームワークを提案する。
論文 参考訳(メタデータ) (2022-03-15T13:37:03Z) - Machine Learning for Multi-Output Regression: When should a holistic
multivariate approach be preferred over separate univariate ones? [62.997667081978825]
ランダムフォレストのような木に基づくアンサンブルは、統計学の手法の中で近代的な古典である。
これらの手法を広範囲なシミュレーションで比較し,多変量アンサンブル技術を用いた場合の主問題に答える。
論文 参考訳(メタデータ) (2022-01-14T08:44:25Z) - CARMS: Categorical-Antithetic-REINFORCE Multi-Sample Gradient Estimator [60.799183326613395]
本稿では, 相互に負に相関した複数のサンプルに基づく分類的確率変数の非バイアス推定器を提案する。
CARMSは、ReINFORCEとコプラベースのサンプリングを組み合わせることで、重複サンプルを回避し、その分散を低減し、重要サンプリングを使用して推定器を偏りなく維持する。
我々は、生成的モデリングタスクと構造化された出力予測タスクに基づいて、いくつかのベンチマークデータセット上でCARMSを評価し、強力な自己制御ベースラインを含む競合する手法より優れていることを示す。
論文 参考訳(メタデータ) (2021-10-26T20:14:30Z) - Double-matched matrix decomposition for multi-view data [0.6091702876917281]
一致したサンプルから異なるソースから収集されたデータである多視点データから,関節信号と個別信号の抽出の問題を考える。
提案する二重整合行列分解は, 被験者間の結合信号と個別信号の同時抽出を可能にする。
本手法をイングランド・プレミアリーグのサッカーの試合のデータに適用し、ドメイン固有の知識に合わせた共同および個別のマルチビュー信号を見つける。
論文 参考訳(メタデータ) (2021-05-07T17:09:57Z) - Learning with Comparison Feedback: Online Estimation of Sample
Statistics [2.7158841992922875]
本研究では,無作為な雑音ではなく非確率的にフィードバックが生成される雑音二分探索問題のオンライン版について検討する。
我々は、整数の逆対数列の中央値の正確な推定を維持する。
論文 参考訳(メタデータ) (2021-01-11T20:28:32Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - A Practical Index Structure Supporting Fr\'echet Proximity Queries Among
Trajectories [1.9335262420787858]
我々は、計算コストの高いメトリクスの下で、レンジと近隣クエリに$k$のスケーラブルなアプローチを提案する。
計量指標のクラスタリングに基づいて,軌跡数に線形な木構造を求める。
本研究では,多種多様な合成および実世界のデータセットに関する広範な実験により,本手法の有効性と有効性について分析する。
論文 参考訳(メタデータ) (2020-05-28T04:12:43Z) - Supervised Feature Subset Selection and Feature Ranking for Multivariate
Time Series without Feature Extraction [78.84356269545157]
MTS分類のための教師付き特徴ランキングと特徴サブセット選択アルゴリズムを導入する。
MTSの既存の教師なし特徴選択アルゴリズムとは異なり、我々の手法は時系列から一次元特徴ベクトルを生成するために特徴抽出ステップを必要としない。
論文 参考訳(メタデータ) (2020-05-01T07:46:29Z) - Spatially Adaptive Inference with Stochastic Feature Sampling and
Interpolation [72.40827239394565]
スパースサンプリングされた場所のみの機能を計算することを提案する。
次に、効率的な手順で特徴写像を密に再構築する。
提案したネットワークは、様々なコンピュータビジョンタスクの精度を維持しながら、かなりの計算を省くために実験的に示されている。
論文 参考訳(メタデータ) (2020-03-19T15:36:31Z) - Automated extraction of mutual independence patterns using Bayesian
comparison of partition models [7.6146285961466]
相互独立は、変数間の構造的関係を特徴づける統計学における重要な概念である。
相互独立を調査するための既存の手法は、2つの競合するモデルの定義に依存している。
本稿では,マルコフ連鎖モンテカルロ(MCMC)アルゴリズムを提案し,相互独立性のすべてのパターンの空間上の後部分布を数値的に近似する。
論文 参考訳(メタデータ) (2020-01-15T16:21:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。