論文の概要: Consistency of the $k$-Nearest Neighbor Regressor under Complex Survey Designs
- arxiv url: http://arxiv.org/abs/2603.17551v1
- Date: Wed, 18 Mar 2026 09:59:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-03-19 18:32:57.627123
- Title: Consistency of the $k$-Nearest Neighbor Regressor under Complex Survey Designs
- Title(参考訳): 複合調査設計における$k$Nearest Neighbor Reressorの整合性
- Authors: Caren Hasler,
- Abstract要約: サンプル設計とデータ分布の規則性条件下では,$k$-nearest 近傍回帰器が整合であることを示す。
収束率の低い境界を導出し、これらの境界が次元性の呪いを示すことを示す。
- 参考スコア(独自算出の注目度): 0.0
- License: http://creativecommons.org/licenses/by-nc-nd/4.0/
- Abstract: We study the consistency of the $k$-nearest neighbor regressor under complex survey designs. While consistency results for this algorithm are well established for independent and identically distributed data, corresponding results for complex survey data are lacking. We show that the $k$-nearest neighbor regressor is consistent under regularity conditions on the sampling design and the distribution of the data. We derive lower bounds for the rate of convergence and show that these bounds exhibit the curse of dimensionality, as in the independent and identically distributed setting. Empirical studies based on simulated and real data illustrate our theoretical findings.
- Abstract(参考訳): 複素サーベイ設計において, 隣り合う抵抗器の整合性について検討した。
このアルゴリズムの一貫性は、独立および同一の分散データに対して十分に確立されているが、複雑なサーベイデータに対する対応する結果は欠落している。
サンプル設計とデータ分布の規則性条件下では,$k$-nearest 近傍回帰器が整合であることを示す。
収束率の低い境界を導出し、これらの境界が独立的かつ同一に分布した設定のように次元性の呪いを示すことを示す。
シミュレーションおよび実データに基づく実証研究は、我々の理論的な結果を示している。
関連論文リスト
- Dimension Agnostic Testing of Survey Data Credibility through the Lens of Regression [15.176331138782444]
本稿では,サンプル調査の信頼性を評価するためのタスクベース手法を提案する。
具体的には、この信頼性の概念を定量化するために、モデル固有の距離メートル法を導入する。
また,回帰モデルを用いて,調査データの信頼性を検証するアルゴリズムを設計する。
論文 参考訳(メタデータ) (2025-08-28T10:02:08Z) - Convergence Of Consistency Model With Multistep Sampling Under General Data Assumptions [11.317363635566517]
自己整合性特性がトレーニング分布のほぼ下にある場合の整合性モデルの収束性について検討する。
私たちの分析では、軽度のデータ仮定しか必要とせず、フォワードプロセスのファミリーに適用される。
論文 参考訳(メタデータ) (2025-05-06T05:31:10Z) - Robustly estimating heterogeneity in factorial data using Rashomon Partitions [4.76518127830168]
我々は、羅生門分割セット(RPS)と呼ばれるモデル不確実性のための新しい枠組みを提案する。
RPSは、最大後部(MAP)モデルに近い後部密度を持つすべてのモデルで構成されている。
実験的な例として,チャリタブルギフトの価格効果,染色体構造の不均一性,マイクロファイナンスの導入の3つを挙げる。
論文 参考訳(メタデータ) (2024-04-02T17:53:28Z) - Conformal inference for regression on Riemannian Manifolds [45.560812800359685]
回帰シナリオの予測セットは、応答変数が$Y$で、多様体に存在し、共変変数が$X$で、ユークリッド空間にあるときに検討する。
我々は、多様体上のこれらの領域の経験的バージョンが、その集団に対するほぼ確実に収束していることを証明する。
論文 参考訳(メタデータ) (2023-10-12T10:56:25Z) - Perturbation-Assisted Sample Synthesis: A Novel Approach for Uncertainty
Quantification [3.175239447683357]
本稿では、摂動支援サンプル合成(PASS)法により生成された合成データを利用した新しい摂動支援推論(PAI)フレームワークを提案する。
このフレームワークは、複雑なデータシナリオ、特に非構造化データの不確実性定量化に焦点を当てている。
我々は、画像合成、感情語分析、マルチモーダル推論、予測区間の構築など、様々な分野に適用することで、複雑なデータ駆動タスクにおける不確実性定量化を推し進める上で、PAIの有効性を実証する。
論文 参考訳(メタデータ) (2023-05-30T01:01:36Z) - Score Approximation, Estimation and Distribution Recovery of Diffusion
Models on Low-Dimensional Data [68.62134204367668]
本稿では,未知の低次元線形部分空間上でデータをサポートする場合の拡散モデルのスコア近似,推定,分布回復について検討する。
適切に選択されたニューラルネットワークアーキテクチャでは、スコア関数を正確に近似し、効率的に推定することができる。
推定スコア関数に基づいて生成された分布は、データ幾何学構造を捕捉し、データ分布の近傍に収束する。
論文 参考訳(メタデータ) (2023-02-14T17:02:35Z) - Breaking the Spurious Causality of Conditional Generation via Fairness
Intervention with Corrective Sampling [77.15766509677348]
条件生成モデルは、トレーニングデータセットから急激な相関を継承することが多い。
これは別の潜在属性に対して不均衡なラベル条件分布をもたらす。
この問題を緩和するための一般的な2段階戦略を提案する。
論文 参考訳(メタデータ) (2022-12-05T08:09:33Z) - Data-Driven Representations for Testing Independence: Modeling, Analysis
and Connection with Mutual Information Estimation [3.9023554886892433]
この研究は、データ駆動パーティションの設計から、2つの連続および有限次元のランダム変数の独立性をテストする。
オラクルテストの十分な統計量の近似は、データ駆動パーティションを設計するための学習基準を提供する。
いくつかの実験分析は、データ駆動表現を使用しないいくつかの戦略と比較して、テスト独立性に対する我々のスキームの利点に関する証拠を提供する。
論文 参考訳(メタデータ) (2021-10-27T02:06:05Z) - Partial Counterfactual Identification from Observational and
Experimental Data [83.798237968683]
観測データと実験データの任意の組み合わせから最適境界を近似する有効なモンテカルロアルゴリズムを開発した。
我々のアルゴリズムは、合成および実世界のデータセットに基づいて広範囲に検証されている。
論文 参考訳(メタデータ) (2021-10-12T02:21:30Z) - Two-Sample Testing on Ranked Preference Data and the Role of Modeling
Assumptions [57.77347280992548]
本稿では,ペアワイズ比較データとランキングデータのための2サンプル試験を設計する。
私たちのテストでは、基本的に分布に関する仮定は必要ありません。
実世界のペアワイズ比較データに2サンプルテストを適用することで、人によって提供される評価とランキングは、実際は異なる分散である、と結論付ける。
論文 参考訳(メタデータ) (2020-06-21T20:51:09Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。