論文の概要: Semi-Supervised U-statistics
- arxiv url: http://arxiv.org/abs/2402.18921v2
- Date: Sat, 9 Mar 2024 07:16:46 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-13 13:52:19.839693
- Title: Semi-Supervised U-statistics
- Title(参考訳): 半スーパービジョンU統計
- Authors: Ilmun Kim, Larry Wasserman, Sivaraman Balakrishnan, Matey Neykov
- Abstract要約: ラベルなしデータの豊富さによって強化された半教師付きU統計を導入する。
提案手法は古典的U統計よりも顕著な効率向上を示すことを示す。
我々は,すべての先進国において古典的U統計よりも優れた改良されたアプローチを提案する。
- 参考スコア(独自算出の注目度): 22.696630428733204
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Semi-supervised datasets are ubiquitous across diverse domains where
obtaining fully labeled data is costly or time-consuming. The prevalence of
such datasets has consistently driven the demand for new tools and methods that
exploit the potential of unlabeled data. Responding to this demand, we
introduce semi-supervised U-statistics enhanced by the abundance of unlabeled
data, and investigate their statistical properties. We show that the proposed
approach is asymptotically Normal and exhibits notable efficiency gains over
classical U-statistics by effectively integrating various powerful prediction
tools into the framework. To understand the fundamental difficulty of the
problem, we derive minimax lower bounds in semi-supervised settings and
showcase that our procedure is semi-parametrically efficient under regularity
conditions. Moreover, tailored to bivariate kernels, we propose a refined
approach that outperforms the classical U-statistic across all degeneracy
regimes, and demonstrate its optimality properties. Simulation studies are
conducted to corroborate our findings and to further demonstrate our framework.
- Abstract(参考訳): 半教師付きデータセットは、完全なラベル付きデータを取得するのにコストや時間を要するさまざまなドメインにまたがっている。
このようなデータセットの普及は、ラベルのないデータの可能性を利用する新しいツールやメソッドの需要を一貫して押し付けている。
この要求に応じて、ラベルなしデータの豊富さによって強化された半教師付きU統計を導入し、その統計特性について検討する。
提案手法は漸近的に正規であり,様々な強力な予測ツールを効果的にフレームワークに統合することにより,古典的U統計よりも顕著な効率向上を示す。
この問題の根本的な難しさを理解するため, 半教師付き設定における最小限の上限を導出し, 規則性条件下での手順が半パラメトリックに効率的であることを示す。
さらに,二変量カーネルに適応し,すべての退化系において古典的u-統計量を上回る洗練されたアプローチを提案し,その最適性を示す。
シミュレーション研究は,我々の知見を裏付けるとともに,その枠組みをさらに実証するために行われる。
関連論文リスト
- An Online, Adaptive and Unsupervised Regression Framework with Drift
Detection for Label Scarcity Contexts [0.0]
本稿では,制限付きラベル付きデータを用いたストリーミング環境の最適戦略を提案し,教師なし回帰のための適応手法を提案する。
適応性を高めるために,Adaptive WINdowingアルゴリズムとRoot Mean Square Error (RMSE)に基づく誤り一般化アルゴリズムを統合する。
ラベルをリアルタイムで取得することが重要な課題であるタスクに対して,適応回帰手法の優れた効果を実証する。
論文 参考訳(メタデータ) (2023-12-12T19:23:54Z) - On semi-supervised estimation using exponential tilt mixture models [12.347498345854715]
バイナリ応答と予測器のラベル付きデータセットと、予測器のみのラベル付きデータセットによる半教師付き設定を考えてみましょう。
半教師付き推定のために,指数傾斜混合(ETM)モデルを用いた統計的アプローチのさらなる解析と理解を開発する。
論文 参考訳(メタデータ) (2023-11-14T19:53:26Z) - Towards Realistic Unsupervised Fine-tuning with CLIP [108.45391206730402]
我々はUniversal Entropy Optimization(UEO)と呼ばれるシンプルで効率的で効果的な微調整手法を提案する。
UEOはサンプルレベルの信頼を利用して、信頼性の低いインスタンスの条件エントロピーを最小化し、信頼性の低いインスタンスの限界エントロピーを最大化する。
UEOは一般化とアウト・オブ・ディストリビューション検出の両方の観点から,ベースライン法を超越していることを示す。
論文 参考訳(メタデータ) (2023-08-24T16:47:17Z) - Uncertainty-Aware Instance Reweighting for Off-Policy Learning [63.31923483172859]
本研究では,不確実性を考慮した逆確率スコア推定器 (UIPS) を提案する。
実世界の3つのレコメンデーションデータセットを用いた実験結果から,提案したUIPS推定器の有効サンプル効率が示された。
論文 参考訳(メタデータ) (2023-03-11T11:42:26Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - Pessimistic Minimax Value Iteration: Provably Efficient Equilibrium
Learning from Offline Datasets [101.5329678997916]
両プレイヤーゼロサムマルコフゲーム(MG)をオフライン環境で研究する。
目標は、事前収集されたデータセットに基づいて、近似的なナッシュ均衡(NE)ポリシーペアを見つけることである。
論文 参考訳(メタデータ) (2022-02-15T15:39:30Z) - WSSOD: A New Pipeline for Weakly- and Semi-Supervised Object Detection [75.80075054706079]
弱機能および半教師付きオブジェクト検出フレームワーク(WSSOD)を提案する。
エージェント検出器は、まず関節データセット上でトレーニングされ、弱注釈画像上で擬似境界ボックスを予測するために使用される。
提案フレームワークはPASCAL-VOC と MSCOCO のベンチマークで顕著な性能を示し,完全教師付き環境で得られたものと同等の性能を達成している。
論文 参考訳(メタデータ) (2021-05-21T11:58:50Z) - Training Deep Normalizing Flow Models in Highly Incomplete Data
Scenarios with Prior Regularization [13.985534521589257]
ハイパウシティシナリオにおけるデータ分布の学習を容易にする新しいフレームワークを提案する。
提案手法は,不完全データから学習過程を協調最適化タスクとして行うことに由来する。
論文 参考訳(メタデータ) (2021-04-03T20:57:57Z) - Incremental Semi-Supervised Learning Through Optimal Transport [0.0]
本研究では, 半指導的学習のための2成分エッジ重み付きグラフを用いた新しいアプローチを提案する。
提案手法は,ラベル付きデータポイントと非ラベル付きデータポイントで定義された経験的測度間の規則化された最適輸送を用いて,最適輸送計画から親和性行列を得る。
論文 参考訳(メタデータ) (2021-03-22T15:31:53Z) - Distributed Learning of Finite Gaussian Mixtures [21.652015112462]
有限ガウス混合系の分散学習における分割・対数アプローチについて検討する。
新しい推定器は整合性を示し、いくつかの一般的な条件下ではルート-nの整合性を保持する。
シミュレーションおよび実世界のデータに基づく実験により、提案手法はグローバル推定器と同等の統計的性能を有することが示された。
論文 参考訳(メタデータ) (2020-10-20T16:17:47Z) - Causal Feature Selection for Algorithmic Fairness [61.767399505764736]
データ管理の統合コンポーネントにおける公平性について検討する。
本稿では,データセットの公平性を保証する特徴のサブコレクションを同定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-10T20:20:10Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。