論文の概要: The generalized underlap coefficient with an application in clustering
- arxiv url: http://arxiv.org/abs/2602.19473v1
- Date: Mon, 23 Feb 2026 03:35:08 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-24 17:42:02.662056
- Title: The generalized underlap coefficient with an application in clustering
- Title(参考訳): 一般化アンダーラップ係数とクラスタリングへの応用
- Authors: Zhaoxi Zhang, Vanda Inacio, Sara Wade,
- Abstract要約: アンダーラップ係数 (UNL) は多群分離測度である。
我々はUNLの重要な性質を確立し、全変動に対する明示的な接続を提供する。
フレキシブル密度推定器と組み合わせることができるUNLの重要サンプリング推定器を提案する。
- 参考スコア(独自算出の注目度): 2.140305355990306
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Quantifying distributional separation across groups is fundamental in statistical learning and scientific discovery, yet most classical discrepancy measures are tailored to two-group comparisons. We generalize the underlap coefficient (UNL), a multi-group separation measure, to multivariate variables. We establish key properties of UNL and provide an explicit connection to the total variation. We further interpret the UNL as a dependence measure between a group label and variables of interest and compare it with mutual information. We propose an importance sampling estimator of the UNL that can be combined with flexible density estimators. The utility of the UNL for assessing partition-covariate dependence in clustering is highlighted in detail, where it is particularly useful for evaluating the single-weights assumption in covariate-dependent mixture models. Finally we illustrate the application of the UNL in clustering using two real world datasets.
- Abstract(参考訳): 群間の分布分離の定量化は統計的学習と科学的な発見において基本的なものであるが、古典的な相違は2つの群の比較に合わせたものである。
多群分離尺度であるアンダーラップ係数(UNL)を多変量変数に一般化する。
我々はUNLの重要な性質を確立し、全変動に対する明示的な接続を提供する。
さらに、UNLをグループラベルと興味のある変数間の依存度として解釈し、相互情報と比較する。
フレキシブル密度推定器と組み合わせることができるUNLの重要サンプリング推定器を提案する。
クラスタリングにおける分割-共変量依存性を評価するUNLの有用性は、特に共変量依存混合モデルにおける単重量仮定を評価するのに有用である。
最後に、2つの実世界のデータセットを用いたクラスタリングにおけるUNLの適用について説明する。
関連論文リスト
- Cross-Fitting-Free Debiased Machine Learning with Multiway Dependence [0.0]
本稿では,汎用マルチウェイクラスタ依存型モーメントモデル(GMM)における2段階デバイアスド機械学習(DML)推定器の理論を,クロスフィッティングに頼らずに開発する。
我々は,Neyman-orthogonal モーメント条件を局所化に基づく経験的アプローチと組み合わせることで,サンプル分割なしに有効な推論が可能であることを示す。
論文 参考訳(メタデータ) (2026-02-11T20:09:23Z) - Clustering Approaches for Mixed-Type Data: A Comparative Study [0.0]
混在型データのクラスタリングは、このタスクに適合するアプローチがほとんどないため、課題である。
本研究は,これらの手法の現状を考察し,様々なシミュレーションモデルを用いて比較する。
KAMILA, LCM, k-prototypes は, 調整型ランドインデックス (ARI) に関して, 最高の性能を示した。
論文 参考訳(メタデータ) (2025-11-24T22:18:23Z) - Rethinking Clustered Federated Learning in NOMA Enhanced Wireless
Networks [60.09912912343705]
本研究では,新しいクラスタ化フェデレーション学習(CFL)アプローチと,非独立かつ同一に分散した(非IID)データセットを統合することのメリットについて検討する。
データ分布における非IIDの度合いを測定する一般化ギャップの詳細な理論的解析について述べる。
非IID条件によって引き起こされる課題に対処する解決策は、特性の分析によって提案される。
論文 参考訳(メタデータ) (2024-03-05T17:49:09Z) - A structured regression approach for evaluating model performance across intersectional subgroups [53.91682617836498]
分散評価(disaggregated evaluation)は、AIフェアネスアセスメントにおける中心的なタスクであり、AIシステムのさまざまなサブグループ間でのパフォーマンスを測定することを目的としている。
非常に小さなサブグループであっても,信頼性の高いシステム性能推定値が得られることを示す。
論文 参考訳(メタデータ) (2024-01-26T14:21:45Z) - Learning Group Importance using the Differentiable Hypergeometric
Distribution [16.30064635746202]
要素を未知のサイズのサブセットに分割することは、多くのアプリケーションで必須である。
本研究では,微分可能超幾何分布を提案する。
弱教師付き学習とクラスタリングという2つの典型的なアプリケーションで,サブセットのサイズを学習できることが示される。
論文 参考訳(メタデータ) (2022-03-03T10:44:50Z) - A Unified Framework for Multi-distribution Density Ratio Estimation [101.67420298343512]
バイナリ密度比推定(DRE)は多くの最先端の機械学習アルゴリズムの基礎を提供する。
ブレグマン最小化の発散の観点から一般的な枠組みを開発する。
我々のフレームワークはバイナリDREでそれらのフレームワークを厳格に一般化する手法に導かれることを示す。
論文 参考訳(メタデータ) (2021-12-07T01:23:20Z) - You Never Cluster Alone [150.94921340034688]
我々は、主流のコントラスト学習パラダイムをクラスタレベルのスキームに拡張し、同じクラスタに属するすべてのデータが統一された表現に寄与する。
分類変数の集合をクラスタ化代入信頼度として定義し、インスタンスレベルの学習トラックとクラスタレベルの学習トラックを関連付ける。
代入変数を再パラメータ化することで、TCCはエンドツーエンドでトレーニングされる。
論文 参考訳(メタデータ) (2021-06-03T14:59:59Z) - Group Heterogeneity Assessment for Multilevel Models [68.95633278540274]
多くのデータセットは固有のマルチレベル構造を含む。
この構造を考慮に入れることは、そのようなデータ上で行われた統計分析の正確性と校正にとって重要である。
本稿では,データ内のグループ化変数のレベルの違いを効率的に評価するフレキシブルなフレームワークを提案する。
論文 参考訳(メタデータ) (2020-05-06T12:42:04Z) - Learning from Aggregate Observations [82.44304647051243]
本研究では,一組のインスタンスに監視信号が与えられる集合観察から学習する問題について検討する。
本稿では,多種多様な集合観測に適合する一般的な確率的枠組みを提案する。
単純な極大解は様々な微分可能なモデルに適用できる。
論文 参考訳(メタデータ) (2020-04-14T06:18:50Z) - Statistical power for cluster analysis [0.0]
クラスターアルゴリズムは、生物医学研究でますます人気がある。
シミュレーションにより,共通解析におけるパワーと精度を推定する。
我々は,大規模なサブグループ分離が期待される場合にのみ,クラスタ分析を適用することを推奨する。
論文 参考訳(メタデータ) (2020-03-01T02:43:15Z) - Blocked Clusterwise Regression [0.0]
我々は、各ユニットが複数の潜伏変数を持つことを可能にすることで、離散的非観測的不均一性に対する以前のアプローチを一般化する。
我々は,クラスタの過剰な数のクラスタリングの理論に寄与し,この設定に対する新たな収束率を導出する。
論文 参考訳(メタデータ) (2020-01-29T23:29:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。