論文の概要: Supervised Homogeneity Fusion: a Combinatorial Approach
- arxiv url: http://arxiv.org/abs/2201.01036v1
- Date: Tue, 4 Jan 2022 08:35:54 GMT
- ステータス: 処理完了
- システム内更新日: 2022-01-05 13:35:18.404841
- Title: Supervised Homogeneity Fusion: a Combinatorial Approach
- Title(参考訳): supervised homogeneity fusion: 組合せアプローチ
- Authors: Wen Wang, Shihao Wu, Ziwei Zhu, Ling Zhou, Peter X.-K. Song
- Abstract要約: 我々は$L_$-Fusionと呼ばれる新しいグループ化手法を提案し,検討する。
L_$-Fusion はグループ化感度の最も弱い要求条件下でグループ化整合性を達成することを示す。
We provide a MIO formulation for $L_$-Fusion with a warm start strategy。
- 参考スコア(独自算出の注目度): 14.062104254741467
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Fusing regression coefficients into homogenous groups can unveil those
coefficients that share a common value within each group. Such groupwise
homogeneity reduces the intrinsic dimension of the parameter space and
unleashes sharper statistical accuracy. We propose and investigate a new
combinatorial grouping approach called $L_0$-Fusion that is amenable to mixed
integer optimization (MIO). On the statistical aspect, we identify a
fundamental quantity called grouping sensitivity that underpins the difficulty
of recovering the true groups. We show that $L_0$-Fusion achieves grouping
consistency under the weakest possible requirement of the grouping sensitivity:
if this requirement is violated, then the minimax risk of group
misspecification will fail to converge to zero. Moreover, we show that in the
high-dimensional regime, one can apply $L_0$-Fusion coupled with a sure
screening set of features without any essential loss of statistical efficiency,
while reducing the computational cost substantially. On the algorithmic aspect,
we provide a MIO formulation for $L_0$-Fusion along with a warm start strategy.
Simulation and real data analysis demonstrate that $L_0$-Fusion exhibits
superiority over its competitors in terms of grouping accuracy.
- Abstract(参考訳): 回帰係数を同族群に融合することで、各群内で共通の値を共有する係数を顕示することができる。
このような群的同質性はパラメータ空間の固有次元を減少させ、より鋭い統計的精度を解き放つ。
混合整数最適化(MIO)に有効な$L_0$-Fusionと呼ばれる新たな組合せ群化手法を提案し,検討する。
統計的側面から、真の群を回復する難しさを裏付けるグループ感度と呼ばれる基本量を特定する。
l_0$-fusion はグループ化感度の最も弱い要件の下でグループ化一貫性を達成する:もしこの要件に違反した場合、グループ化の最小リスクは 0 に収束しない。
さらに,高次元のシステムでは,統計的効率を損なうことなく,数値計算コストを大幅に削減しつつ,確実に特徴の検定セットと組み合わせて$L_0$-Fusionを適用できることが示される。
アルゴリズムの面では、暖かいスタート戦略とともに$L_0$-FusionのMIO定式化を提供する。
シミュレーションと実データ解析により、$L_0$-Fusionは、グループ化精度において競合他社よりも優れていることを示した。
関連論文リスト
- Byzantine-resilient Federated Learning With Adaptivity to Data Heterogeneity [54.145730036889496]
本稿では、ビザンツの悪意ある攻撃データの存在下でのグラディエント・ラーニング(FL)を扱う。
Average Algorithm (RAGA) が提案され、ロバストネスアグリゲーションを活用してデータセットを選択することができる。
論文 参考訳(メタデータ) (2024-03-20T08:15:08Z) - Efficient Algorithms for Empirical Group Distributional Robust
Optimization and Beyond [15.664414751701718]
経験的GDROを$textittwo-level$ finite-sum convex-concave minimax Optimization問題として定式化する。
我々は、スナップショットとミラースナップショットポイントを1インデックスシフトした重み付き平均で計算し、単純エルゴディック平均と区別する。
注目すべきは、我々の手法が最先端の手法よりも$sqrtm$で優れていることだ。
論文 参考訳(メタデータ) (2024-03-06T09:14:24Z) - Optimal Clustering with Bandit Feedback [57.672609011609886]
本稿では,バンディットフィードバックを用いたオンラインクラスタリングの問題点について考察する。
これは、NPハード重み付きクラスタリング問題をサブルーチンとして解決する必要性を回避するための、シーケンシャルなテストのための新しい停止規則を含む。
合成および実世界のデータセットの広範なシミュレーションを通して、BOCの性能は下界と一致し、非適応的ベースラインアルゴリズムよりも大幅に優れることを示す。
論文 参考訳(メタデータ) (2022-02-09T06:05:05Z) - Feature Grouping and Sparse Principal Component Analysis [23.657672812296518]
Grouping and Sparse principal Analysis (SPCA) はデータ処理次元の削減に広く利用されている。
FGSPCAは、荷重が不均一な同種群に属することを許容し、空間性は特別な場合である。
論文 参考訳(メタデータ) (2021-06-25T15:08:39Z) - Examining and Combating Spurious Features under Distribution Shift [94.31956965507085]
我々は、最小限の統計量という情報理論の概念を用いて、ロバストで刺激的な表現を定義し、分析する。
入力分布のバイアスしか持たない場合でも、モデルはトレーニングデータから急激な特徴を拾い上げることができることを証明しています。
分析から着想を得た結果,グループDROは,グループ同士の相関関係を直接考慮しない場合に失敗する可能性が示唆された。
論文 参考訳(メタデータ) (2021-06-14T05:39:09Z) - Solving weakly supervised regression problem using low-rank manifold
regularization [77.34726150561087]
我々は弱い教師付き回帰問題を解く。
weakly"の下では、いくつかのトレーニングポイントではラベルが知られ、未知のものもあれば、無作為なノイズの存在やリソースの欠如などの理由によって不確かであることが分かっています。
数値的な節ではモンテカルロモデルを用いて提案手法を人工と実のデータセットに適用した。
論文 参考訳(メタデータ) (2021-04-13T23:21:01Z) - Robust Grouped Variable Selection Using Distributionally Robust
Optimization [11.383869751239166]
摂動下での群付き変数選択のための不確実性セットを用いた分布ロバスト最適化(DRO)の定式化を提案する。
我々は,サンプル外損失と推定バイアスの確率的境界を証明し,推定器の群化効果を確立する。
我々の定式化は,群レベルでの空間性を促進する解釈可能で同相なモデルを生成することを示す。
論文 参考訳(メタデータ) (2020-06-10T22:32:52Z) - Computationally efficient sparse clustering [67.95910835079825]
我々はPCAに基づく新しいクラスタリングアルゴリズムの有限サンプル解析を行う。
ここでは,ミニマックス最適誤クラスタ化率を,体制$|theta infty$で達成することを示す。
論文 参考訳(メタデータ) (2020-05-21T17:51:30Z) - Robustly Learning any Clusterable Mixture of Gaussians [55.41573600814391]
本研究では,高次元ガウス混合系の対向ロバスト条件下での効率的な学習性について検討する。
理論的に最適に近い誤り証明である$tildeO(epsilon)$の情報を、$epsilon$-corrupted $k$-mixtureで学習するアルゴリズムを提供する。
我々の主な技術的貢献は、ガウス混合系からの新しい頑健な識別可能性証明クラスターであり、これは正方形の定度証明システムによって捉えることができる。
論文 参考訳(メタデータ) (2020-05-13T16:44:12Z) - Outlier-Robust Clustering of Non-Spherical Mixtures [5.863264019032882]
統計的に分離されたd-次元ガウスアン(k-GMM)の混合をクラスタリングするための最初のアウトリー・ローバストアルゴリズムを与える。
この結果は、$d$次元単位球面上の均一分布の任意のアフィン変換のクラスタリング混合に拡張される。
論文 参考訳(メタデータ) (2020-05-06T17:24:27Z) - Statistical power for cluster analysis [0.0]
クラスターアルゴリズムは、生物医学研究でますます人気がある。
シミュレーションにより,共通解析におけるパワーと精度を推定する。
我々は,大規模なサブグループ分離が期待される場合にのみ,クラスタ分析を適用することを推奨する。
論文 参考訳(メタデータ) (2020-03-01T02:43:15Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。