論文の概要: Why the Rich Get Richer? On the Balancedness of Random Partition Models
- arxiv url: http://arxiv.org/abs/2201.12697v1
- Date: Sun, 30 Jan 2022 01:19:41 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 16:17:28.784408
- Title: Why the Rich Get Richer? On the Balancedness of Random Partition Models
- Title(参考訳): なぜ富裕層は豊かになるのか?
ランダム分割モデルのバランス性について
- Authors: Changwoo J. Lee, Huiyan Sang
- Abstract要約: 交換可能なランダム分割モデルのバランス性について検討する。
既存の多くのランダム分割モデルの「リッチ・ゲット・リッチ」特性は、2つの一般的な仮定の必然的な結果であることを示す。
また、「リッチ・ゲット・ポーラ」ランダムパーティションモデルを導入し、エンティティ・リゾリューション・タスクへの応用を解説する。
- 参考スコア(独自算出の注目度): 1.776746672434207
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Random partition models are widely used in Bayesian methods for various
clustering tasks, such as mixture models, topic models, and community detection
problems. While the number of clusters induced by random partition models has
been studied extensively, another important model property regarding the
balancedness of cluster sizes has been largely neglected. We formulate a
framework to define and theoretically study the balancedness of exchangeable
random partition models, by analyzing how a model assigns probabilities to
partitions with different levels of balancedness. We demonstrate that the
"rich-get-richer" characteristic of many existing popular random partition
models is an inevitable consequence of two common assumptions: product-form
exchangeability and projectivity. We propose a principled way to compare the
balancedness of random partition models, which gives a better understanding of
what model works better and what doesn't for different applications. We also
introduce the "rich-get-poorer" random partition models and illustrate their
application to entity resolution tasks.
- Abstract(参考訳): ランダム分割モデルは、混合モデル、トピックモデル、コミュニティ検出問題といった様々なクラスタリングタスクのためにベイズ法で広く使われている。
ランダム分割モデルによって誘導されるクラスタの数は広く研究されているが、クラスタサイズのバランス性に関する別の重要なモデル特性は無視されている。
本研究では,交換可能なランダムパーティションモデルのバランス性を定義し,理論的に研究する枠組みを定式化し,モデルのバランス性の異なるパーティションへの確率の割り当て方法を分析する。
既存の一般的なランダム分割モデルの「リッチ・ゲット・リッチ」特性は、積-形式交換可能性と射影性という2つの一般的な仮定の必然的な結果である。
我々は、ランダムパーティションモデルのバランス性を比較するための原則的な方法を提案し、モデルがどのように機能するか、異なるアプリケーションで何がうまくいかないのかをよりよく理解する。
また、"rich-get-poorer"ランダム分割モデルを導入し、エンティティ解決タスクへの応用について説明する。
関連論文リスト
- Reply to "Comment on 'Experimentally adjudicating between different causal accounts of Bell-inequality violations via statistical model selection'" [0.0]
Hance と Hossenfelder はコメントの中で、超決定論的モデルの目的を誤って表現したと主張している。
本稿で定義した超決定論的モデルの異なるクラスと、これらのどれが実験結果に嫌われているのかという結論を思い出すことで、この主張に異議を唱える。
論文 参考訳(メタデータ) (2024-12-03T20:47:47Z) - An Entropy-Based Test and Development Framework for Uncertainty Modeling in Level-Set Visualizations [2.5449631655313896]
アンサンブルデータに直接エントロピー計算を用いて予測結果を確立する。
非パラメトリックヒストグラムモデルにおけるビンの削減はより効果的であるのに対し、量子モデルにおける多くのビンはデータの正確性に近づいている。
論文 参考訳(メタデータ) (2024-09-13T00:31:16Z) - Random Models for Fuzzy Clustering Similarity Measures [0.0]
Adjusted Rand Index (ARI) は、ハードクラスタリングを比較するために広く使われている手法である。
本稿では,ハードクラスタリングとファジィクラスタリングの両方に対して直感的で説明可能な3つのランダムモデルを用いて,ARIを計算するための単一のフレームワークを提案する。
論文 参考訳(メタデータ) (2023-12-16T00:07:04Z) - Locking and Quacking: Stacking Bayesian model predictions by log-pooling
and superposition [0.5735035463793007]
異なるモデルから予測を合成するための2つの新しいツールを提案する。
これらはモデル積み重ねの一般化であるが、対数線形プールと量子重ね合わせによって後続密度を結合する。
モデル重みを正規化の負担を回避しつつ最適化するため, 混合後予測のハイバリネンスコアについて検討した。
論文 参考訳(メタデータ) (2023-05-12T09:26:26Z) - Investigating Ensemble Methods for Model Robustness Improvement of Text
Classifiers [66.36045164286854]
既存のバイアス機能を分析し、すべてのケースに最適なモデルが存在しないことを実証します。
適切なバイアスモデルを選択することで、より洗練されたモデル設計でベースラインよりもロバスト性が得られる。
論文 参考訳(メタデータ) (2022-10-28T17:52:10Z) - A Twin Neural Model for Uplift [59.38563723706796]
Upliftは条件付き治療効果モデリングの特定のケースです。
相対リスクのベイズ解釈との関連性を利用して定義した新たな損失関数を提案する。
本提案手法は,シミュレーション設定の最先端と大規模ランダム化実験による実データとの競合性を示す。
論文 参考訳(メタデータ) (2021-05-11T16:02:39Z) - Characterizing Fairness Over the Set of Good Models Under Selective
Labels [69.64662540443162]
同様の性能を実現するモデルセットに対して,予測公正性を特徴付けるフレームワークを開発する。
到達可能なグループレベルの予測格差の範囲を計算するためのトラクタブルアルゴリズムを提供します。
選択ラベル付きデータの実証的な課題に対処するために、我々のフレームワークを拡張します。
論文 参考訳(メタデータ) (2021-01-02T02:11:37Z) - Improving the Reconstruction of Disentangled Representation Learners via Multi-Stage Modeling [54.94763543386523]
現在の自己エンコーダに基づく非絡み合い表現学習法は、(集合体)後部をペナルティ化し、潜伏因子の統計的独立を促進することで、非絡み合いを実現する。
本稿では,不整合因子をペナルティに基づく不整合表現学習法を用いて学習する,新しい多段階モデリング手法を提案する。
次に、低品質な再構成を、欠落した関連潜伏変数をモデル化するために訓練された別の深層生成モデルで改善する。
論文 参考訳(メタデータ) (2020-10-25T18:51:15Z) - Robust Finite Mixture Regression for Heterogeneous Targets [70.19798470463378]
本稿では,サンプルクラスタの探索と,複数の不完全な混合型ターゲットを同時にモデル化するFMRモデルを提案する。
我々は、高次元の学習フレームワークの下で、無症状のオラクルのパフォーマンス境界をモデルに提供します。
その結果,我々のモデルは最先端の性能を達成できることがわかった。
論文 参考訳(メタデータ) (2020-10-12T03:27:07Z) - Decision-Making with Auto-Encoding Variational Bayes [71.44735417472043]
変分分布とは異なる後部近似を用いて意思決定を行うことが示唆された。
これらの理論的な結果から,最適モデルに関するいくつかの近似的提案を学習することを提案する。
おもちゃの例に加えて,単細胞RNAシークエンシングのケーススタディも紹介する。
論文 参考訳(メタデータ) (2020-02-17T19:23:36Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。