論文の概要: Optimal Decision Trees For Interpretable Clustering with Constraints
- arxiv url: http://arxiv.org/abs/2301.12671v1
- Date: Mon, 30 Jan 2023 05:34:49 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 15:35:13.443662
- Title: Optimal Decision Trees For Interpretable Clustering with Constraints
- Title(参考訳): 制約付き解釈可能なクラスタリングのための最適決定木
- Authors: Pouya Shati, Eldan Cohen, Sheila McIlraith
- Abstract要約: 制約クラスタリング(Constrained clustering)は、制約として定式化された限られた量のラベル付きデータを使用する半教師付きタスクである。
本稿では、クラスタリング制約をサポートする解釈可能なクラスタリングのための新しいSATベースのフレームワークを提案する。
また,ユーザが提供する制約の解釈可能性と満足度とのトレードオフについて,新たな知見を提示する。
- 参考スコア(独自算出の注目度): 7.799182201815762
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Constrained clustering is a semi-supervised task that employs a limited
amount of labelled data, formulated as constraints, to incorporate
domain-specific knowledge and to significantly improve clustering accuracy.
Previous work has considered exact optimization formulations that can guarantee
optimal clustering while satisfying all constraints, however these approaches
lack interpretability. Recently, decision-trees have been used to produce
inherently interpretable clustering solutions, however existing approaches do
not support clustering constraints and do not provide strong theoretical
guarantees on solution quality. In this work, we present a novel SAT-based
framework for interpretable clustering that supports clustering constraints and
that also provides strong theoretical guarantees on solution quality. We also
present new insight into the trade-off between interpretability and
satisfaction of such user-provided constraints. Our framework is the first
approach for interpretable and constrained clustering. Experiments with a range
of real-world and synthetic datasets demonstrate that our approach can produce
high-quality and interpretable constrained clustering solutions.
- Abstract(参考訳): 制約クラスタリング(Constrained clustering)は、制約として定式化された限られた量のラベル付きデータを使用し、ドメイン固有の知識を取り入れ、クラスタリングの精度を大幅に向上する半教師付きタスクである。
これまでの研究では、全ての制約を満たすことなく最適なクラスタリングを保証できる正確な最適化形式が検討されてきたが、これらのアプローチには解釈性がない。
近年、決定木は本質的に解釈可能なクラスタリングソリューションを作成するために使われてきたが、既存のアプローチではクラスタリングの制約をサポートしておらず、ソリューションの品質に関する強い理論的保証を提供していない。
本稿では,クラスタ化制約をサポートするとともに,ソリューションの品質に関する強い理論的保証を提供する,satベースの新しいクラスタリングフレームワークを提案する。
また,このようなユーザ制約の解釈可能性と満足度とのトレードオフに関する新たな知見を提示する。
私たちのフレームワークは、解釈可能で制約のあるクラスタリングのための最初のアプローチです。
実世界および合成データセットを用いた実験により、我々のアプローチは高品質で解釈可能な制約付きクラスタリングソリューションを作成できることを示した。
関連論文リスト
- Self-Supervised Graph Embedding Clustering [70.36328717683297]
K-means 1-step dimensionality reduction clustering method は,クラスタリングタスクにおける次元性の呪いに対処する上で,いくつかの進歩をもたらした。
本稿では,K-meansに多様体学習を統合する統一フレームワークを提案する。
論文 参考訳(メタデータ) (2024-09-24T08:59:51Z) - ConstraintMatch for Semi-constrained Clustering [32.92933231199262]
制約クラスタリングにより、ペアの制約のみを使用して分類モデルのトレーニングが可能になる。
そこで本稿では,制約の少ない制約セットとともに大量のテキスト非制約データを利用できる半教師付きコンテキストを提案し,制約のないデータを活用するためのtextitConstraintMatchを提案する。
論文 参考訳(メタデータ) (2023-11-26T19:31:52Z) - Semi-Supervised Constrained Clustering: An In-Depth Overview, Ranked
Taxonomy and Future Research Directions [2.5957372084704238]
制約クラスタリングの研究領域は、長年にわたって大きく成長してきた。
利用可能なさまざまなメソッド、制約、ベンチマークを簡単に理解するために、統一された概要は提供されていない。
本研究では,制約クラスタリングの背景を詳細に分析し,制約クラスタリングに使用できる制約の種類を分類する。
論文 参考訳(メタデータ) (2023-02-28T17:46:31Z) - Tight Guarantees for Interactive Decision Making with the
Decision-Estimation Coefficient [51.37720227675476]
我々は、決定推定係数の新たな変種を導入し、それを用いて、3つの面における事前の作業を改善する新しい下界を導出する。
我々は同じ量でスケールした後悔について上界を与え、フォスター等における上界と下界の間のギャップの1つを除いて全てを閉じる。
この結果は、後悔のフレームワークとPACフレームワークの両方に適用され、我々が期待するいくつかの新しい分析とアルゴリズム設計技術を利用して、より広範な利用が期待できる。
論文 参考訳(メタデータ) (2023-01-19T18:24:08Z) - Rethinking Clustering-Based Pseudo-Labeling for Unsupervised
Meta-Learning [146.11600461034746]
教師なしメタラーニングのメソッドであるCACTUsは、擬似ラベル付きクラスタリングベースのアプローチである。
このアプローチはモデルに依存しないため、教師付きアルゴリズムと組み合わせてラベルのないデータから学習することができる。
このことの核となる理由は、埋め込み空間においてクラスタリングに優しい性質が欠如していることである。
論文 参考訳(メタデータ) (2022-09-27T19:04:36Z) - Algorithm for Constrained Markov Decision Process with Linear
Convergence [55.41644538483948]
エージェントは、そのコストに対する複数の制約により、期待される累積割引報酬を最大化することを目的としている。
エントロピー正規化ポリシーとベイダの二重化という2つの要素を統合した新しい双対アプローチが提案されている。
提案手法は(線形速度で)大域的最適値に収束することが示されている。
論文 参考訳(メタデータ) (2022-06-03T16:26:38Z) - Clustering to the Fewest Clusters Under Intra-Cluster Dissimilarity
Constraints [0.0]
均等なクラスタリングは、密度も期待されるクラスの数にも依存せず、相似性の閾値にも依存します。
このクラスタリング問題に対する様々な実践的ソリューション間のトレードオフを特定するために,適切なクラスタリングアルゴリズムをレビューし,評価する。
論文 参考訳(メタデータ) (2021-09-28T12:02:18Z) - Deep Fair Discriminative Clustering [24.237000220172906]
2値および多状態保護状態変数(PSV)に対するグループレベルの公正性の一般概念について検討する。
本稿では,クラスタリング目標とフェアネス目標とを組み合わせて,フェアクラスタを適応的に学習する改良学習アルゴリズムを提案する。
本フレームワークは, フレキシブルフェアネス制約, マルチステートPSV, 予測クラスタリングなど, 新規なクラスタリングタスクに対して有望な結果を示す。
論文 参考訳(メタデータ) (2021-05-28T23:50:48Z) - Fairness, Semi-Supervised Learning, and More: A General Framework for
Clustering with Stochastic Pairwise Constraints [32.19047459493177]
我々は,いくつかの本質的クラスタリングの目的に組み込んだ,新しいemphstochastic pairwise制約系を導入する。
これらの制約は,半教師付き学習における emphinvidual fairness や emphmust-link 制約など,興味をそそるアプリケーションの集合を簡潔にモデル化できることを示す。
論文 参考訳(メタデータ) (2021-03-02T20:27:58Z) - Scalable Hierarchical Agglomerative Clustering [65.66407726145619]
既存のスケーラブルな階層的クラスタリング手法は、スピードの質を犠牲にする。
我々は、品質を犠牲にせず、数十億のデータポイントまでスケールする、スケーラブルで集約的な階層的クラスタリング法を提案する。
論文 参考訳(メタデータ) (2020-10-22T15:58:35Z) - An Integer Linear Programming Framework for Mining Constraints from Data [81.60135973848125]
データから制約をマイニングするための一般的なフレームワークを提案する。
特に、構造化された出力予測の推論を整数線形プログラミング(ILP)問題とみなす。
提案手法は,9×9のスドクパズルの解法を学習し,基礎となるルールを提供することなく,例からツリー問題を最小限に分散させることが可能であることを示す。
論文 参考訳(メタデータ) (2020-06-18T20:09:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。