論文の概要: Interpretable clustering via optimal multiway-split decision trees
- arxiv url: http://arxiv.org/abs/2602.13586v1
- Date: Sat, 14 Feb 2026 04:08:52 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-17 14:17:28.222108
- Title: Interpretable clustering via optimal multiway-split decision trees
- Title(参考訳): 最適マルチウェイ分割決定木による解釈可能なクラスタリング
- Authors: Hayato Suzuki, Shunnosuke Ikeda, Yuichi Takano,
- Abstract要約: 最適マルチウェイ分割決定木に基づく解釈可能なクラスタリング手法を提案する。
提案手法の重要な特徴は,連続変数の離散化のための一次元K平均アルゴリズムの統合である。
提案手法は,様々な評価指標の競合性能を維持しつつ,高精度な決定規則付きマルチウェイ分割決定木を生成する。
- 参考スコア(独自算出の注目度): 1.8224668251608893
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Clustering serves as a vital tool for uncovering latent data structures, and achieving both high accuracy and interpretability is essential. To this end, existing methods typically construct binary decision trees by solving mixed-integer nonlinear optimization problems, often leading to significant computational costs and suboptimal solutions. Furthermore, binary decision trees frequently result in excessively deep structures, which makes them difficult to interpret. To mitigate these issues, we propose an interpretable clustering method based on optimal multiway-split decision trees, formulated as a 0-1 integer linear optimization problem. This reformulation renders the optimization problem more tractable compared to existing models. A key feature of our method is the integration of a one-dimensional K-means algorithm for the discretization of continuous variables, allowing for flexible and data-driven branching. Extensive numerical experiments on publicly available real-world datasets demonstrate that our method outperforms baseline methods in terms of clustering accuracy and interpretability. Our method yields multiway-split decision trees with concise decision rules while maintaining competitive performance across various evaluation metrics.
- Abstract(参考訳): クラスタリングは潜在データ構造を明らかにする上で不可欠なツールであり、高い精度と解釈可能性の両方を達成することが不可欠である。
この目的のために、既存の手法は通常、混合整数非線形最適化問題を解くことによって二分決定木を構築し、しばしば計算コストと準最適解をもたらす。
さらに、二分決定木はしばしば過度に深い構造をもたらすため、解釈が困難である。
これらの問題を緩和するために,0-1整数線形最適化問題として定式化された最適マルチウェイ分割決定木に基づく解釈可能なクラスタリング手法を提案する。
この修正により、最適化問題は既存のモデルに比べてより厳密になる。
この手法の重要な特徴は、連続変数の離散化のための1次元K平均アルゴリズムの統合であり、柔軟性とデータ駆動分岐を可能にする。
公開されている実世界のデータセットに対する大規模な数値実験により,本手法はクラスタリング精度と解釈可能性において,ベースライン法よりも優れていることが示された。
提案手法は,様々な評価指標の競合性能を維持しつつ,高精度な決定規則付きマルチウェイ分割決定木を生成する。
関連論文リスト
- Divide and Learn: Multi-Objective Combinatorial Optimization at Scale [41.78439888126577]
多目的最適化は指数関数的に大きな離散空間上の解を求める。
分割された決定空間上でのオンライン学習問題として再編成し、位置ワイドバンディットのサブプロブレムを解決する。
標準ベンチマークでは,80~98%の特殊解法性能を達成している。
論文 参考訳(メタデータ) (2026-02-11T20:29:35Z) - Generalized Optimal Classification Trees: A Mixed-Integer Programming Approach [17.725629133949955]
混合整数プログラミング(MIP)は高度なモデリングの柔軟性を提供する。
非線形性能指標に基づく最適分類木学習のためのMIPベースのフレームワークを提案する。
提案手法を50のベンチマークデータセットで評価した。
論文 参考訳(メタデータ) (2026-02-02T14:46:01Z) - A novel gradient-based method for decision trees optimizing arbitrary differential loss functions [2.4861619769660637]
本研究では、任意の微分可微分損失関数を最適化する勾配に基づく決定木を構築する新しい手法を提案する。
本手法の分類・回帰・生存分析への適用性を示す。
この方法の実装は公開されており、研究者や実践者に実用的なツールを提供している。
論文 参考訳(メタデータ) (2025-03-22T20:25:30Z) - Linearization Algorithms for Fully Composite Optimization [61.20539085730636]
本稿では,完全合成最適化問題を凸コンパクト集合で解くための一階アルゴリズムについて検討する。
微分可能および非微分可能を別々に扱い、滑らかな部分のみを線形化することで目的の構造を利用する。
論文 参考訳(メタデータ) (2023-02-24T18:41:48Z) - Tree ensemble kernels for Bayesian optimization with known constraints
over mixed-feature spaces [54.58348769621782]
木アンサンブルはアルゴリズムチューニングやニューラルアーキテクチャ検索といったブラックボックス最適化タスクに適している。
ブラックボックス最適化にツリーアンサンブルを使うことの2つのよく知られた課題は、探索のためのモデル不確実性を効果的に定量化し、また、 (ii) ピースワイドな定値取得関数を最適化することである。
我々のフレームワークは、連続/離散的機能に対する非拘束ブラックボックス最適化のための最先端の手法と同様に、混合変数の特徴空間と既知の入力制約を組み合わせた問題の競合する手法よりも優れている。
論文 参考訳(メタデータ) (2022-07-02T16:59:37Z) - Quant-BnB: A Scalable Branch-and-Bound Method for Optimal Decision Trees
with Continuous Features [5.663538370244174]
本稿では,分岐とバウンド(BnB)に基づく新たな離散最適化手法を提案する。
提案アルゴリズムのQuant-BnBは,様々な実データセット上での浅い最適木に対する既存手法と比較して,大幅な高速化を示す。
論文 参考訳(メタデータ) (2022-06-23T17:19:29Z) - Mixed-Integer Optimization with Constraint Learning [4.462264781248437]
我々は、学習制約を伴う混合整数最適化のための幅広い方法論基盤を確立する。
我々は多くの機械学習手法の混合整数最適化・表現性を利用する。
本手法は,World Food Programme計画と化学療法最適化の両方で実証する。
論文 参考訳(メタデータ) (2021-11-04T20:19:55Z) - Sparse PCA via $l_{2,p}$-Norm Regularization for Unsupervised Feature
Selection [138.97647716793333]
再構成誤差を$l_2,p$ノルム正規化と組み合わせることで,単純かつ効率的な特徴選択手法を提案する。
提案する非教師付きモデルを解くための効率的な最適化アルゴリズムを提案し,アルゴリズムの収束と計算の複雑さを理論的に解析する。
論文 参考訳(メタデータ) (2020-12-29T04:08:38Z) - Stochastic Optimization Forests [60.523606291705214]
標準的なランダムな森林アルゴリズムのように予測精度を向上させるために分割するのではなく、分割を選択した木を栽培し、下流の意思決定品質を直接最適化することで、森林決定政策の訓練方法を示す。
概略分割基準は、各候補分割に対して正確に最適化された森林アルゴリズムに近い性能を保ちながら、100倍のランニング時間を短縮できることを示す。
論文 参考訳(メタデータ) (2020-08-17T16:56:06Z) - Generalized and Scalable Optimal Sparse Decision Trees [56.35541305670828]
様々な目的に対して最適な決定木を生成する手法を提案する。
また,連続変数が存在する場合に最適な結果が得られるスケーラブルなアルゴリズムも導入する。
論文 参考訳(メタデータ) (2020-06-15T19:00:11Z) - Learning with Differentiable Perturbed Optimizers [54.351317101356614]
本稿では,操作を微分可能で局所的に一定ではない操作に変換する手法を提案する。
提案手法は摂動に依拠し,既存の解法とともに容易に利用することができる。
本稿では,この枠組みが,構造化予測において発達した損失の族とどのように結びつくかを示し,学習課題におけるそれらの使用に関する理論的保証を与える。
論文 参考訳(メタデータ) (2020-02-20T11:11:32Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。