論文の概要: MDL-GBG: A Non-parametric and Interpretable Granular-Ball Generation Method for Clustering
- arxiv url: http://arxiv.org/abs/2605.08759v2
- Date: Wed, 13 May 2026 06:17:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-05-14 17:13:58.816652
- Title: MDL-GBG: A Non-parametric and Interpretable Granular-Ball Generation Method for Clustering
- Title(参考訳): MDL-GBG:クラスタリングのための非パラメトリックかつ解釈可能な粒界生成法
- Authors: Zeqiang Xian, Caihui Liu, Yong Zhang, Wenjing Qiu, Duoqian Miao, Witold Pedrycz,
- Abstract要約: 既存のグラニュラーボール生成法は、主に手作り品質対策と分割または停止基準によって駆動される。
本稿では,クラスタリングのための非パラメトリックかつ解釈可能なグラニュラーボール生成法である,最小記述長に基づくグラニュラーボール生成(MDL-GBG)を提案する。
- 参考スコア(独自算出の注目度): 49.85979294911059
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Existing granular-ball generation methods are still mainly driven by handcrafted quality measures and heuristic splitting or stopping criteria, which may weaken the transparency of local generation decisions in clustering. To address this issue, this paper proposes Minimum Description Length based Granular-Ball Generation (MDL-GBG), a non-parametric and interpretable granular-ball generation method for clustering. MDL-GBG reformulates granular-ball generation as a local model selection problem under the Minimum Description Length principle. For each granular ball, three candidate explanations are compared, namely a single-ball model, a two-ball model, and a core-ball-plus-residual model, and the model with the shortest description length is selected. In this way, ball retention, splitting, and residual peeling are unified within a common coding-theoretic framework. A residual reassignment mechanism is further introduced to re-evaluate peeled-off boundary samples after stable granular-balls are formed. Experiments on 20 UCI datasets show that the stable granular-balls generated by MDL-GBG provide an effective upstream representation for clustering. In particular, MDL-GBG+AC achieves the best average ranks in ARI, ACC, and NMI among the compared methods. These results indicate that MDL-GBG offers a principled and interpretable alternative to heuristic granular-ball generation strategies.
- Abstract(参考訳): 既存のグラニュラーボール生成法は、現在でも主に手作りの品質対策とヒューリスティックな分割または停止基準によって推進されており、クラスタリングにおける局所的な生成決定の透明性を弱める可能性がある。
本稿では,クラスタリングのための非パラメトリックかつ解釈可能なグラニュラーボール生成法であるMDL-GBG(Minimum Description Length based Granular-Ball Generation)を提案する。
MDL-GBGは最小記述長原理の下で局所モデル選択問題としてグラニュラーボール生成を再構成する。
各粒状ボールについて、単球モデル、二球モデル、中球+残留モデルという3つの候補説明を比較し、最短記述長のモデルを選択する。
このように、ボール保持、分割、残留剥離は共通の符号化理論の枠組みに統合される。
また、安定な粒状ボールの形成後、剥離した境界試料を再評価するための残留再割り当て機構が導入された。
20UCIデータセットの実験では、MDL-GBGが生成する安定なグラニュラーボールがクラスタリングに有効なアップストリーム表現を提供することが示された。
特に,MDL-GBG+ACは,比較手法の中でARI,ACC,NMIの平均ランクが最も高い。
これらの結果から,MDL-GBGはヒューリスティックなグラニュラーボール生成戦略に代わる原理的,解釈可能な代替手段であることが示された。
関連論文リスト
- GALACTIC: Global and Local Agnostic Counterfactuals for Time-series Clustering [9.33534873952683]
本稿では,非教師付き時系列クラスタリングのための局所的およびグローバル的対実的説明性を橋渡しする,最初の統一フレームワークであるGALACTICを紹介する。
インスタンスレベル(ローカル)では、GALACTICはクラスタ認識最適化の目的を通じて摂動を生成する。
クラスタレベル(グローバル)では、認知負荷を軽減し、解釈可能性を高めるため、代表的なCE選択問題を定式化する。
論文 参考訳(メタデータ) (2026-03-05T15:59:33Z) - Finding Time Series Anomalies using Granular-ball Vector Data Description [29.555765407206408]
グラニュラーボールワンクラスネットワーク(GBOC)は、グラニュラーボールベクトルデータ記述(GVDD)と呼ばれるデータ適応型表現に基づく新しいアプローチである。
GVDDは、潜在空間をグラニュラーボールで表されるコンパクトで高密度な領域に分割する。
推論中、最も近いグラニュラーボールまでの距離に基づいて異常スコアが計算される。
論文 参考訳(メタデータ) (2025-11-15T10:24:53Z) - Boundary-Guided Policy Optimization for Memory-efficient RL of Diffusion Large Language Models [53.339700196282905]
大きな言語モデル(dLLM)に強化学習を適用する上で重要な課題は、その可能性関数の抽出性である。
本稿では,ELBOに基づく目的の特別に構築された下界を最大化するメモリ効率のRLアルゴリズムを提案する。
実験によると、BGPOは数学の問題解決、コード生成、計画タスクにおいて、dLLMの以前のRLアルゴリズムよりも大幅に優れていた。
論文 参考訳(メタデータ) (2025-10-13T17:47:50Z) - An Enhanced Model-based Approach for Short Text Clustering [58.60681789677676]
Twitter、Google+、Facebookなどのソーシャルメディアの人気が高まり、短いテキストのクラスタリングがますます重要になっている。
既存の手法は、トピックモデルに基づくアプローチと深層表現学習に基づくアプローチの2つのパラダイムに大別することができる。
短文の空間性と高次元性を効果的に扱えるDirichlet Multinomial Mixture Model (GSDMM) のギブスサンプリングアルゴリズムを提案する。
さらなる改良を保証しているGSDMMのいくつかの側面に基づいて,さらなる性能向上を目的とした改良されたアプローチであるGSDMM+を提案する。
論文 参考訳(メタデータ) (2025-07-18T10:07:42Z) - Multi-view Granular-ball Contrastive Clustering [15.732090918798395]
粒状球はインスタンスとクラスタの間にあり、サンプル集合の局所的な位相構造を自然に保存する。
我々はMGBCC(Multi-view Granular-ball Contrastive Clustering)という手法を提案する。
論文 参考訳(メタデータ) (2024-12-18T06:53:30Z) - Generation of Granular-Balls for Clustering Based on the Principle of Justifiable Granularity [51.58924743533048]
本稿では,クラスタリングタスクのための新しいGB生成手法を紹介する。
GB のカバレッジと特異性を定義し,GB 品質を評価するための包括的尺度を導入する。
従来のGB生成手法と比較して、新しい手法は生成したGBの全体的な品質を最大化する。
論文 参考訳(メタデータ) (2024-05-11T04:21:32Z) - An Efficient and Adaptive Granular-ball Generation Method in
Classification Problem [69.02474089703678]
グラニュラーボールコンピューティングは、グラニュラーコンピューティングのための効率的で堅牢でスケーラブルな学習方法である。
本稿では,$k$-meansを置き換えるために,ディビジョンを用いたグラニュラーボール生成を高速化する手法を提案する。
従来の方法と同様の精度を確保しつつ、グラニュラーボール生成の効率を大幅に向上させることができる。
論文 参考訳(メタデータ) (2022-01-12T07:26:19Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。