論文の概要: Optimal Clustering with Dependent Costs in Bayesian Networks
- arxiv url: http://arxiv.org/abs/2308.03970v4
- Date: Tue, 03 Dec 2024 05:41:12 GMT
- ステータス: 翻訳完了
- システム内更新日: 2024-12-04 15:38:49.444013
- Title: Optimal Clustering with Dependent Costs in Bayesian Networks
- Title(参考訳): ベイジアンネットワークにおける依存コストを考慮した最適クラスタリング
- Authors: Paul Pao-Yen Wu, Fabrizio Ruggeri, Kerrie Mengersen,
- Abstract要約: ベイジアンネットワーク(BN)におけるノードのクラスタリングと、動的BN(DBN)のような関連するグラフィカルモデルが、計算効率の向上とモデル学習の改善のために実証されている。
本稿では, 任意に定義された正のコスト関数が与えられた場合, 全ての最適なクラスタマッピングを求めるために, 解析的に解析的に示される Dependent Cluster MAPping (DCMAP) というアルゴリズムを提案する。
- 参考スコア(独自算出の注目度): 0.0
- License:
- Abstract: Clustering of nodes in Bayesian Networks (BNs) and related graphical models such as Dynamic BNs (DBNs) has been demonstrated to enhance computational efficiency and improve model learning. Typically, it involves the partitioning of the underlying Directed Acyclic Graph (DAG) into cliques, or optimising for some cost or criteria. Computational cost is important since BN and DBN inference, such as estimating marginal distributions given evidence or updating model parameters, is NP-hard. The challenge is exacerbated by cost dependency, where inference outcomes and hence clustering cost depends on both nodes within a cluster and the mapping of clusters that are connected by at least one arc. We propose an algorithm called Dependent Cluster MAPping (DCMAP) which is shown analytically, given an arbitrarily defined, positive cost function, to find all optimal cluster mappings, and do so with no more iterations than an equally informed algorithm. DCMAP is demonstrated on a complex systems seagrass DBN, which has 25 nodes per time-slice, and captures biological, ecological and environmental dynamics and their interactions to predict the impact of dredging stressors on resilience and their cumulative effects over time. The algorithm is employed to find clusters to optimise the computational efficiency of inferring marginal distributions given evidence. For the 25 (one time-slice) and 50-node (two time-slices) DBN, the search space size was $9.91\times10^9$ and $1.51\times10^{21}$ possible cluster mappings, respectively, but the first optimal solution was found at iteration number 856 (95\% CI 852,866), and 1569 (1566,1581) with a cost that was 4\% and 0.2\% of the naive heuristic cost, respectively. Through optimal clustering, DCMAP opens up opportunities for further research beyond improving computational efficiency, such as using clustering to minimise entropy in BN learning.
- Abstract(参考訳): ベイジアンネットワーク(BN)におけるノードのクラスタリングと、動的BN(DBN)のような関連するグラフィカルモデルが、計算効率の向上とモデル学習の改善のために実証されている。
通常、DAG(Directed Acyclic Graph)を斜めに分割したり、コストや基準を最適化する。
BNとDBNの推論は、与えられた証拠の限界分布の推定やモデルパラメータの更新など、NPハードであるため、計算コストが重要である。
この課題は、推論結果とクラスタリングコストがクラスタ内の両方のノードと、少なくとも1つのアークで接続されたクラスタのマッピングに依存する、コスト依存によって悪化する。
本稿では, 任意に定義された正のコスト関数を与えられた依存クラスタマップ(DCMAP)と呼ばれるアルゴリズムを提案する。
DCMAPは、時間スライス毎に25のノードを持つ複雑なシステムで実証され、生物学的、生態学的、環境的ダイナミクスと相互作用を捉えて、ドレジンストレスサーが弾力性および累積効果に与える影響を予測する。
このアルゴリズムは、与えられた証拠を推定する限界分布の計算効率を最適化するためにクラスターを見つけるために用いられる。
25(タイムスライス)と50ノード(タイムスライス)のDBNでは、探索空間は9.91\times10^9$と1.51\times10^{21}のクラスタマッピングが可能であったが、最初の最適解は反復数856(95\% CI 852,866)と1569 (1566,1581)でそれぞれ4\%と0.2\%であった。
最適なクラスタリングを通じて、DCMAPは、BN学習におけるエントロピーを最小化するためにクラスタリングを使用するなど、計算効率の改善を超えてさらなる研究を行う機会を開く。
関連論文リスト
- TANGO: Clustering with Typicality-Aware Nonlocal Mode-Seeking and Graph-Cut Optimization [2.4783546111391215]
モード探索による密度に基づくクラスタリング手法は通常,局所密度推定を用いて構造情報のマイニングによってクラスタリングを実現する。
本稿では,グローバルな視点の特異性を利用して局所的依存関係を確立するアルゴリズム(TANGO)を提案する。
サブクラスタにグラフカットを使用することで、最終的なクラスタリングを実現しているため、クラスタセンターの選択が困難なことを回避することができる。
論文 参考訳(メタデータ) (2024-08-19T15:26:25Z) - Cluster-based Graph Collaborative Filtering [55.929052969825825]
グラフ畳み込みネットワーク(GCN)は、レコメンデーションシステムのためのユーザおよびアイテム表現の学習に成功している。
既存のGCNベースのほとんどのメソッドは、高階グラフ畳み込みを実行しながら、ユーザの複数の関心事を見落としている。
クラスタベースグラフ協調フィルタリング(ClusterGCF)と呼ばれる新しいGCNベースのレコメンデーションモデルを提案する。
論文 参考訳(メタデータ) (2024-04-16T07:05:16Z) - MeanCut: A Greedy-Optimized Graph Clustering via Path-based Similarity
and Degree Descent Criterion [0.6906005491572401]
スペクトルクラスタリングは、優れたパフォーマンス、簡単な実装、強力な適応性のために人気があり、魅力的です。
我々は,MeanCutを目的関数として提案し,非破壊グラフ分割の次数降下順で厳密に最適化する。
本アルゴリズムの有効性は,実世界のベンチマークによる検証と顔認識の適用によって実証される。
論文 参考訳(メタデータ) (2023-12-07T06:19:39Z) - Reinforcement Graph Clustering with Unknown Cluster Number [91.4861135742095]
本稿では,Reinforcement Graph Clusteringと呼ばれる新しいディープグラフクラスタリング手法を提案する。
提案手法では,クラスタ数決定と教師なし表現学習を統一的なフレームワークに統合する。
フィードバック動作を行うために、クラスタリング指向の報酬関数を提案し、同一クラスタの凝集を高め、異なるクラスタを分離する。
論文 参考訳(メタデータ) (2023-08-13T18:12:28Z) - Revisiting Instance-Optimal Cluster Recovery in the Labeled Stochastic Block Model [69.15976031704687]
IAC (Instance-Adaptive Clustering, インスタンス適応クラスタリング) を提案する。
IACは$ MathcalO(n, textpolylog(n) $の計算複雑性を維持しており、大規模問題に対してスケーラブルで実用的なものである。
論文 参考訳(メタデータ) (2023-06-18T08:46:06Z) - Dink-Net: Neural Clustering on Large Graphs [59.10189693120368]
ディープグラフクラスタリング法 (Dink-Net) は, 拡張と縮小という概念を用いて提案される。
ノードを識別することにより、拡張によって劣化しても、表現は自己教師された方法で学習される。
クラスタリング分布は、提案したクラスタ拡張損失とクラスタ縮小損失を最小化することにより最適化される。
ランナアップと比較して、Dink-Net 9.62%は1100万ノードと16億エッジを持つogbn-papers100MデータセットでNMIの改善を実現している。
論文 参考訳(メタデータ) (2023-05-28T15:33:24Z) - Local Sample-weighted Multiple Kernel Clustering with Consensus
Discriminative Graph [73.68184322526338]
マルチカーネルクラスタリング(MKC)は、ベースカーネルの集合から最適な情報融合を実現するためにコミットされる。
本稿では,新しい局所サンプル重み付きマルチカーネルクラスタリングモデルを提案する。
実験により, LSWMKCはより優れた局所多様体表現を有し, 既存のカーネルやグラフベースのクラスタリングアルゴリズムよりも優れていた。
論文 参考訳(メタデータ) (2022-07-05T05:00:38Z) - Exact and Approximate Hierarchical Clustering Using A* [51.187990314731344]
クラスタリングのA*探索に基づく新しいアプローチを紹介します。
A*と新しいエンフォレリスデータ構造を組み合わせることで、禁止的に大きな検索空間を克服します。
実験により,本手法は粒子物理利用事例や他のクラスタリングベンチマークにおいて,ベースラインよりもかなり高品質な結果が得られることを示した。
論文 参考訳(メタデータ) (2021-04-14T18:15:27Z) - Interpretable Clustering on Dynamic Graphs with Recurrent Graph Neural
Networks [24.017988997693262]
ノードとノードのクラスタメンバーシップ間の接続が時間とともに変化する可能性がある動的グラフにおけるノードのクラスタリングの問題を検討する。
まず,ノード間の重み付き接続に基づいてノードをクラスタ化し,その重みが時間とともに一定速度で減少する,簡易な崩壊ベースのクラスタリングアルゴリズムを提案する。
本稿では,各クラスタの最適減衰率を特徴付け,真のクラスタのほぼ完全回復を実現するクラスタリング手法を提案する。
論文 参考訳(メタデータ) (2020-12-16T04:31:19Z) - Improving k-Means Clustering Performance with Disentangled Internal
Representations [0.0]
本稿では,オートエンコーダの学習遅延符号表現の絡み合いを最適化する,シンプルなアプローチを提案する。
提案手法を用いて,MNISTデータセットでは96.2%,Fashion-MNISTデータセットでは85.6%,EMNIST Balancedデータセットでは79.2%,ベースラインモデルでは79.2%であった。
論文 参考訳(メタデータ) (2020-06-05T11:32:34Z) - Clustering with Fast, Automated and Reproducible assessment applied to
longitudinal neural tracking [3.817161834189992]
C-FARは階層的クラスタリングアルゴリズムを同時に評価する新しい手法である。
提案アルゴリズムは,複数の階層的クラスタリング木を入力として,人間のフィードバックに対して戦略的にペアを問合せし,これらの木に推薦された木の中から最適なクラスタリングを出力する。
私たちのフラッグシップアプリケーションは、スパイクソートにおけるクラスタアグリゲーションステップであり、ニューロンに録音中の波形(スパイク)を割り当てるタスクです。
論文 参考訳(メタデータ) (2020-03-19T01:33:00Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。