論文の概要: Decomposable Families of Itemsets
- arxiv url: http://arxiv.org/abs/2006.09533v1
- Date: Tue, 16 Jun 2020 21:52:28 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-20 19:46:39.005158
- Title: Decomposable Families of Itemsets
- Title(参考訳): アイテムセットの分解可能なファミリー
- Authors: Nikolaj Tatti, Hannes Heikinheimo
- Abstract要約: 本稿では,より大規模な項目集合から,パターンの小型かつ高品質なサブセットを選択するという問題に対するアプローチを提案する。
このようなアイテムセットファミリーは、元のアイテムセットのコレクションが導出されたデータに対する確率モデルを定義する。
我々は、分解可能なアイテムセットファミリを構築するための効率的なアルゴリズムを提供し、周波数バウンドクエリによるアプリケーションの例を示す。
- 参考スコア(独自算出の注目度): 0.949290364986276
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: The problem of selecting a small, yet high quality subset of patterns from a
larger collection of itemsets has recently attracted lot of research. Here we
discuss an approach to this problem using the notion of decomposable families
of itemsets. Such itemset families define a probabilistic model for the data
from which the original collection of itemsets has been derived from.
Furthermore, they induce a special tree structure, called a junction tree,
familiar from the theory of Markov Random Fields. The method has several
advantages. The junction trees provide an intuitive representation of the
mining results. From the computational point of view, the model provides
leverage for problems that could be intractable using the entire collection of
itemsets. We provide an efficient algorithm to build decomposable itemset
families, and give an application example with frequency bound querying using
the model. Empirical results show that our algorithm yields high quality
results.
- Abstract(参考訳): アイテムセットの大きなコレクションから、小さなが高品質なパターンのサブセットを選択するという問題は、最近多くの研究を引き寄せている。
ここでは、アイテムセットの分解可能なファミリーの概念を用いて、この問題に対するアプローチについて議論する。
このようなアイテムセットファミリーは、元のアイテムセットのコレクションが派生したデータに対する確率モデルを定義する。
さらにそれらは、マルコフ確率場の理論に精通したジャンクション木と呼ばれる特別な木構造を誘導する。
この方法にはいくつかの利点がある。
ジャンクションツリーは、採掘結果の直感的な表現を提供する。
計算の観点からは、このモデルはアイテムセットのコレクション全体を使用して難解な問題に対するレバレッジを提供する。
我々は,分解可能なアイテムセットファミリを構築するための効率的なアルゴリズムを提供し,そのモデルを用いた頻度境界クエリを用いたアプリケーション例を示す。
実験結果から,本アルゴリズムは高品質な結果が得られることが示された。
関連論文リスト
- Utilising Explainable Techniques for Quality Prediction in a Complex Textiles Manufacturing Use Case [0.0]
本稿では, 複合織物製造データセットにおける製品故障事例を説明可能な手法を用いて分類する手法を開発した。
精度と説明可能性のトレードオフを調べたところ,3種類の木に基づく分類アルゴリズムが評価された。
論文 参考訳(メタデータ) (2024-07-26T06:50:17Z) - Tree Learning: Optimal Algorithms and Sample Complexity [10.638365461509]
任意の分布から抽出したラベル付きサンプルから,データの階層木表現を学習する問題について検討する。
本稿では,この問題に対する最適なサンプル境界を,学習やオンライン学習など,いくつかの学習環境において提示する。
論文 参考訳(メタデータ) (2023-02-09T08:35:17Z) - Frequent Itemset-driven Search for Finding Minimum Node Separators in
Complex Networks [61.2383572324176]
本稿では,データマイニングにおける頻繁なアイテムセットマイニングの概念をよく知られたメメティック検索フレームワークに統合する,頻繁なアイテムセット駆動探索手法を提案する。
頻繁なアイテムセット組換え演算子を反復的に使用して、高品質なソリューションで頻繁に発生するアイテムセットに基づいた有望な子孫ソリューションを生成する。
特に、29個の新しい上界を発見し、以前の18個の最もよく知られた境界と一致する。
論文 参考訳(メタデータ) (2022-01-18T11:16:40Z) - Efficient Bayesian network structure learning via local Markov boundary
search [17.1764265047364]
本研究では,特定の分布仮定を伴わない観測データから,非循環型図形学習の複雑さを解析する。
局所マルコフ境界探索法を用いて、基礎となるグラフィカルモデルに祖先集合を構築する。
我々のアプローチは一般に、離散的あるいは連続的な分布を分布の仮定なしで処理し、データから有向グラフモデルの構造を効率的に学習するのに必要となる最小限の仮定に光を当てる。
論文 参考訳(メタデータ) (2021-10-12T15:33:59Z) - Probabilistic DAG Search [29.47649645431227]
探索空間の潜伏構造を利用して探索木間で情報を共有するための確率的フレームワークを開発する。
我々は、Tic-Tac-Toeの既存の非確率的代替品と特徴選択アプリケーションとを比較検討するアルゴリズムを実証的に見出した。
論文 参考訳(メタデータ) (2021-06-16T11:35:19Z) - Sample Complexity of Tree Search Configuration: Cutting Planes and
Beyond [98.92725321081994]
最先端の解法は、根底にある木探索アルゴリズムを高速化するために、無数の切削平面技術を統合している。
本研究は,インスタンス分布に合わせて高い性能のカット選択ポリシーを学習するための最初の保証を証明した。
論文 参考訳(メタデータ) (2021-06-08T00:57:59Z) - Exact and Approximate Hierarchical Clustering Using A* [51.187990314731344]
クラスタリングのA*探索に基づく新しいアプローチを紹介します。
A*と新しいエンフォレリスデータ構造を組み合わせることで、禁止的に大きな検索空間を克服します。
実験により,本手法は粒子物理利用事例や他のクラスタリングベンチマークにおいて,ベースラインよりもかなり高品質な結果が得られることを示した。
論文 参考訳(メタデータ) (2021-04-14T18:15:27Z) - Adversarial Examples for $k$-Nearest Neighbor Classifiers Based on
Higher-Order Voronoi Diagrams [69.4411417775822]
逆例は機械学習モデルにおいて広く研究されている現象である。
そこで本研究では,$k$-nearest 近傍分類の逆ロバスト性を評価するアルゴリズムを提案する。
論文 参考訳(メタデータ) (2020-11-19T08:49:10Z) - MurTree: Optimal Classification Trees via Dynamic Programming and Search [61.817059565926336]
動的プログラミングと探索に基づいて最適な分類木を学習するための新しいアルゴリズムを提案する。
当社のアプローチでは,最先端技術が必要とする時間のごく一部しか使用せず,数万のインスタンスでデータセットを処理することが可能です。
論文 参考訳(メタデータ) (2020-07-24T17:06:55Z) - Robust Estimation of Tree Structured Ising Models [20.224160348675422]
我々は、異なる確率変数の符号が、おそらく不等で未知の確率で独立に反転するときに、イジングモデルを学習するタスクを考える。
しかし, この不同一性は, 葉ノードが近傍と位置を交換して形成する小さな同値類に限られる。
論文 参考訳(メタデータ) (2020-06-10T01:32:45Z) - Optimal Clustering from Noisy Binary Feedback [75.17453757892152]
本稿では,二元的ユーザフィードバックから一組のアイテムをクラスタリングする問題について検討する。
最小クラスタ回復誤差率のアルゴリズムを考案する。
適応選択のために,情報理論的誤差下界の導出にインスパイアされたアルゴリズムを開発する。
論文 参考訳(メタデータ) (2019-10-14T09:18:26Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。