論文の概要: Detection of Common Subtrees with Identical Label Distribution
- arxiv url: http://arxiv.org/abs/2307.13068v1
- Date: Mon, 24 Jul 2023 18:41:01 GMT
- ステータス: 処理完了
- システム内更新日: 2023-07-26 19:14:36.904945
- Title: Detection of Common Subtrees with Identical Label Distribution
- Title(参考訳): Identical Label 分布を用いた共通部分木の検出
- Authors: Romain Aza\"is and Florian Ingels
- Abstract要約: 本稿では、木データに対する新しいタイプのパターン、つまり同一のラベル分布を持つ共通部分木を扱う。
理論的および数値的な観点から,精巧な探索アルゴリズムを開発し,解析する。
- 参考スコア(独自算出の注目度): 2.1320960069210484
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Frequent pattern mining is a relevant method to analyse structured data, like
sequences, trees or graphs. It consists in identifying characteristic
substructures of a dataset. This paper deals with a new type of patterns for
tree data: common subtrees with identical label distribution. Their detection
is far from obvious since the underlying isomorphism problem is graph
isomorphism complete. An elaborated search algorithm is developed and analysed
from both theoretical and numerical perspectives. Based on this, the
enumeration of patterns is performed through a new lossless compression scheme
for trees, called DAG-RW, whose complexity is investigated as well. The method
shows very good properties, both in terms of computation times and analysis of
real datasets from the literature. Compared to other substructures like
topological subtrees and labelled subtrees for which the isomorphism problem is
linear, the patterns found provide a more parsimonious representation of the
data.
- Abstract(参考訳): 頻繁なパターンマイニングは、シーケンス、木、グラフなどの構造化データを分析するための関連する方法である。
データセットの特徴的なサブ構造を識別する。
本稿では、木データに対する新しいタイプのパターン、つまり同一のラベル分布を持つ共通部分木を扱う。
基本となる同型問題はグラフ同型完全であるため、それらの検出は明らかではない。
理論的および数値的な観点から,精巧な探索アルゴリズムを開発し,解析する。
この結果、パターンの列挙はdag-rwと呼ばれる新しい木に対するロスレス圧縮スキームによって行われ、その複雑さも研究されている。
この手法は計算時間と文献からの実際のデータセットの解析の両方において非常に優れた特性を示す。
位相部分木や、同型問題が線形であるラベル付き部分木のような他の部分構造と比較すると、発見されたパターンはデータのより控えめな表現を提供する。
関連論文リスト
- Dissecting embedding method: learning higher-order structures from data [0.0]
データ学習のための幾何学的深層学習法は、しばしば特徴空間の幾何学に関する仮定のセットを含む。
これらの仮定と、データが離散的で有限であるという仮定は、いくつかの一般化を引き起こし、データとモデルの出力の間違った解釈を生み出す可能性がある。
論文 参考訳(メタデータ) (2024-10-14T08:19:39Z) - Induced Covariance for Causal Discovery in Linear Sparse Structures [55.2480439325792]
因果モデルでは、観測データから変数間の因果関係を解き明かそうとしている。
本稿では,変数が線形に疎結合な関係を示す設定のための新しい因果探索アルゴリズムを提案する。
論文 参考訳(メタデータ) (2024-10-02T04:01:38Z) - Improving embedding of graphs with missing data by soft manifolds [51.425411400683565]
グラフ埋め込みの信頼性は、連続空間の幾何がグラフ構造とどの程度一致しているかに依存する。
我々は、この問題を解決することができる、ソフト多様体と呼ばれる新しい多様体のクラスを導入する。
グラフ埋め込みにソフト多様体を用いることで、複雑なデータセット上のデータ解析における任意のタスクを追求するための連続空間を提供できる。
論文 参考訳(メタデータ) (2023-11-29T12:48:33Z) - GrannGAN: Graph annotation generative adversarial networks [72.66289932625742]
本稿では,高次元分布をモデル化し,グラフスケルトンと整合した複雑な関係特徴構造を持つデータの新しい例を生成することの問題点を考察する。
提案するモデルは,タスクを2つのフェーズに分割することで,各データポイントのグラフ構造に制約されたデータ特徴を生成する問題に対処する。
第一に、与えられたグラフのノードに関連する機能の分布をモデル化し、第二に、ノードのフィーチャに条件付きでエッジ機能を補完する。
論文 参考訳(メタデータ) (2022-12-01T11:49:07Z) - Robust Model Selection of Gaussian Graphical Models [16.933125281564163]
ノイズ崩壊サンプルは、グラフィカルモデル選択において重要な課題を示す。
本稿では,基礎となるグラフを同定されたあいまいさまで確実に復元するアルゴリズムを提案する。
この情報は、電力網、ソーシャルネットワーク、タンパク質とタンパク質の相互作用、神経構造など、現実世界の様々な問題に有用である。
論文 参考訳(メタデータ) (2022-11-10T16:50:50Z) - Amortized Inference for Causal Structure Learning [72.84105256353801]
因果構造を学習することは、通常、スコアまたは独立テストを使用して構造を評価することを伴う探索問題を引き起こす。
本研究では,観測・干渉データから因果構造を予測するため,変分推論モデルを訓練する。
我々のモデルは、実質的な分布シフトの下で頑健な一般化能力を示す。
論文 参考訳(メタデータ) (2022-05-25T17:37:08Z) - Heterogeneous Graph Neural Networks using Self-supervised Reciprocally
Contrastive Learning [102.9138736545956]
不均一グラフニューラルネットワーク(HGNN)は異種グラフのモデリングと解析において非常に一般的な手法である。
我々は,ノード属性とグラフトポロジの各ガイダンスに関する2つの視点を取り入れた,新規で頑健なヘテロジニアスグラフコントラスト学習手法であるHGCLを初めて開発する。
この新しいアプローチでは,属性とトポロジに関連情報を別々にマイニングする手法として,異なるが最も適した属性とトポロジの融合機構を2つの視点に適用する。
論文 参考訳(メタデータ) (2022-04-30T12:57:02Z) - Curvature Graph Generative Adversarial Networks [31.763904668737304]
GAN(Generative Adversarial Network)は,グラフデータの一般化と堅牢な学習に広く利用されている。
既存のGANグラフ表現法は、離散空間におけるランダムウォークやトラバースによって負のサンプルを生成する。
CurvGANは、複数のタスクにまたがる最先端のメソッドよりも一貫して、大幅に優れています。
論文 参考訳(メタデータ) (2022-03-03T10:00:32Z) - Learning to Learn Graph Topologies [27.782971146122218]
ノードデータからグラフ構造へのマッピングを学習する(L2O)。
このモデルは、ノードデータとグラフサンプルのペアを使ってエンドツーエンドでトレーニングされる。
合成データと実世界のデータの両方の実験により、我々のモデルは、特定のトポロジ特性を持つグラフを学習する際の古典的反復アルゴリズムよりも効率的であることが示された。
論文 参考訳(メタデータ) (2021-10-19T08:42:38Z) - Scaling up graph homomorphism for classification via sampling [1.662966122370634]
グラフ準同型密度特徴を準同型数に対するスケーラブルな代替として使用することを検討する。
準同型密度の加法近似を計算する単純なサンプリングアルゴリズムの高性能な実装を提案する。
論文 参考訳(メタデータ) (2021-04-08T20:25:37Z) - Learning the Implicit Semantic Representation on Graph-Structured Data [57.670106959061634]
グラフ畳み込みネットワークにおける既存の表現学習手法は主に、各ノードの近傍を知覚全体として記述することで設計される。
本稿では,グラフの潜在意味パスを学習することで暗黙的な意味を探索する意味グラフ畳み込みネットワーク(sgcn)を提案する。
論文 参考訳(メタデータ) (2021-01-16T16:18:43Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。