論文の概要: HNet: Graphical Hypergeometric Networks
- arxiv url: http://arxiv.org/abs/2005.04679v1
- Date: Sun, 10 May 2020 14:33:52 GMT
- ステータス: 処理完了
- システム内更新日: 2022-12-05 01:28:49.127511
- Title: HNet: Graphical Hypergeometric Networks
- Title(参考訳): hnet:グラフィカル・ハイパージオメトリック・ネットワーク
- Authors: Erdogan Taskesen
- Abstract要約: ハイパージオメトリ・ネットワーク(HNet)は、統計的推論を用いて変数間の関連性をテストする手法である。
HNetは生の非構造化データセットを処理し、ノード間の(部分的に)方向付けまたは非方向付けのエッジで構成されるネットワークを出力する。
ノードリンクの検出において,HNetは高い精度と性能を示した。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Motivation: Real-world data often contain measurements with both continuous
and discrete values. Despite the availability of many libraries, data sets with
mixed data types require intensive pre-processing steps, and it remains a
challenge to describe the relationships between variables. The data
understanding phase is an important step in the data mining process, however,
without making any assumptions on the data, the search space is
super-exponential in the number of variables. Methods: We propose graphical
hypergeometric networks (HNet), a method to test associations across variables
for significance using statistical inference. The aim is to determine a network
using only the significant associations in order to shed light on the complex
relationships across variables. HNet processes raw unstructured data sets and
outputs a network that consists of (partially) directed or undirected edges
between the nodes (i.e., variables). To evaluate the accuracy of HNet, we used
well known data sets and in addition generated data sets with known ground
truth. The performance of HNet is compared to Bayesian structure learning.
Results: We demonstrate that HNet showed high accuracy and performance in the
detection of node links. In the case of the Alarm data set we can demonstrate
on average an MCC score of 0.33 + 0.0002 (P<1x10-6), whereas Bayesian structure
learning resulted in an average MCC score of 0.52 + 0.006 (P<1x10-11), and
randomly assigning edges resulted in a MCC score of 0.004 + 0.0003 (P=0.49).
Conclusions: HNet can process raw unstructured data sets, allows analysis of
mixed data types, it easily scales up in number of variables, and allows
detailed examination of the detected associations. Availability:
https://erdogant.github.io/hnet/
- Abstract(参考訳): モチベーション: 実世界のデータは、しばしば連続値と離散値の両方で測定される。
多くのライブラリが利用可能であるにもかかわらず、混合データ型を持つデータセットは集中的な前処理ステップを必要とし、変数間の関係を記述することは依然として課題である。
データ理解フェーズは、データマイニングプロセスにおいて重要なステップであるが、データに仮定することなく、探索空間は変数数において超指数的である。
方法:我々は,変数間の関連を統計的推論を用いて検証する手法であるgraphical hypergeometric network (hnet)を提案する。
目的は、変数間の複雑な関係を明らかにするために、重要な関連のみを使用してネットワークを決定することである。
hnetは生の非構造化データセットを処理し、ノード間(すなわち変数)の(部分的に)有向または無向のエッジからなるネットワークを出力する。
HNetの精度を評価するために、よく知られたデータセットと、既知の基底真理を持つ生成されたデータセットを使用した。
HNetの性能はベイズ構造学習と比較される。
結果:HNetはノードリンクの検出において高い精度と性能を示した。
Alarmデータセットの場合、平均MCCスコアは 0.33 + 0.0002 (P<1x10-6)、ベイジアン構造学習は平均MCCスコアは 0.52 + 0.006 (P<1x10-11)、ランダムにエッジを割り当てると0.004 + 0.0003 (P=0.49) となる。
結論: HNetは生の非構造化データセットを処理でき、混合データ型を解析でき、変数の数を簡単にスケールアップでき、検出された関連を詳細に調べることができる。
利用可能: https://erdogant.github.io/hnet/
関連論文リスト
- Distributed Learning over Networks with Graph-Attention-Based
Personalization [49.90052709285814]
分散ディープラーニングのためのグラフベースパーソナライズアルゴリズム(GATTA)を提案する。
特に、各エージェントのパーソナライズされたモデルは、グローバルな部分とノード固有の部分で構成される。
グラフ内の各エージェントを1つのノードとして扱うことにより、ノード固有のパラメータを特徴として扱うことにより、グラフアテンション機構の利点を継承することができる。
論文 参考訳(メタデータ) (2023-05-22T13:48:30Z) - Personalized Decentralized Multi-Task Learning Over Dynamic
Communication Graphs [59.96266198512243]
本稿では,正と負の相関関係を持つタスクに対する分散・フェデレーション学習アルゴリズムを提案する。
本アルゴリズムでは,タスク間の相関関係を自動的に計算し,コミュニケーショングラフを動的に調整して相互に有益なタスクを接続し,互いに悪影響を及ぼす可能性のあるタスクを分離する。
合成ガウスデータセットと大規模セレブ属性(CelebA)データセットについて実験を行った。
論文 参考訳(メタデータ) (2022-12-21T18:58:24Z) - Randomized Quantization: A Generic Augmentation for Data Agnostic
Self-supervised Learning [89.00646449740606]
自己監督型表現学習は、データの一部を保持し、残りの部分から予測するようにネットワークに指示するパラダイムに従っている。
データ拡張は、情報ギャップを作るためのコアにあります。
本稿では,精度の冗長性を利用した汎用データ拡張のためのチャネル次元について検討する。
論文 参考訳(メタデータ) (2022-12-19T18:59:57Z) - Hybrid Bayesian network discovery with latent variables by scoring
multiple interventions [5.994412766684843]
離散データから構造学習を行うためのハイブリッドmFGS-BSアルゴリズムを提案する。
このアルゴリズムは潜伏変数の存在下で因果不整合を仮定し、部分アンセストラルグラフ(PAG)を生成する。
実験の結果,mFGS-BSは最先端技術と比較して構造学習精度が向上し,計算効率が向上した。
論文 参考訳(メタデータ) (2021-12-20T14:54:41Z) - Active Learning of Neural Collision Handler for Complex 3D Mesh
Deformations [68.0524382279567]
3次元変形メッシュにおける衝突の検出と処理を行う頑健な学習アルゴリズムを提案する。
提案手法は教師あり学習法より優れ, 精度は93.8-98.1%である。
論文 参考訳(メタデータ) (2021-10-08T04:08:31Z) - Comprehensive Graph-conditional Similarity Preserving Network for
Unsupervised Cross-modal Hashing [97.44152794234405]
教師なしクロスモーダルハッシュ(UCMH)は近年ホットトピックとなっている。
本稿では,dgcpn(deep graph-neighbor coherence preservation network)を考案する。
DGCPNは3種類のデータ類似性を利用して、損失を保存する包括的な類似性を管理する。
論文 参考訳(メタデータ) (2020-12-25T07:40:59Z) - Solving Mixed Integer Programs Using Neural Networks [57.683491412480635]
本稿では,mipソルバの2つのキーサブタスクに学習を適用し,高品質なジョイント変数割当を生成し,その割当と最適課題との客観的値の差を限定する。
提案手法は,ニューラルネットワークに基づく2つのコンポーネントであるニューラルダイバーディングとニューラルブランチを構築し,SCIPなどのベースMIPソルバで使用する。
2つのGoogle生産データセットとMIPLIBを含む6つの現実世界データセットに対するアプローチを評価し、それぞれに別々のニューラルネットワークをトレーニングする。
論文 参考訳(メタデータ) (2020-12-23T09:33:11Z) - Online Missing Value Imputation and Change Point Detection with the
Gaussian Copula [21.26330349034669]
実世界のデータサイエンスにとって、値計算の欠如は不可欠である。
ガウスコプラを用いた混合データに対するオンライン計算アルゴリズムを開発した。
論文 参考訳(メタデータ) (2020-09-25T16:27:47Z) - A Bayesian Hierarchical Score for Structure Learning from Related Data
Sets [0.7240563090941907]
ベイジアン階層ディリクレ(Bayesian Hierarchical Dirichlet, BHD)と呼ばれる新しいベイジアンディリクレスコアを提案する。
BHDは階層的なモデルに基づいており、データセットにまたがって情報をプールし、ネットワーク構造を包含する単一の学習を行う。
BHDは, 構造ハンミング距離によって測定された復元精度において, ベイズディリクレ等価値(BDeu)スコアよりも優れていた。
論文 参考訳(メタデータ) (2020-08-04T16:41:05Z) - Privacy-Preserving Distributed Learning in the Analog Domain [23.67685616088422]
計算サーバからデータをプライベートに保ちながら、データよりも分散学習の問題を考察する。
本稿では,アナログ領域にデータが存在する場合の問題を解くための新しいアルゴリズムを提案する。
本研究では,浮動小数点数を用いてデータを表す場合の計算処理に,提案フレームワークをどのように適用できるかを示す。
論文 参考訳(メタデータ) (2020-07-17T07:56:39Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。