論文の概要: A Sampling-based Framework for Hypothesis Testing on Large Attributed Graphs
- arxiv url: http://arxiv.org/abs/2403.13286v1
- Date: Wed, 20 Mar 2024 03:56:22 GMT
- ステータス: 処理完了
- システム内更新日: 2024-03-21 18:07:57.642858
- Title: A Sampling-based Framework for Hypothesis Testing on Large Attributed Graphs
- Title(参考訳): 大規模分散グラフを用いた仮説テストのためのサンプリングベースフレームワーク
- Authors: Yun Wang, Chrysanthi Kosyfaki, Sihem Amer-Yahia, Reynold Cheng,
- Abstract要約: 本研究では,属性グラフにおけるノード,エッジ,パス仮説を定式化する。
既存の仮説に依存しないグラフサンプリング手法に対応可能な,サンプリングベースの仮説テストフレームワークを開発した。
実データを用いた実験では,提案フレームワークが一般的なグラフサンプリング手法を仮説テストに活用できることが示されている。
- 参考スコア(独自算出の注目度): 31.06382090300305
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: Hypothesis testing is a statistical method used to draw conclusions about populations from sample data, typically represented in tables. With the prevalence of graph representations in real-life applications, hypothesis testing in graphs is gaining importance. In this work, we formalize node, edge, and path hypotheses in attributed graphs. We develop a sampling-based hypothesis testing framework, which can accommodate existing hypothesis-agnostic graph sampling methods. To achieve accurate and efficient sampling, we then propose a Path-Hypothesis-Aware SamplEr, PHASE, an m- dimensional random walk that accounts for the paths specified in a hypothesis. We further optimize its time efficiency and propose PHASEopt. Experiments on real datasets demonstrate the ability of our framework to leverage common graph sampling methods for hypothesis testing, and the superiority of hypothesis-aware sampling in terms of accuracy and time efficiency.
- Abstract(参考訳): 仮説テスト(英: hypothesis testing)は、典型的には表に表されるサンプルデータから集団に関する結論を引き出す統計手法である。
現実のアプリケーションにおけるグラフ表現の普及に伴い、グラフにおける仮説テストの重要性が高まっている。
本研究では,属性グラフにおけるノード,エッジ,パス仮説を定式化する。
既存の仮説に依存しないグラフサンプリング手法に対応可能な,サンプリングベースの仮説テストフレームワークを開発した。
正確かつ効率的なサンプリングを実現するため,仮説で指定された経路を考慮に入れたm次元ランダムウォークである Path-Hypothesis-Aware SamplEr PHASE を提案する。
さらに時間効率を最適化し,PHASEoptを提案する。
実データを用いた実験では,仮説探索のための共通グラフサンプリング手法の活用と,精度と時間効率の点で仮説認識サンプリングの優位性が示された。
関連論文リスト
- Statistical Test for Generated Hypotheses by Diffusion Models [21.378672594642616]
本稿では, 拡散モデルを用いた医用診断タスクについて検討し, その信頼性を定量的に評価するための統計的検査を提案する。
提案手法を用いて, 医用画像診断結果の統計的信頼性をp値の形で定量化し, 誤差率の制御による意思決定を可能にする。
論文 参考訳(メタデータ) (2024-02-19T02:32:45Z) - Source-Free Unsupervised Domain Adaptation with Hypothesis Consolidation
of Prediction Rationale [53.152460508207184]
Source-Free Unsupervised Domain Adaptation (SFUDA)は、モデルがターゲットのドメインラベルやソースドメインデータにアクセスせずに新しいドメインに適応する必要がある、という課題である。
本稿では,各サンプルについて複数の予測仮説を考察し,各仮説の背景にある理論的根拠について考察する。
最適性能を達成するために,モデル事前適応,仮説統合,半教師付き学習という3段階の適応プロセスを提案する。
論文 参考訳(メタデータ) (2024-02-02T05:53:22Z) - Sequential Predictive Two-Sample and Independence Testing [114.4130718687858]
逐次的非パラメトリック2サンプルテストと独立テストの問題点について検討する。
私たちは賭けによる(非パラメトリックな)テストの原則に基づいています。
論文 参考訳(メタデータ) (2023-04-29T01:30:33Z) - Private Sequential Hypothesis Testing for Statisticians: Privacy, Error
Rates, and Sample Size [24.149533870085175]
我々は、Renyi差分プライバシーとして知られる、差分プライバシーのわずかな変種の下で、シーケンシャル仮説テスト問題を研究する。
我々は,Wald's Sequential Probability Ratio Test (SPRT)に基づく新たなプライベートアルゴリズムを提案する。
論文 参考訳(メタデータ) (2022-04-10T04:15:50Z) - Nonparametric Conditional Local Independence Testing [69.31200003384122]
条件付き局所独立は、連続的な時間プロセス間の独立関係である。
条件付き地域独立の非パラメトリックテストは行われていない。
二重機械学習に基づく非パラメトリックテストを提案する。
論文 参考訳(メタデータ) (2022-03-25T10:31:02Z) - A Data-Driven Approach to Robust Hypothesis Testing Using Sinkhorn
Uncertainty Sets [12.061662346636645]
シンクホーン距離を用いた試料から, 実験分布を中心とした分布不確実性集合に対する最悪の検出法を求める。
ワッサーシュタインのロバスト試験と比較すると、対応する最も好ましい分布はトレーニングサンプルを超えてサポートされ、より柔軟な検出器を提供する。
論文 参考訳(メタデータ) (2022-02-09T03:26:15Z) - Near-optimal inference in adaptive linear regression [60.08422051718195]
最小二乗法のような単純な方法でさえ、データが適応的に収集されるときの非正規な振る舞いを示すことができる。
我々は,これらの分布異常を少なくとも2乗推定で補正するオンラインデバイアス推定器のファミリーを提案する。
我々は,マルチアームバンディット,自己回帰時系列推定,探索による能動的学習などの応用を通して,我々の理論の有用性を実証する。
論文 参考訳(メタデータ) (2021-07-05T21:05:11Z) - Hypothesis Testing for Equality of Latent Positions in Random Graphs [0.2741266294612775]
2つの頂点 $i$ と $j$th が、おそらくスケーリングまで、同じ潜在位置を持つという仮説テストの問題を考える。
グラフの隣接性または正規化ラプラシアンスペクトル埋め込みのいずれかのi$th行とj$th行の間の経験的マハラノビス距離に基づくいくつかのテスト統計について提案する。
これらのテスト統計を用いて、標準ブロックモデルとその次数補正変種を選択する際のモデル選択問題に対処する。
論文 参考訳(メタデータ) (2021-05-23T01:27:23Z) - Exploring Lexical Irregularities in Hypothesis-Only Models of Natural
Language Inference [5.283529004179579]
自然言語推論(NLI)またはテキスト関連認識(RTE)は、文のペア間の関係を予測するタスクです。
包含を理解するモデルは前提と仮説の両方をエンコードするべきである。
Poliakらによる実験。
仮説でのみ観察されたパターンに対するこれらのモデルの強い好みを明らかにした。
論文 参考訳(メタデータ) (2021-01-19T01:08:06Z) - Balance-Subsampled Stable Prediction [55.13512328954456]
本稿では, 分数分解設計理論に基づく新しいバランスサブサンプル安定予測法を提案する。
設計理論解析により,提案手法は分布シフトによって誘導される予測器間の共起効果を低減できることを示した。
合成および実世界の両方のデータセットに関する数値実験により、BSSPアルゴリズムは未知のテストデータ間で安定した予測を行うためのベースライン法を著しく上回っていることが示された。
論文 参考訳(メタデータ) (2020-06-08T07:01:38Z) - Understanding Negative Sampling in Graph Representation Learning [87.35038268508414]
最適化目標と結果のばらつきを決定するためには, 正のサンプリングと同様に負のサンプリングが重要であることを示す。
我々は,自己コントラスト近似による正の分布を近似し,メトロポリス・ハスティングスによる負のサンプリングを高速化するメトロポリス・ハスティングス(MCNS)を提案する。
提案手法は,リンク予測,ノード分類,パーソナライズドレコメンデーションを含む,下流グラフ学習タスクをカバーする5つのデータセットに対して評価する。
論文 参考訳(メタデータ) (2020-05-20T06:25:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。