論文の概要: Sharp threshold for alignment of graph databases with Gaussian weights
- arxiv url: http://arxiv.org/abs/2010.16295v2
- Date: Tue, 18 May 2021 14:46:09 GMT
- Title: Sharp threshold for alignment of graph databases with Gaussian weights
- Title(参考訳): ガウス重み付きグラフデータベースのアライメントのためのシャープしきい値
- Authors: Luca Ganassali
- Abstract要約: 重み付きグラフ(行列)データベースアライメントにおける再構成の基本的限界について検討する。
- 参考スコア(独自算出の注目度): 1.6752182911522522
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We study the fundamental limits for reconstruction in weighted graph (or
matrix) database alignment. We consider a model of two graphs where $\pi^*$ is
a planted uniform permutation and all pairs of edge weights $(A_{i,j},
B_{\pi^*(i),\pi^*(j)})_{1 \leq i<j \leq n}$ are i.i.d. pairs of Gaussian
variables with zero mean, unit variance and correlation parameter $\rho \in
[0,1]$. We prove that there is a sharp threshold for exact recovery of $\pi^*$:
if $n \rho^2 \geq (4+\epsilon) \log n + \omega(1)$ for some $\epsilon>0$, there
is an estimator $\hat{\pi}$ -- namely the MAP estimator -- based on the
observation of databases $A,B$ that achieves exact reconstruction with high
probability. Conversely, if $n \rho^2 \leq 4 \log n - \log \log n - \omega(1)$,
then any estimator $\hat{\pi}$ verifies $\hat{\pi}=\pi$ with probability
This result shows that the information-theoretic threshold for exact recovery
is the same as the one obtained for detection in a recent work by Wu et al.
(2020): in other words, for Gaussian weighted graph alignment, the problem of
reconstruction is not more difficult than that of detection. Though the
reconstruction task was already well understood for vector-shaped database
alignment (that is taking signal of the form $(u_i, v_{\pi^*(i)})_{1 \leq i\leq
n}$ where $(u_i, v_{\pi^*(i)})$ are i.i.d. pairs in $\mathbb{R}^{d_u} \times
\mathbb{R}^{d_v}$), its formulation for graph (or matrix) databases brings a
drastically different problem for which the hard phase is conjectured to be
The proofs build upon the analysis of the MAP estimator and the second moment
method, together with the study of the correlation structure of energies of
- Abstract(参考訳): 重み付きグラフ(行列)データベースアライメントにおける再構成の基本的限界について検討する。
2つのグラフのモデルを考えると、$\pi^*$は植込みされた一様置換であり、すべてのエッジウェイトが$(A_{i,j}, B_{\pi^*である。
(j)})_{1 \leq i<j \leq n}$ は、ゼロ平均、単位分散、相関パラメータ $\rho \in [0,1]$ を持つガウス変数の対である。
もし$n \rho^2 \geq (4+\epsilon) \log n + \omega(1)$ for some $\epsilon>0$なら、正確な再構成を達成するデータベース$a,b$の観測に基づいて、$\hat{\pi}$ --すなわちmap estimator -- が存在することを証明する。
逆に、$n \rho^2 \leq 4 \log n - \log \log n - \omega(1)$ ならば、任意の推定器 $\hat{\pi}$ は確率 $o(1)$ で $\hat{\pi}=\pi$ を検証する。
この結果から, 精度回復のための情報理論しきい値が, Wuらによる最近の研究(2020年)で得られたものと同一であること, 言い換えればガウス重み付きグラフアライメントでは, 再構築の問題は検出のそれよりも難しくないことがわかった。
復元作業はベクトル型データベースアライメント(これは$(u_i, v_{\pi^*)の信号を取る)に対して既によく理解されていた。
(i)})_{1 \leq i\leq n}$ ここで$(u_i, v_{\pi^*)
(i)})$ は$\mathbb{r}^{d_u} \times \mathbb{r}^{d_v}$ の i.i.d.ペアであり、グラフ(または行列)データベースの定式化は、ハードフェーズが広く予想されるような、劇的に異なる問題をもたらす。
