論文の概要: Graphon Estimation in bipartite graphs with observable edge labels and
unobservable node labels
- arxiv url: http://arxiv.org/abs/2304.03590v2
- Date: Mon, 4 Sep 2023 12:15:32 GMT
- ステータス: 処理完了
- システム内更新日: 2023-09-07 05:55:15.056633
- Title: Graphon Estimation in bipartite graphs with observable edge labels and
unobservable node labels
- Title(参考訳): 観測可能なエッジラベルと観測不可能なノードラベルを持つ二部グラフのグラフ推定
- Authors: Etienne Donier-Meroz, Arnak S. Dalalyan, Francis Kramarz, Philippe
Chon\'e, Xavier D'Haultfoeuille
- Abstract要約: 多くの実世界のデータセットは、異なる性質の2つの実体間の相互作用に対応する行列の形で表現することができる。
本稿では、上記の相互作用が各エンティティを記述する観測不能な潜在変数によって決定されると仮定する。
我々の目的は、観測不可能な変数からデータ行列の条件付き期待値を推定することである。
- 参考スコア(独自算出の注目度): 3.59986669039879
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many real-world data sets can be presented in the form of a matrix whose
entries correspond to the interaction between two entities of different natures
(number of times a web user visits a web page, a student's grade in a subject,
a patient's rating of a doctor, etc.). We assume in this paper that the
mentioned interaction is determined by unobservable latent variables describing
each entity. Our objective is to estimate the conditional expectation of the
data matrix given the unobservable variables. This is presented as a problem of
estimation of a bivariate function referred to as graphon. We study the cases
of piecewise constant and H\"older-continuous graphons. We establish finite
sample risk bounds for the least squares estimator and the exponentially
weighted aggregate. These bounds highlight the dependence of the estimation
error on the size of the data set, the maximum intensity of the interactions,
and the level of noise. As the analyzed least-squares estimator is intractable,
we propose an adaptation of Lloyd's alternating minimization algorithm to
compute an approximation of the least-squares estimator. Finally, we present
numerical experiments in order to illustrate the empirical performance of the
graphon estimator on synthetic data sets.
- Abstract(参考訳): 多くの現実世界のデータセットは、異なる性質の2つのエンティティ(webユーザがwebページを訪問する回数、対象の学生の成績、患者の医師の評価など)間の相互作用に対応する行列形式で提示することができる。
本稿では、上記の相互作用が各エンティティを記述する観測不能な潜在変数によって決定されると仮定する。
我々の目的は、観測不能変数からデータ行列の条件付き期待値を推定することである。
これはgraphonと呼ばれる双変量関数の推定問題として提示される。
区分定数およびh\"older-continuous graphonsの場合について検討する。
最小二乗推定値と指数重み付き集合に対する有限なサンプルリスク境界を確立する。
これらの境界は、データセットのサイズ、相互作用の最大強度、ノイズレベルに対する推定誤差の依存性を強調する。
解析された最小二乗推定器は難解であるため、最小二乗推定器の近似を計算するためにロイドの交代最小化アルゴリズムの適応を提案する。
最後に,合成データセット上でのグラフトン推定器の実験的性能を示すための数値実験を行った。
関連論文リスト
- Graph-based Complexity for Causal Effect by Empirical Plug-in [56.14597641617531]
本稿では、因果効果クエリに対する経験的プラグイン推定の計算複雑性に焦点を当てる。
計算は、推定値のハイパーグラフに依存するため、データサイズにおいて、潜在的に線形な時間で効率的に行うことができることを示す。
論文 参考訳(メタデータ) (2024-11-15T07:42:01Z) - Node Regression on Latent Position Random Graphs via Local Averaging [10.962094053749093]
ノード回帰に対する各種推定器の性能について検討する。
もう一つの選択肢は、まず潜伏位置の間の真の距離を推定し、次にこれらの推定距離を古典的なナダラヤ・ワトソン推定器に注入することである。
本手法は,グラフ近傍が大きすぎる場合や小きすぎる場合であっても,特定の場合において標準の非パラメトリックレートを達成することができることを示す。
論文 参考訳(メタデータ) (2024-10-29T12:17:06Z) - Entry-Specific Matrix Estimation under Arbitrary Sampling Patterns through the Lens of Network Flows [9.631640936820126]
行列補完は、観察されたエントリのスパースセットに基づいて、低ランク行列の欠落値を予測するタスクに取り組む。
観測パターンによって誘導される二部グラフのネットワークフローに基づく行列補完アルゴリズムを提案する。
この結果から,行列内の特定のエントリの回復に対する最小二乗誤差は,グラフ内の対応するエッジの有効抵抗に比例することを示した。
論文 参考訳(メタデータ) (2024-09-06T02:01:03Z) - Statistical Efficiency of Score Matching: The View from Isoperimetry [96.65637602827942]
本研究では, スコアマッチングの統計的効率と推定される分布の等尺性との間に, 密接な関係を示す。
これらの結果はサンプル状態と有限状態の両方で定式化する。
論文 参考訳(メタデータ) (2022-10-03T06:09:01Z) - Low-Rank Covariance Completion for Graph Quilting with Applications to Functional Connectivity [8.500141848121782]
多くのカルシウムイメージングデータセットでは、ニューロンの全個体数は同時に記録されるのではなく、部分的に重なるブロックに記録される。
本稿では、まず、低ランクココンプリートを用いた原子核構造行列を暗示するグラフ量子化法について述べる。
カルシウムイメージングデータから接続性を推定するためのこれらの手法の有効性を示す。
論文 参考訳(メタデータ) (2022-09-17T08:03:46Z) - Collaborative likelihood-ratio estimation over graphs [55.98760097296213]
グラフに基づく相対的制約のない最小二乗重要度フィッティング(GRULSIF)
我々はこの考え方を、グラフベースの相対的非制約最小二乗重要度フィッティング(GRULSIF)と呼ばれる具体的な非パラメトリック手法で開発する。
我々は、ノード当たりの観測回数、グラフのサイズ、およびグラフ構造がタスク間の類似性をどの程度正確にエンコードしているかといった変数が果たす役割を強調する、協調的なアプローチの収束率を導出する。
論文 参考訳(メタデータ) (2022-05-28T15:37:03Z) - Graph-in-Graph (GiG): Learning interpretable latent graphs in
non-Euclidean domain for biological and healthcare applications [52.65389473899139]
グラフは、医療領域において、非ユークリッドな非ユークリッドデータをユビキタスに表現し、分析するための強力なツールである。
近年の研究では、入力データサンプル間の関係を考慮すると、下流タスクに正の正の正則化効果があることが示されている。
タンパク質分類と脳イメージングのためのニューラルネットワークアーキテクチャであるGraph-in-Graph(GiG)を提案する。
論文 参考訳(メタデータ) (2022-04-01T10:01:37Z) - Rank-one matrix estimation with groupwise heteroskedasticity [5.202966939338455]
本研究では,異なるノイズレベル下で行列の異なるブロックが観測されるガウス観測からランク1行列を推定する問題について検討する。
行列と潜伏変数の両方を推定する際、最小平均二乗誤差の正確な公式を証明した。
我々は、近似メッセージパッシングアルゴリズムと勾配降下アルゴリズムを導出し、これらのアルゴリズムが特定の状況における情報理論的限界を達成することを実証的に示す。
論文 参考訳(メタデータ) (2021-06-22T17:48:36Z) - Interpolation and Learning with Scale Dependent Kernels [91.41836461193488]
非パラメトリックリッジレス最小二乗の学習特性について検討する。
スケール依存カーネルで定義される推定器の一般的な場合を考える。
論文 参考訳(メタデータ) (2020-06-17T16:43:37Z) - Asymptotic Analysis of an Ensemble of Randomly Projected Linear
Discriminants [94.46276668068327]
[1]では、ランダムに投影された線形判別式のアンサンブルを用いてデータセットを分類する。
我々は,計算コストのかかるクロスバリデーション推定器の代替として,誤分類確率の一貫した推定器を開発する。
また、実データと合成データの両方で投影次元を調整するための推定器の使用を実証する。
論文 参考訳(メタデータ) (2020-04-17T12:47:04Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。