論文の概要: Matrix factorization and prediction for high dimensional co-occurrence count data via shared parameter alternating zero inflated Gamma model
- arxiv url: http://arxiv.org/abs/2501.00628v1
- Date: Tue, 31 Dec 2024 19:59:32 GMT
- ステータス: 翻訳完了
- システム内更新日: 2025-01-05 17:16:39.344368
- Title: Matrix factorization and prediction for high dimensional co-occurrence count data via shared parameter alternating zero inflated Gamma model
- Title(参考訳): 共有パラメータ交互ゼロインフレードガンマモデルによる高次元共起数データの行列分解と予測
- Authors: Taejoon Kim, Haiyan Wang,
- Abstract要約: 電子商取引における共起数とアイテムとイテムのペアは、高次元データを生成する。
本稿では,アイテムやユーザを未知の高密度ベクトルで表現できると仮定する。
このモデルは、ゼロ膨らんだガンマ確率変数から生じる共起数を扱い、未知ベクトル間のコサイン類似性を利用してアイテム・イテム関係を要約する。
- 参考スコア(独自算出の注目度): 9.104044534664672
- License:
- Abstract: High-dimensional sparse matrix data frequently arise in various applications. A notable example is the weighted word-word co-occurrence count data, which summarizes the weighted frequency of word pairs appearing within the same context window. This type of data typically contains highly skewed non-negative values with an abundance of zeros. Another example is the co-occurrence of item-item or user-item pairs in e-commerce, which also generates high-dimensional data. The objective is to utilize this data to predict the relevance between items or users. In this paper, we assume that items or users can be represented by unknown dense vectors. The model treats the co-occurrence counts as arising from zero-inflated Gamma random variables and employs cosine similarity between the unknown vectors to summarize item-item relevance. The unknown values are estimated using the shared parameter alternating zero-inflated Gamma regression models (SA-ZIG). Both canonical link and log link models are considered. Two parameter updating schemes are proposed, along with an algorithm to estimate the unknown parameters. Convergence analysis is presented analytically. Numerical studies demonstrate that the SA-ZIG using Fisher scoring without learning rate adjustment may fail to fi nd the maximum likelihood estimate. However, the SA-ZIG with learning rate adjustment performs satisfactorily in our simulation studies.
- Abstract(参考訳): 高次元スパース行列データは、様々な用途で頻繁に発生する。
注目すべき例として、同じコンテキストウィンドウに現れる単語対の重み付き頻度を要約した重み付き単語-単語共起数データがある。
この種のデータは通常、ゼロの量が豊富である非常に歪んだ非負の値を含む。
もう一つの例は、eコマースにおけるアイテム・イテムとユーザ・イテムのペアの共起であり、これは高次元データも生成する。
目的は、このデータを使用してアイテムまたはユーザ間の関連性を予測することである。
本稿では,アイテムやユーザを未知の高密度ベクトルで表現できると仮定する。
このモデルは、ゼロ膨らんだガンマ確率変数から生じる共起数を扱い、未知ベクトル間のコサイン類似性を利用してアイテム・イテム関係を要約する。
ゼロ膨らんだガンマ回帰モデル (SA-ZIG) を交互に用いて未知の値を推定する。
標準リンクモデルとログリンクモデルの両方が検討されている。
未知パラメータを推定するアルゴリズムとともに、2つのパラメータ更新スキームを提案する。
収束解析は解析的に行われる。
数値解析により,フィッシャースコアを用いたSA-ZIGは,学習率調整を伴わず,最大推定値のフィドに失敗する可能性が示唆された。
しかし, 学習率調整によるSA-ZIGは, シミュレーション研究において良好に機能する。
関連論文リスト
- Global dense vector representations for words or items using shared parameter alternating Tweedie model [9.104044534664672]
本稿では,オンラインショッピングプラットフォームにおけるユーザ・イテムやアイテム・イテムといった実践分野から得られた共起数データを分析するモデルを提案する。
データには、レコメンデーターシステムを開発するための重要な情報や、数字以外の情報源からの項目や単語の関連性を研究するための重要な情報が含まれている。
論文 参考訳(メタデータ) (2024-12-31T19:49:32Z) - Semiparametric conformal prediction [79.6147286161434]
リスクに敏感なアプリケーションは、複数の、潜在的に相関したターゲット変数に対して、よく校正された予測セットを必要とする。
スコアをランダムなベクトルとして扱い、それらの連接関係構造を考慮した予測セットを構築することを目的とする。
実世界のレグレッション問題に対して,所望のカバレッジと競争効率について報告する。
論文 参考訳(メタデータ) (2024-11-04T14:29:02Z) - Generalized Sparse Additive Model with Unknown Link Function [19.807823040041896]
我々は、未知リンク関数(GSAMUL)を持つ一般化スパース加法モデルという新しいスパース加法モデルを提案する。
成分関数はB-スプラインベースで推定され、未知リンク関数は多層パーセプトロン(MLP)ネットワークで推定される。
応用において、合成および実世界のデータセットの実験的評価は、提案手法の有効性を一貫して検証する。
論文 参考訳(メタデータ) (2024-10-08T13:13:58Z) - Dual-sPLS: a family of Dual Sparse Partial Least Squares regressions for
feature selection and prediction with tunable sparsity; evaluation on
simulated and near-infrared (NIR) data [1.6099403809839032]
この論文で示された変種であるDual-sPLSは、古典的なPLS1アルゴリズムを一般化する。
正確な予測と効率的な解釈のバランスを提供する。
コードはRでオープンソースパッケージとして提供される。
論文 参考訳(メタデータ) (2023-01-17T21:50:35Z) - Learning Summary Statistics for Bayesian Inference with Autoencoders [58.720142291102135]
我々は,ディープニューラルネットワークに基づくオートエンコーダの内部次元を要約統計として利用する。
パラメータ関連情報を全て符号化するエンコーダのインセンティブを作成するため,トレーニングデータの生成に使用した暗黙的情報にデコーダがアクセスできるようにする。
論文 参考訳(メタデータ) (2022-01-28T12:00:31Z) - Modeling Sequences as Distributions with Uncertainty for Sequential
Recommendation [63.77513071533095]
既存のシーケンシャルメソッドの多くは、ユーザが決定論的であると仮定する。
項目-項目遷移は、いくつかの項目において著しく変動し、ユーザの興味のランダム性を示す。
本稿では,不確実性を逐次モデルに注入する分散型トランスフォーマーシークエンシャルレコメンデーション(DT4SR)を提案する。
論文 参考訳(メタデータ) (2021-06-11T04:35:21Z) - Finding Geometric Models by Clustering in the Consensus Space [61.65661010039768]
本稿では,未知数の幾何学的モデル,例えばホモグラフィーを求めるアルゴリズムを提案する。
複数の幾何モデルを用いることで精度が向上するアプリケーションをいくつか提示する。
これには、複数の一般化されたホモグラフからのポーズ推定、高速移動物体の軌道推定が含まれる。
論文 参考訳(メタデータ) (2021-03-25T14:35:07Z) - Model-based multi-parameter mapping [0.0]
定量的MRイメージングは、よりリッチな情報の内容と標準化された測定基準のためにますます好まれている。
推定はしばしば、異なる量のデータを分離して解くために、データのノイズサブセットを仮定する。
代わりに、生成モデルは定式化され、パラメータ推定を共同で回復するために反転することができる。
論文 参考訳(メタデータ) (2021-02-02T17:00:11Z) - On the Discrepancy between Density Estimation and Sequence Generation [92.70116082182076]
log-likelihoodは、同じファミリー内のモデルを考えるとき、BLEUと非常に相関している。
異なる家族間でのモデルランキングの相関はみられない。
論文 参考訳(メタデータ) (2020-02-17T20:13:35Z) - Parameter Space Factorization for Zero-Shot Learning across Tasks and
Languages [112.65994041398481]
本稿では,ニューラルパラメータの空間に対するベイズ生成モデルを提案する。
タスク言語の組み合わせから得られたデータに基づいて、そのような潜伏変数よりも後部を推測する。
我々のモデルは、最先端のゼロショットの言語間転送手法よりも、同等か良い結果が得られる。
論文 参考訳(メタデータ) (2020-01-30T16:58:56Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。