論文の概要: MatRec: Matrix Factorization for Highly Skewed Dataset
- arxiv url: http://arxiv.org/abs/2011.04395v1
- Date: Mon, 9 Nov 2020 12:55:38 GMT
- ステータス: 処理完了
- システム内更新日: 2022-09-28 01:54:58.351852
- Title: MatRec: Matrix Factorization for Highly Skewed Dataset
- Title(参考訳): MatRec: 高スキューデータセットの行列分解
- Authors: Hao Wang, Bing Ruan
- Abstract要約: 本稿では,行列分解の枠組みにおける問題を解く新しいアルゴリズムを提案する。
提案手法は,一般的なレコメンデータシステムアルゴリズムを用いて,好意的な結果を生成する。
- 参考スコア(独自算出の注目度): 4.658166900129066
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Recommender systems is one of the most successful AI technologies applied in
the internet cooperations. Popular internet products such as TikTok, Amazon,
and YouTube have all integrated recommender systems as their core product
feature. Although recommender systems have received great success, it is well
known for highly skewed datasets, engineers and researchers need to adjust
their methods to tackle the specific problem to yield good results. Inability
to deal with highly skewed dataset usually generates hard computational
problems for big data clusters and unsatisfactory results for customers. In
this paper, we propose a new algorithm solving the problem in the framework of
matrix factorization. We model the data skewness factors in the theoretic
modeling of the approach with easy to interpret and easy to implement formulas.
We prove in experiments our method generates comparably favorite results with
popular recommender system algorithms such as Learning to Rank , Alternating
Least Squares and Deep Matrix Factorization.
- Abstract(参考訳): recommender systemsは、インターネット協力において最も成功したai技術の1つである。
TikTok、Amazon、YouTubeなどの人気のインターネット製品は、いずれもコア製品機能として推奨システムを統合している。
推奨システムは大きな成功を収めているが、高度に歪んだデータセットでよく知られているが、エンジニアや研究者は、適切な結果を得るために特定の問題に取り組む方法を調整する必要がある。
高度に歪んだデータセットを扱うことができないと、通常、ビッグデータクラスタのハードコンピュート問題や、顧客にとって不満足な結果が発生する。
本稿では,行列分解の枠組みにおける問題を解く新しいアルゴリズムを提案する。
計算式を容易に解釈し、実装し易いアプローチの理論的モデリングにおけるデータ歪率因子をモデル化する。
提案手法は,Learning to Rank,Alternating Least Squares,Deep Matrix Factorizationといった,一般的な推薦システムアルゴリズムを用いて,比較可能な好結果を生成する。
関連論文リスト
- Learning to Optimize Permutation Flow Shop Scheduling via Graph-based
Imitation Learning [70.65666982566655]
置換フローショップスケジューリング(PFSS)は製造業で広く使われている。
我々は,より安定かつ正確に収束を加速する専門家主導の模倣学習を通じてモデルを訓練することを提案する。
我々のモデルのネットワークパラメータはわずか37%に減少し、エキスパートソリューションに対する我々のモデルの解のギャップは平均6.8%から1.3%に減少する。
論文 参考訳(メタデータ) (2022-10-31T09:46:26Z) - On the Generalizability and Predictability of Recommender Systems [33.46314108814183]
推奨システムアプローチに関する大規模な研究を初めて行った。
Reczillaは、レコメンデーションシステムのためのメタラーニングアプローチです。
論文 参考訳(メタデータ) (2022-06-23T17:51:42Z) - HyperImpute: Generalized Iterative Imputation with Automatic Model
Selection [77.86861638371926]
カラムワイズモデルを適応的かつ自動的に構成するための一般化反復計算フレームワークを提案する。
既製の学習者,シミュレータ,インターフェースを備えた具体的な実装を提供する。
論文 参考訳(メタデータ) (2022-06-15T19:10:35Z) - The Machine Learning for Combinatorial Optimization Competition (ML4CO):
Results and Insights [59.93939636422896]
ML4COは、キーコンポーネントを置き換えることで最先端の最適化問題を解決することを目的としている。
このコンペティションでは、最高の実現可能なソリューションを見つけること、最も厳密な最適性証明書を生成すること、適切なルーティング設定を提供すること、という3つの課題があった。
論文 参考訳(メタデータ) (2022-03-04T17:06:00Z) - Ranking Cost: Building An Efficient and Scalable Circuit Routing Planner
with Evolution-Based Optimization [49.207538634692916]
そこで我々は、効率よくトレーニング可能なルータを形成するための新しい回路ルーティングアルゴリズム、Randing Costを提案する。
提案手法では,A*ルータが適切な経路を見つけるのに役立つコストマップと呼ばれる新しい変数群を導入する。
我々のアルゴリズムはエンドツーエンドで訓練されており、人工データや人間の実演は一切使用しない。
論文 参考訳(メタデータ) (2021-10-08T07:22:45Z) - Matrix Encoding Networks for Neural Combinatorial Optimization [5.524431376262751]
一般的なアプローチは、与えられた最適化(CO)問題のパラメータをニューラルネットワークで計算することである。
現在、そのような行列スタイルの関係データを入力として取り込むニューラルネットモデルは存在しない。
本稿では,このような複雑なCO問題のパラメータをいかに便利に取り込み,処理するかを示す。
論文 参考訳(メタデータ) (2021-06-21T13:50:23Z) - Solving weakly supervised regression problem using low-rank manifold
regularization [77.34726150561087]
我々は弱い教師付き回帰問題を解く。
weakly"の下では、いくつかのトレーニングポイントではラベルが知られ、未知のものもあれば、無作為なノイズの存在やリソースの欠如などの理由によって不確かであることが分かっています。
数値的な節ではモンテカルロモデルを用いて提案手法を人工と実のデータセットに適用した。
論文 参考訳(メタデータ) (2021-04-13T23:21:01Z) - You Only Compress Once: Optimal Data Compression for Estimating Linear
Models [1.2845031126178592]
線形モデルを用いる多くの工学システムは分散システムおよび専門家構成によって計算効率を達成します。
条件付き十分な統計は、統一されたデータ圧縮と推定戦略である。
論文 参考訳(メタデータ) (2021-02-22T19:00:18Z) - Model-Based Deep Learning [155.063817656602]
信号処理、通信、制御は伝統的に古典的な統計モデリング技術に依存している。
ディープニューラルネットワーク(DNN)は、データから操作を学ぶ汎用アーキテクチャを使用し、優れたパフォーマンスを示す。
私たちは、原理数学モデルとデータ駆動システムを組み合わせて両方のアプローチの利点を享受するハイブリッド技術に興味があります。
論文 参考訳(メタデータ) (2020-12-15T16:29:49Z) - Binary Matrix Factorisation via Column Generation [6.445605125467574]
本稿では,算術における低ランク二乗行列分解(BMF)の問題点について考察する。
混合整数線形プログラムとして問題を定式化し、列生成の大規模最適化手法を用いて解決する。
実世界のデータセットを用いた実験結果から,提案手法は高精度な因数分解を実現するのに有効であることが示された。
論文 参考訳(メタデータ) (2020-11-09T14:27:36Z) - Recommendation system using a deep learning and graph analysis approach [1.2183405753834562]
本稿では,行列係数化とグラフ解析に基づく新しい推薦手法を提案する。
さらに,ディープオートエンコーダを利用してユーザやアイテムの潜伏要因を初期化し,ディープ埋め込み手法によってユーザの潜伏要因をユーザ信頼グラフから収集する。
論文 参考訳(メタデータ) (2020-04-17T08:05:33Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。