論文の概要: PECOS: Prediction for Enormous and Correlated Output Spaces
- arxiv url: http://arxiv.org/abs/2010.05878v2
- Date: Tue, 18 Jan 2022 19:43:10 GMT
- ステータス: 処理完了
- システム内更新日: 2022-10-08 07:44:33.035841
- Title: PECOS: Prediction for Enormous and Correlated Output Spaces
- Title(参考訳): PECOS: 異常および関連する出力空間の予測
- Authors: Hsiang-Fu Yu and Kai Zhong and Jiong Zhang and Wei-Cheng Chang and
Inderjit S. Dhillon
- Abstract要約: 本稿では,PECOS(Enermous and Correlated Output Spaces)フレームワークの予測について述べる。
PECOSは、非常に大きな出力空間の予測問題を解くための汎用的でモジュール化された機械学習フレームワークである。
eXtreme Multilabel Ranking (XMR) 問題に適用する。
- 参考スコア(独自算出の注目度): 47.82773234871539
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Many large-scale applications amount to finding relevant results from an
enormous output space of potential candidates. For example, finding the best
matching product from a large catalog or suggesting related search phrases on a
search engine. The size of the output space for these problems can range from
millions to billions, and can even be infinite in some applications. Moreover,
training data is often limited for the long-tail items in the output space.
Fortunately, items in the output space are often correlated thereby presenting
an opportunity to alleviate the data sparsity issue. In this paper, we propose
the Prediction for Enormous and Correlated Output Spaces (PECOS) framework, a
versatile and modular machine learning framework for solving prediction
problems for very large output spaces, and apply it to the eXtreme Multilabel
Ranking (XMR) problem: given an input instance, find and rank the most relevant
items from an enormous but fixed and finite output space. We propose a three
phase framework for PECOS: (i) in the first phase, PECOS organizes the output
space using a semantic indexing scheme, (ii) in the second phase, PECOS uses
the indexing to narrow down the output space by orders of magnitude using a
machine learned matching scheme, and (iii) in the third phase, PECOS ranks the
matched items using a final ranking scheme. The versatility and modularity of
PECOS allows for easy plug-and-play of various choices for the indexing,
matching, and ranking phases. We also develop very fast inference procedures
which allow us to perform XMR predictions in real time; for example, inference
takes less than 1 millisecond per input on the dataset with 2.8 million labels.
The PECOS software is available at https://libpecos.org.
- Abstract(参考訳): 大規模なアプリケーションの多くは、潜在的な候補の巨大な出力空間から関連する結果を見つけるのに役立ちます。
例えば、大きなカタログから最適なマッチング製品を見つけたり、検索エンジンで関連する検索フレーズを提案したりする。
これらの問題に対する出力空間のサイズは数百万から数十億までで、アプリケーションによっては無限になることもある。
さらに、トレーニングデータは出力空間内のロングテールアイテムに制限されることが多い。
幸いなことに、出力空間内のアイテムはよく相関して、データ空間の問題を軽減する機会を提供する。
本稿では、非常に大きな出力空間の予測問題を解くための汎用的でモジュール化された機械学習フレームワークであるPECOS(Predict for Enormous and Correlated Output Spaces)フレームワークを提案し、これをeXtreme Multilabel Ranking (XMR)問題に適用する。
我々はpecosの3段階フレームワークを提案する。
(i)第1フェーズでは、pecosはセマンティックインデックススキームを用いて出力空間を整理する。
(ii) 第二段階では, PECOS は, 機械学習マッチング方式を用いて, 出力空間を桁違いに絞り込み, インデックス化する。
(iii)第3フェーズでは、pecosは最終ランキング方式でマッチしたアイテムをランク付けする。
PECOSの汎用性とモジュール性により、インデックス付け、マッチング、ランキングフェーズの様々な選択を簡単にプラグイン&プレイできる。
また、XMR予測をリアルタイムに実行するための非常に高速な推論手順も開発しています。
PECOSソフトウェアはhttps://libpecos.orgで公開されている。
関連論文リスト
- Learning a Fast Mixing Exogenous Block MDP using a Single Trajectory [87.62730694973696]
STEELは、単一軌道から外因性ブロックマルコフ決定過程の制御可能なダイナミクスを学習するための、最初の証明可能なサンプル効率アルゴリズムである。
我々は,STEELが正解であり,サンプル効率が良いことを証明し,STEELを2つの玩具問題で実証した。
論文 参考訳(メタデータ) (2024-10-03T21:57:21Z) - Coupled Input-Output Dimension Reduction: Application to Goal-oriented Bayesian Experimental Design and Global Sensitivity Analysis [1.4999444543328293]
本研究では,高次元関数の入力空間と出力空間の次元を共同で削減する手法を提案する。
従来の手法では、実際は2つを同時に削減するが、入力空間または出力空間の削減に重点を置いている。
論文 参考訳(メタデータ) (2024-06-19T10:31:57Z) - Fast emulation of fermionic circuits with matrix product states [0.0]
オープンソースMPS対応FQEインタフェース(MPS-FQE)を提案する。
このソフトウェアは、ほとんどの基本的なテンソル操作にオープンソースのpyblock3とblock2ライブラリを使用する。
本稿では,短期的およびフォールトトレラントな量子アルゴリズムに関するいくつかの応用例を示す。
論文 参考訳(メタデータ) (2023-12-29T15:47:14Z) - SqueezeLLM: Dense-and-Sparse Quantization [80.32162537942138]
LLMにおける生成推論の主なボトルネックは、単一のバッチ推論のための計算ではなく、メモリ帯域幅である。
学習後量子化フレームワークであるSqueezeLLMを導入し、最大3ビットの超低精度でのロスレス圧縮を実現する。
本フレームワークは,2次情報に基づく最適ビット精度割当を探索する感度ベース非一様量子化法と,2次情報に基づくDense-and-Sparse分解法と,2次情報量割当値と感度重み値を効率的にスパース形式で格納するDense-and-Sparse分解法である。
論文 参考訳(メタデータ) (2023-06-13T08:57:54Z) - HUSP-SP: Faster Utility Mining on Sequence Data [48.0426095077918]
高実用性シーケンシャルパターンマイニング (HUSPM) が重要視されている。
シークエンスプロジェクション(seqPro)と呼ばれるコンパクトな構造を設計し、シークエンスプロ構造(HUSP-SP)を用いた効率的なアルゴリズムを提案する。
HUSP-SPは, 実行時間, メモリ使用量, 検索空間のプルーニング効率, スケーラビリティにおいて, 最先端のアルゴリズムを著しく上回っている。
論文 参考訳(メタデータ) (2022-12-29T10:56:17Z) - ICOS: Efficient and Highly Robust Point Cloud Registration with
Correspondences [6.8858952804978335]
ポイントクラウド登録は、ロボット工学とコンピュータビジョンの基本的な問題である。
本論文では,通信型ポイントクラウド登録問題に対する,新規で効率的かつ堅牢なソリューションであるICOSについて述べる。
論文 参考訳(メタデータ) (2021-04-30T05:41:53Z) - Latent Programmer: Discrete Latent Codes for Program Synthesis [56.37993487589351]
プログラム合成や文書要約などの多くのシーケンス学習タスクにおいて、重要な問題は出力シーケンスの広い空間を探索することである。
本稿では,検索対象とする出力の表現を学習することを提案する。
本稿では,まず入力/出力サンプルから離散潜在コードを予測するプログラム合成手法であるemphLatent Programmerを紹介し,そのプログラムを対象言語で生成する。
論文 参考訳(メタデータ) (2020-12-01T10:11:35Z) - Overlapping Spaces for Compact Graph Representations [17.919759296265]
グラフ、テキスト、画像などの構造化データを埋め込むために、様々な非自明な空間が人気を集めている。
製品空間の概念を一般化し、構成探索問題を持たない重なり合う空間を導入する。
論文 参考訳(メタデータ) (2020-07-05T20:55:47Z) - Climbing the WOL: Training for Cheaper Inference [50.63998662655047]
我々は、MIPSサブルーチンは、大きな内部積を高いリコールで回収するために調整されているため、準最適であると主張している。
提案手法はより効率的で,高い推論精度を実現するのに十分である。
論文 参考訳(メタデータ) (2020-07-02T16:26:26Z) - CLAIMED: A CLAssification-Incorporated Minimum Energy Design to explore
a multivariate response surface with feasibility constraints [5.358212984063069]
物理学における力場系の最適化の問題に動機付けられ、決定論的複素多変量応答曲面の探索を検討する。
目的は、所望または"ターゲット"ベクトルに近い出力を生成する入力の組み合わせを見つけることである。
1次元の損失関数に関して入力空間の探索の問題を減らす一方で、探索は非自明で困難である。
本稿では、機械学習技術とスマートな実験設計のアイデアを組み合わせることで、入力空間内の複数の良い領域を特定する手法を提案する。
論文 参考訳(メタデータ) (2020-06-09T02:44:31Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。