論文の概要: Top-K Ranking Deep Contextual Bandits for Information Selection Systems
- arxiv url: http://arxiv.org/abs/2201.13287v1
- Date: Fri, 28 Jan 2022 15:10:44 GMT
- ステータス: 処理完了
- システム内更新日: 2022-02-01 18:21:10.129201
- Title: Top-K Ranking Deep Contextual Bandits for Information Selection Systems
- Title(参考訳): 情報選択システムのためのトップKランキング深層帯域
- Authors: Jade Freeman and Michael Rawson
- Abstract要約: 本稿では,文脈的マルチアーム・バンディット・フレームワークに基づくトップKランキングに対する新しいアプローチを提案する。
ニューラルネットワークを用いて報酬関数をモデル化し、非線形近似を用いて報酬と文脈の関係を学習する。
- 参考スコア(独自算出の注目度): 0.0
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: In today's technology environment, information is abundant, dynamic, and
heterogeneous in nature. Automated filtering and prioritization of information
is based on the distinction between whether the information adds substantial
value toward one's goal or not. Contextual multi-armed bandit has been widely
used for learning to filter contents and prioritize according to user interest
or relevance. Learn-to-Rank technique optimizes the relevance ranking on items,
allowing the contents to be selected accordingly. We propose a novel approach
to top-K rankings under the contextual multi-armed bandit framework. We model
the stochastic reward function with a neural network to allow non-linear
approximation to learn the relationship between rewards and contexts. We
demonstrate the approach and evaluate the the performance of learning from the
experiments using real world data sets in simulated scenarios. Empirical
results show that this approach performs well under the complexity of a reward
structure and high dimensional contextual features.
- Abstract(参考訳): 今日の技術環境では、情報は豊富で、動的で、自然に異質である。
情報の自動フィルタリングと優先順位付けは、その情報が目標に向かって実質的な価値を付加するかどうかの区別に基づいている。
コンテキスト型マルチアームバンディットは、ユーザの関心や関連性に応じてコンテンツをフィルタリングし優先順位付けするために広く使用されている。
Learn-to-Rankテクニックはアイテムの関連ランキングを最適化し、コンテンツの選択を可能にする。
本稿では,文脈的マルチアームバンディットフレームワークに基づくトップKランキングに対する新しいアプローチを提案する。
確率的報酬関数をニューラルネットワークでモデル化し,非線形近似により報酬と文脈の関係を学習する。
本手法を実証し,シミュレーションシナリオにおける実世界のデータセットを用いて実験結果から学習性能を評価する。
実験の結果、この手法は報酬構造と高次元の文脈特徴の複雑さの下でうまく機能することが示された。
関連論文リスト
- SynerGraph: An Integrated Graph Convolution Network for Multimodal Recommendation [1.3812010983144802]
本稿では,マルチモーダルデータの統合と浄化に焦点をあてた,マルチモーダルレコメンデーションシステムに対する新しいアプローチを提案する。
各種データからノイズを除去するフィルタを開発し,提案手法の信頼性を高めた。
我々は、各データセットに対するトップKスパリフィケーションの影響を調査し、不適合と過適合のバランスをとる最適な値を発見した。
論文 参考訳(メタデータ) (2024-05-29T12:18:32Z) - Enhancing Neural Subset Selection: Integrating Background Information into Set Representations [53.15923939406772]
対象値が入力集合とサブセットの両方に条件付けされている場合、スーパーセットのテクスティ不変な統計量を関心のサブセットに組み込むことが不可欠であることを示す。
これにより、出力値がサブセットとその対応するスーパーセットの置換に不変であることを保証する。
論文 参考訳(メタデータ) (2024-02-05T16:09:35Z) - Sample Complexity of Preference-Based Nonparametric Off-Policy
Evaluation with Deep Networks [58.469818546042696]
我々は、OPEのサンプル効率を人間の好みで研究し、その統計的保証を確立する。
ReLUネットワークのサイズを適切に選択することにより、マルコフ決定過程において任意の低次元多様体構造を活用できることが示される。
論文 参考訳(メタデータ) (2023-10-16T16:27:06Z) - Non-Stationary Contextual Bandit Learning via Neural Predictive Ensemble
Sampling [15.88678122212934]
文脈的包帯の現実世界の応用は、季節性、セレンディピティー、進化する社会トレンドによって、しばしば非定常性を示す。
これらの問題に対処する新しい非定常文脈帯域幅アルゴリズムを提案する。
スケーラブルでディープ・ニューラル・ネットワークベースのアーキテクチャと、慎重に設計された探索機構を組み合わせる。
論文 参考訳(メタデータ) (2023-10-11T18:15:55Z) - Beyond Accuracy: Measuring Representation Capacity of Embeddings to
Preserve Structural and Contextual Information [1.8130068086063336]
埋め込みのテキスト表現能力を測定する手法を提案する。
この研究の背後にある動機は、埋め込みの強さと限界を理解することの重要性にある。
提案手法は, 埋込評価の分野の進展に寄与するだけでなく, 研究者や実践者に定量的な測定力を与える。
論文 参考訳(メタデータ) (2023-09-20T13:21:12Z) - Enhancing Human-like Multi-Modal Reasoning: A New Challenging Dataset
and Comprehensive Framework [51.44863255495668]
マルチモーダル推論は、人間のような知性を示す人工知能システムの追求において重要な要素である。
提案するマルチモーダル推論(COCO-MMR)データセットは,オープンエンド質問の集合を包含する新しいデータセットである。
画像とテキストエンコーダを強化するために,マルチホップ・クロスモーダル・アテンションや文レベルのコントラスト学習などの革新的な手法を提案する。
論文 参考訳(メタデータ) (2023-07-24T08:58:25Z) - An Empirical Evaluation of Federated Contextual Bandit Algorithms [27.275089644378376]
フェデレートされた学習は、ユーザが関心のあるアプリケーションと対話するときに生成される暗黙の信号を使って行うことができる。
我々は,フェデレートされた設定のための集中的な設定から,顕著な文脈的帯域幅アルゴリズムの変種を開発する。
本実験は, 探索・探索のトレードオフのバランスをとる上で, シンプルで一般的なソフトマックスの驚くべき有効性を明らかにした。
論文 参考訳(メタデータ) (2023-03-17T19:22:30Z) - Deep networks for system identification: a Survey [56.34005280792013]
システム識別は、入力出力データから動的システムの数学的記述を学習する。
同定されたモデルの主な目的は、以前の観測から新しいデータを予測することである。
我々は、フィードフォワード、畳み込み、リカレントネットワークなどの文献で一般的に採用されているアーキテクチャについて論じる。
論文 参考訳(メタデータ) (2023-01-30T12:38:31Z) - Incorporating Relevance Feedback for Information-Seeking Retrieval using
Few-Shot Document Re-Ranking [56.80065604034095]
我々は,クエリとユーザが関連すると考えるドキュメントとの類似性に基づいて,文書を再参照するkNNアプローチを提案する。
異なる統合戦略を評価するため、既存の4つの情報検索データセットを関連フィードバックシナリオに変換する。
論文 参考訳(メタデータ) (2022-10-19T16:19:37Z) - Information Ranking Using Optimum-Path Forest [5.696039065328918]
The performance of Optimum-Path Forest (OPF) based approach was compared to the well-known SVM-Rank pairwise technique and a baseline based on distance calculation。
実験の結果、計算負荷の点で従来の技術よりも精度と性能が優れていた。
論文 参考訳(メタデータ) (2021-02-16T02:01:29Z) - Deep Learning feature selection to unhide demographic recommender
systems factors [63.732639864601914]
行列分解モデルは意味的知識を含まない因子を生成する。
DeepUnHideは、協調フィルタリングレコメンデータシステムにおいて、ユーザとアイテムファクタから、人口統計情報を抽出することができる。
論文 参考訳(メタデータ) (2020-06-17T17:36:48Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。