論文の概要: Knowledge Infused Policy Gradients with Upper Confidence Bound for
Relational Bandits
- arxiv url: http://arxiv.org/abs/2106.13895v1
- Date: Fri, 25 Jun 2021 21:54:08 GMT
- ステータス: 処理完了
- システム内更新日: 2021-06-30 13:42:42.897938
- Title: Knowledge Infused Policy Gradients with Upper Confidence Bound for
Relational Bandits
- Title(参考訳): 関係帯域に対する信頼度境界付き知識注入型政策勾配
- Authors: Kaushik Roy and Qi Zhang and Manas Gaur and Amit Sheth
- Abstract要約: コンテキストバンドは、オンライン広告、レコメンデーションシステム、ヘルスケアなど、さまざまな現実のシナリオで重要なユースケースを見つけます。
ほとんどのアルゴリズムは、コンテキストを表現するためにフラットな特徴ベクトルを使用するが、実世界では、コンテキストをモデル化するためのオブジェクトと関係が多様である。
よりリッチなリレーショナルコンテキスト表現を追加することで、より広いコンテキスト空間を導入し、探索と探索を困難にします。
- 参考スコア(独自算出の注目度): 14.316482550910587
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Contextual Bandits find important use cases in various real-life scenarios
such as online advertising, recommendation systems, healthcare, etc. However,
most of the algorithms use flat feature vectors to represent context whereas,
in the real world, there is a varying number of objects and relations among
them to model in the context. For example, in a music recommendation system,
the user context contains what music they listen to, which artists create this
music, the artist albums, etc. Adding richer relational context representations
also introduces a much larger context space making exploration-exploitation
harder. To improve the efficiency of exploration-exploitation knowledge about
the context can be infused to guide the exploration-exploitation strategy.
Relational context representations allow a natural way for humans to specify
knowledge owing to their descriptive nature. We propose an adaptation of
Knowledge Infused Policy Gradients to the Contextual Bandit setting and a novel
Knowledge Infused Policy Gradients Upper Confidence Bound algorithm and perform
an experimental analysis of a simulated music recommendation dataset and
various real-life datasets where expert knowledge can drastically reduce the
total regret and where it cannot.
- Abstract(参考訳): コンテキストバンドは、オンライン広告、レコメンデーションシステム、ヘルスケアなど、さまざまな現実のシナリオで重要なユースケースを見つけます。
しかし、ほとんどのアルゴリズムは文脈を表現するのに平坦な特徴ベクトルを使い、現実の世界では様々なオブジェクトとそれらの間の関係が文脈でモデル化される。
例えば、音楽レコメンデーションシステムでは、ユーザのコンテキストには、聴く音楽、どのアーティストがこの音楽を作成するか、アーティストのアルバムなどが含まれる。
よりリッチなリレーショナルコンテキスト表現を追加することで、探索と探索が難しくなる。
探索探索戦略を導くために、文脈に関する探索探索知識の効率を向上させる。
リレーショナルな文脈表現は、人間が記述的な性質から知識を特定できる自然な方法である。
本研究では,知識注入政策グラディエンスを文脈帯域設定や新しい知識注入政策グラディエンス・アッパー信頼境界アルゴリズムに適応させ,模擬音楽レコメンデーションデータセットと各種実生活データセットを実験的に解析し,専門家の知識が全体の後悔を劇的に減らし,それを不可能にする方法を提案する。
関連論文リスト
- Augmented Commonsense Knowledge for Remote Object Grounding [67.30864498454805]
エージェントナビゲーションを改善するための時間的知識グラフとして,コモンセンス情報を活用するための拡張コモンセンス知識モデル(ACK)を提案する。
ACKは知識グラフ対応のクロスモーダルとコンセプトアグリゲーションモジュールで構成され、視覚的表現と視覚的テキストデータアライメントを強化する。
我々は、より正確な局所的な行動予測につながるコモンセンスに基づく意思決定プロセスのための新しいパイプラインを追加します。
論文 参考訳(メタデータ) (2024-06-03T12:12:33Z) - VLLMs Provide Better Context for Emotion Understanding Through Common Sense Reasoning [66.23296689828152]
我々は、視覚・言語モデルの機能を活用し、文脈内感情分類を強化する。
第1段階では、VLLMが対象者の明らかな感情の自然言語で記述を生成できるように促すことを提案する。
第2段階では、記述を文脈情報として使用し、画像入力とともに、トランスフォーマーベースのアーキテクチャのトレーニングに使用する。
論文 参考訳(メタデータ) (2024-04-10T15:09:15Z) - Knowledge Graphs and Pre-trained Language Models enhanced Representation Learning for Conversational Recommender Systems [58.561904356651276]
本稿では,対話型推薦システムのためのエンティティの意味理解を改善するために,知識強化型エンティティ表現学習(KERL)フレームワークを紹介する。
KERLは知識グラフと事前訓練された言語モデルを使用して、エンティティの意味的理解を改善する。
KERLはレコメンデーションとレスポンス生成の両方のタスクで最先端の結果を達成する。
論文 参考訳(メタデータ) (2023-12-18T06:41:23Z) - Crafting In-context Examples according to LMs' Parametric Knowledge [42.41668563471588]
文脈内サンプルは言語モデル(LM)をトリガーし、パラメトリック知識に格納された情報をサーフェスする。
モデルがパラメトリックな知識から正しく答えられるような'既知の'例と、未知の'未知の'例を識別する。
実験の結果,「未知」の例では幻覚が促進されるため,効果が低下する可能性が示唆された。
論文 参考訳(メタデータ) (2023-11-16T05:30:07Z) - Combo of Thinking and Observing for Outside-Knowledge VQA [13.838435454270014]
外部知識の視覚的質問応答は、買収とオープンエンドの現実世界の知識の使用の両方を必要とする難しいタスクである。
本稿では,モダリティ空間を自然言語空間と同じ空間に制約することに着想を得た。
本稿では,マルチモーダルエンコーダ,テキストエンコーダ,応答デコーダからなる新しいフレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-10T18:32:32Z) - Multi-Sentence Knowledge Selection in Open-Domain Dialogue [11.936691632841388]
オープンドメイン会話知識選択の現況を評価する。
We create a augmented dataset based on the Wizard of Wikipedia (WOW) corpus。
WOW++は、対話コンテキストごとに8つの関連する知識文を平均化する。
論文 参考訳(メタデータ) (2022-03-01T22:07:05Z) - A General Framework for Learning Prosodic-Enhanced Representation of Rap
Lyrics [21.944835086749375]
ラップ歌詞の学習と分析は、多くのWebアプリケーションにとって重要な基礎です。
階層型注目変動オートエンコーダフレームワーク(HAVAE)を提案する。
様々な特徴を適切に統合し,韻律強調表現を生成する特徴集約戦略を提案する。
論文 参考訳(メタデータ) (2021-03-23T15:13:21Z) - Wisdom of the Contexts: Active Ensemble Learning for Contextual Anomaly
Detection [7.87320844079302]
文脈異常検出(CAD)では、オブジェクトは特定のコンテキスト内でのみ異常と見なされる。
We propose a novel approach called WisCon, which generated contexts from the feature set。
提案手法は,すべての有用なコンテキストが同じではないという仮定に基づいて,異なる重要度スコアを持つ複数のコンテキストのアンサンブルを構築する。
論文 参考訳(メタデータ) (2021-01-27T17:34:13Z) - Learning Contextual Causality from Time-consecutive Images [84.26437953699444]
因果知識は多くの人工知能システムにとって重要である。
本稿では,視覚信号から文脈因果関係を学習する可能性について検討する。
まず,高品質なデータセットvis-causalを提案し,ビデオから有意義な因果知識を自動的に発見できることを示す実験を行った。
論文 参考訳(メタデータ) (2020-12-13T20:24:48Z) - CokeBERT: Contextual Knowledge Selection and Embedding towards Enhanced
Pre-Trained Language Models [103.18329049830152]
我々は,コンテキスト知識を動的に選択し,テキストコンテキストに応じて知識コンテキストを埋め込む,Cokeという新しいフレームワークを提案する。
実験の結果、コークは知識駆動型NLPタスクにおいて、様々なベースラインを上回ります。
コークは、テキスト関連の知識のセマンティクスを従来のPLMよりも解釈可能な形で記述することができる。
論文 参考訳(メタデータ) (2020-09-29T12:29:04Z) - Improving Machine Reading Comprehension with Contextualized Commonsense
Knowledge [62.46091695615262]
我々は、機械読解の理解を改善するために、常識知識を抽出することを目指している。
構造化知識を文脈内に配置することで,関係を暗黙的に表現することを提案する。
我々は,教師の学習パラダイムを用いて,複数種類の文脈的知識を学生機械読取機に注入する。
論文 参考訳(メタデータ) (2020-09-12T17:20:01Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。