Fugu-MT 論文翻訳(概要): Blending Search and Discovery: Tag-Based Query Refinement with Contextual Reinforcement Learning

論文の概要: Blending Search and Discovery: Tag-Based Query Refinement with Contextual Reinforcement Learning

arxiv url: http://arxiv.org/abs/2010.09495v1
Date: Thu, 15 Oct 2020 19:40:35 GMT
ステータス: 翻訳完了
システム内更新日: 2022-10-07 05:39:45.459748
Title: Blending Search and Discovery: Tag-Based Query Refinement with Contextual Reinforcement Learning
Title（参考訳）: Blending Search and Discovery: 文脈強化学習によるタグベースのクエリリファインメント
Authors: Bingqing Yu and Jacopo Tagliabue
Abstract要約: 標準的なファセット検索に代わるモバイルフレンドリーな代替手段として,タグベースのクエリリファインメントに取り組む。マルチテナントシナリオで効率的にスケールできるディープコンテキストバンディットを提案する。
参考スコア（独自算出の注目度）: 6.09170287691728
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We tackle tag-based query refinement as a mobile-friendly alternative to standard facet search. We approach the inference challenge with reinforcement learning, and propose a deep contextual bandit that can be efficiently scaled in a multi-tenant SaaS scenario.
Abstract（参考訳）: 標準的なファセット検索に代わるモバイルフレンドリーな代替として,タグベースのクエリ改善に取り組む。強化学習による推論課題にアプローチし,マルチテナントsaasシナリオにおいて効率的にスケール可能な,深いコンテキストのバンディットを提案する。

関連論文リスト

ConvMix: A Mixed-Criteria Data Augmentation Framework for Conversational Dense Retrieval [25.129468117978767]
本研究では,対話型高密度検索のための混合基準フレームワークであるConvMixを提案する。大規模言語モデルの助けを借りて,両面の妥当性判断拡張スキーマをスケーラブルに設計する。広範に使用されている5つのベンチマーク実験の結果,我々のConvMixフレームワークで訓練された対話型高密度検索器は,従来のベースライン法よりも優れていた。
論文参考訳（メタデータ） (2025-08-06T01:28:49Z)
Machine Assistant with Reliable Knowledge: Enhancing Student Learning via RAG-based Retrieval [0.0]
MARK(Machine Assistant with Reliable Knowledge)は、学生の学習を支援するために開発された質問応答システムである。システムは検索強化世代(RAG)フレームワーク上に構築されており、このフレームワークは、実際の一貫性を確保するために、キュレートされた知識ベースを統合する。
論文参考訳（メタデータ） (2025-06-28T22:17:27Z)
Re-ranking Reasoning Context with Tree Search Makes Large Vision-Language Models Stronger [51.01841635655944]
大規模視覚言語モデル(LVLM)の最近の進歩は、視覚質問応答(VQA)タスクのパフォーマンスを著しく改善している。既存の手法は、推論例による知識の不足や、抽出された知識からの不規則な応答など、依然として課題に直面している。我々は、Reasoning Context-enriched knowledge baseとTree Search re-level methodを構築し、LVLMを強化したRCTSと呼ばれるマルチモーダルRAGフレームワークを提案する。
論文参考訳（メタデータ） (2025-06-09T14:00:57Z)
Layer-of-Thoughts Prompting (LoT): Leveraging LLM-Based Retrieval with Constraint Hierarchies [0.3946282433423277]
Layer-of-Thoughts Prompting (LoT)は、制約階層を使用して、所定のクエリに対する候補応答をフィルタリングし、精査する。 LoTは情報検索タスクの精度と理解性を著しく改善する。
論文参考訳（メタデータ） (2024-10-16T01:20:44Z)
PathFinder: Guided Search over Multi-Step Reasoning Paths [80.56102301441899]
木探索に基づく推論経路生成手法であるPathFinderを提案する。動的デコードの統合により、多様な分岐とマルチホップ推論を強化する。我々のモデルは、大きな分岐因子を持つビームサーチに類似した複雑さを反映して、よく、長く、目に見えない推論連鎖を一般化する。
論文参考訳（メタデータ） (2023-12-08T17:05:47Z)
Reinforcement Replaces Supervision: Query focused Summarization using Deep Reinforcement Learning [43.123290672073814]
クエリに基づいて文書から要約を生成するシステムを扱う。 Reinforcement Learning (RL) が自然言語生成のための Supervised Learning (SL) の一般化を提供するという知見に触発されて,本課題に RL ベースのアプローチを用いる。我々は、ROUGE、BLEU、Semantic similarityといった様々な報酬信号に基づいて訓練された複数のポリシーグラディエントネットワークを開発する。
論文参考訳（メタデータ） (2023-11-29T10:38:16Z)
Large Search Model: Redefining Search Stack in the Era of LLMs [63.503320030117145]
我々は,1つの大言語モデル(LLM)で検索タスクを統一することにより,従来の検索スタックを再定義する,大規模検索モデルと呼ばれる新しい概念的フレームワークを導入する。全てのタスクは自動回帰テキスト生成問題として定式化され、自然言語のプロンプトを使ってタスクをカスタマイズできる。提案フレームワークは,LLMの強力な言語理解と推論能力を活用し,既存の検索スタックを簡素化しつつ,検索結果の質を向上させる能力を提供する。
論文参考訳（メタデータ） (2023-10-23T05:52:09Z)
SSP: Self-Supervised Post-training for Conversational Search [63.28684982954115]
本稿では,対話型検索モデルを効率的に初期化するための3つの自己教師型タスクを備えた学習後パラダイムであるフルモデル(モデル)を提案する。提案手法の有効性を検証するために,CAsT-19 と CAsT-20 の2つのベンチマークデータセットを用いて,会話検索タスクにモデルにより訓練後の会話エンコーダを適用した。
論文参考訳（メタデータ） (2023-07-02T13:36:36Z)
Passage-Mask: A Learnable Regularization Strategy for Retriever-Reader Models [36.58955176223759]
Retriever-Readerモデルは、オープン質問応答や対話会話など、多くの異なるNLPタスク間での競合的なパフォーマンスを実現する。学習可能なパスマスク機構を導入し、トップランクの検索パスからの影響を減らし、モデルが過度に適合しないようにする。
論文参考訳（メタデータ） (2022-11-02T06:39:46Z)
Retrieval Augmentation for Commonsense Reasoning: A Unified Approach [64.63071051375289]
検索強化コモンセンス推論(RACo)の統一的枠組みを提案する。提案するRACoは,他の知識強化手法よりも優れる。
論文参考訳（メタデータ） (2022-10-23T23:49:08Z)
A Multi-label Continual Learning Framework to Scale Deep Learning Approaches for Packaging Equipment Monitoring [57.5099555438223]
連続シナリオにおけるマルチラベル分類を初めて研究した。タスク数に関して対数的複雑性を持つ効率的なアプローチを提案する。我々は,包装業界における実世界のマルチラベル予測問題に対するアプローチを検証した。
論文参考訳（メタデータ） (2022-08-08T15:58:39Z)
Phrase Retrieval Learns Passage Retrieval, Too [77.57208968326422]
文節検索が,文節や文書を含む粗いレベルの検索の基盤となるかを検討する。句検索システムでは,句検索の精度が向上し,句検索の精度が向上していることを示す。また,句のフィルタリングやベクトル量子化により,インデックスのサイズを4～10倍に削減できることを示す。
論文参考訳（メタデータ） (2021-09-16T17:42:45Z)
High Quality Related Search Query Suggestions using Deep Reinforcement Learning [0.15229257192293202]
The High Quality Related Search Query Suggestions” タスクは,リアルタイムで正確で,多様な,関連性の高い検索クエリを推奨することを目的としている。私たちは、ユーザが次に入力するクエリを予測するために、Deep Reinforcement Learningモデルをトレーニングします。報酬信号は、長期セッションベースのユーザフィードバック、構文的関連性、および生成されたクエリの自然性から成り立っている。
論文参考訳（メタデータ） (2021-08-10T05:22:32Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。