論文の概要: HeroNet: A Hybrid Retrieval-Generation Network for Conversational Bots
- arxiv url: http://arxiv.org/abs/2301.12400v1
- Date: Sun, 29 Jan 2023 09:36:44 GMT
- ステータス: 処理完了
- システム内更新日: 2023-01-31 17:15:56.974036
- Title: HeroNet: A Hybrid Retrieval-Generation Network for Conversational Bots
- Title(参考訳): HeroNet:会話ボットのためのハイブリッド検索生成ネットワーク
- Authors: Bolin Zhang and Yunzhe Xu and Zhiying Tu and Dianhui Chu
- Abstract要約: 既存のボットは通常、検索ベースまたは生成ベースアプローチによって開発される。
本稿では,3つのアイデアを持つハイブリッド検索生成ネットワーク(HeroNet)を提案する。
HeroNetは、お互いのパフォーマンスを最大化しながら、検索と生成の両方のタスクを同時に解決することができる。
- 参考スコア(独自算出の注目度): 0.8602553195689513
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Using natural language, Conversational Bot offers unprecedented ways to many
challenges in areas such as information searching, item recommendation, and
question answering. Existing bots are usually developed through retrieval-based
or generative-based approaches, yet both of them have their own advantages and
disadvantages. To assemble this two approaches, we propose a hybrid
retrieval-generation network (HeroNet) with the three-fold ideas: 1). To
produce high-quality sentence representations, HeroNet performs multi-task
learning on two subtasks: Similar Queries Discovery and Query-Response
Matching. Specifically, the retrieval performance is improved while the model
size is reduced by training two lightweight, task-specific adapter modules that
share only one underlying T5-Encoder model. 2). By introducing adversarial
training, HeroNet is able to solve both retrieval\&generation tasks
simultaneously while maximizing performance of each other. 3). The retrieval
results are used as prior knowledge to improve the generation performance while
the generative result are scored by the discriminator and their scores are
integrated into the generator's cross-entropy loss function. The experimental
results on a open dataset demonstrate the effectiveness of the HeroNet and our
code is available at https://github.com/TempHero/HeroNet.git
- Abstract(参考訳): 自然言語を利用するConversational Botは、情報検索、項目推薦、質問応答など、多くの課題に対して前例のない方法を提供している。
既存のボットは通常、検索ベースまたは生成ベースアプローチによって開発されるが、どちらも独自の利点と欠点を持っている。
この2つのアプローチを組み立てるために,3つのアイデアを持つハイブリッド検索生成ネットワーク (HeroNet) を提案する。
高品質な文表現を生成するため、heronetは類似したクエリ発見とクエリ応答マッチングという2つのサブタスクでマルチタスク学習を行う。
具体的には、t5エンコーダモデルのみを共有する2つの軽量タスク固有のアダプタモジュールをトレーニングすることで、モデルサイズを削減しながら、検索性能が向上する。
2).
敵のトレーニングを導入することで、heronetは互いにパフォーマンスを最大化しながら、検索と生成の両方のタスクを同時に解決することができる。
3).
生成結果が判別器によってスコア付けされ、そのスコアが生成器のクロスエントロピー損失関数に統合される間、検索結果を先行知識として生成性能を向上させる。
オープンデータセットの実験結果はheronetの有効性を示しており、コードはhttps://github.com/temphero/heronet.gitで入手できる。
関連論文リスト
- List-aware Reranking-Truncation Joint Model for Search and
Retrieval-augmented Generation [80.12531449946655]
本稿では,2つのタスクを同時に実行可能なRe rank-Truncation joint model(GenRT)を提案する。
GenRTは、エンコーダ-デコーダアーキテクチャに基づく生成パラダイムによるリランクとトランケーションを統合している。
提案手法は,Web検索および検索拡張LLMにおけるリランクタスクとトラルケーションタスクの両方においてSOTA性能を実現する。
論文 参考訳(メタデータ) (2024-02-05T06:52:53Z) - CorpusLM: Towards a Unified Language Model on Corpus for Knowledge-Intensive Tasks [20.390672895839757]
Retrieval-augmented Generation (RAG) は、事実精度を高めるための一般的なソリューションとして登場した。
従来の検索モジュールは、大きなドキュメントインデックスと生成タスクとの切り離しに依存していることが多い。
生成検索,クローズドブック生成,RAGを統合した統一言語モデルである textbfCorpusLM を提案する。
論文 参考訳(メタデータ) (2024-02-02T06:44:22Z) - UniGen: A Unified Generative Framework for Retrieval and Question
Answering with Large Language Models [22.457013726785295]
textbfUnified textbfGenerative framework for search and question answering。
UniGenは両方のタスクを単一の生成モデルに統合し、大きな言語モデルの能力を活用する。
論文 参考訳(メタデータ) (2023-12-18T09:13:41Z) - Beyond Two-Tower Matching: Learning Sparse Retrievable
Cross-Interactions for Recommendation [80.19762472699814]
2-towerモデルは、産業アプリケーションに広くデプロイされている推奨のための一般的なマッチングフレームワークである。
機能間相互作用の制限と、オンラインサービスにおける精度の低下など、主な課題が2つある。
我々は,高度な機能相互作用だけでなく,効率的な検索もサポートするSparCodeという新しいマッチングパラダイムを提案する。
論文 参考訳(メタデータ) (2023-11-30T03:13:36Z) - Contrastive Transformer Learning with Proximity Data Generation for
Text-Based Person Search [60.626459715780605]
記述的なテキストクエリーを与えられたテキストベースの人物検索は、画像ギャラリーからベストマッチした人物を検索することを目的としている。
このようなクロスモーダル検索タスクは、重要なモダリティギャップ、きめ細かい相違、注釈付きデータの不十分さのため、かなり難しい。
本稿では,テキストに基づく人物検索のための2つのトランスフォーマーモデルを提案する。
論文 参考訳(メタデータ) (2023-11-15T16:26:49Z) - Retrieve Fast, Rerank Smart: Cooperative and Joint Approaches for
Improved Cross-Modal Retrieval [80.35589927511667]
画像中のすべての単語やオブジェクトに係わるクロスアテンション機構を備えたTransformerベースのアーキテクチャを頼りに、クロスモーダル検索プロセスのテキストとビジュアルインプットへの最先端のアプローチ。
事前学習したテキスト画像のマルチモーダルモデルを効率的な検索モデルに変換する新しい微調整フレームワークを提案する。
我々は,モノリンガル,マルチリンガル,ゼロショットにおける一連の標準クロスモーダル検索ベンチマーク実験を行い,最先端クロスエンコーダに対する精度向上と大幅な効率向上を実証した。
論文 参考訳(メタデータ) (2021-03-22T15:08:06Z) - Generative Adversarial Networks for Annotated Data Augmentation in Data
Sparse NLU [0.76146285961466]
データスパーシティは、自然言語理解におけるモデル開発に関連する重要な課題の1つです。
GAN (Sequence Generative Adversarial Network) を用いたトレーニングデータ拡張によるNLUモデルの性能向上について報告する。
本実験により, 逐次生成逆数ネットワークを用いて生成した合成データにより, 複数の指標間で大きな性能向上が得られた。
論文 参考訳(メタデータ) (2020-12-09T20:38:17Z) - Learning to Match Jobs with Resumes from Sparse Interaction Data using
Multi-View Co-Teaching Network [83.64416937454801]
ジョブ列のインタラクションデータは疎結合でノイズが多く、ジョブ列のマッチングアルゴリズムのパフォーマンスに影響する。
求人情報マッチングのための疎相互作用データから,新しいマルチビュー協調学習ネットワークを提案する。
我々のモデルは求人マッチングの最先端手法より優れている。
論文 参考訳(メタデータ) (2020-09-25T03:09:54Z) - Tasks Integrated Networks: Joint Detection and Retrieval for Image
Search [99.49021025124405]
多くの現実世界の探索シナリオ(例えばビデオ監視)では、オブジェクトは正確に検出または注釈付けされることはめったにない。
まず、エンド・ツー・エンド統合ネット(I-Net)を紹介します。
さらに,2つの新しいコントリビューションを行うDC-I-Netという改良されたI-Netを提案する。
論文 参考訳(メタデータ) (2020-09-03T03:57:50Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。