論文の概要: FACTS About Building Retrieval Augmented Generation-based Chatbots
- arxiv url: http://arxiv.org/abs/2407.07858v1
- Date: Wed, 10 Jul 2024 17:20:59 GMT
- ステータス: 処理完了
- システム内更新日: 2024-07-11 15:43:17.743509
- Title: FACTS About Building Retrieval Augmented Generation-based Chatbots
- Title(参考訳): 検索型世代チャットボットの構築に関するFACTS
- Authors: Rama Akkiraju, Anbang Xu, Deepak Bora, Tan Yu, Lu An, Vishal Seth, Aaditya Shukla, Pritam Gundecha, Hridhay Mehta, Ashwin Jha, Prithvi Raj, Abhinav Balasubramanian, Murali Maram, Guru Muthusamy, Shivakesh Reddy Annepally, Sidney Knowles, Min Du, Nick Burnett, Sean Javiya, Ashok Marannan, Mamta Kumari, Surbhi Jha, Ethan Dereszenski, Anupam Chakraborty, Subhash Ranjan, Amina Terfai, Anoop Surya, Tracey Mercer, Vinodh Kumar Thanigachalam, Tamar Bar, Sanjana Krishnan, Samy Kilaru, Jasmine Jaksic, Nave Algarici, Jacob Liberman, Joey Conway, Sonu Nayyar, Justin Boitano,
- Abstract要約: 我々は3つのNVIDIAチャットボットを使った経験に基づいて、RAGベースのチャットボットを構築するためのフレームワークを提案する。
FACTSフレームワーク(フレッシュネス、アーキテクチャ、コスト、テスト、セキュリティ)を導入し、15のRAGパイプライン制御ポイントを提示し、大小のLLM間の精度-遅延トレードオフに関する実証的な結果を提供する。
- 参考スコア(独自算出の注目度): 10.437472320378339
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Enterprise chatbots, powered by generative AI, are emerging as key applications to enhance employee productivity. Retrieval Augmented Generation (RAG), Large Language Models (LLMs), and orchestration frameworks like Langchain and Llamaindex are crucial for building these chatbots. However, creating effective enterprise chatbots is challenging and requires meticulous RAG pipeline engineering. This includes fine-tuning embeddings and LLMs, extracting documents from vector databases, rephrasing queries, reranking results, designing prompts, honoring document access controls, providing concise responses, including references, safeguarding personal information, and building orchestration agents. We present a framework for building RAG-based chatbots based on our experience with three NVIDIA chatbots: for IT/HR benefits, financial earnings, and general content. Our contributions are three-fold: introducing the FACTS framework (Freshness, Architectures, Cost, Testing, Security), presenting fifteen RAG pipeline control points, and providing empirical results on accuracy-latency tradeoffs between large and small LLMs. To the best of our knowledge, this is the first paper of its kind that provides a holistic view of the factors as well as solutions for building secure enterprise-grade chatbots."
- Abstract(参考訳): 生成AIを活用したエンタープライズチャットボットは、従業員の生産性を高めるための重要なアプリケーションとして登場しつつある。
Retrieval Augmented Generation (RAG)、Large Language Models (LLM)、LangchainやLlamaindexといったオーケストレーションフレームワークは、これらのチャットボットを構築する上で不可欠である。
しかし、効果的なエンタープライズチャットボットの作成は困難であり、精巧なRAGパイプラインエンジニアリングが必要である。
これには、微調整された埋め込みとLCM、ベクトルデータベースからのドキュメントの抽出、クエリのリフレッシュ、結果の再評価、プロンプトの設計、ドキュメントアクセスコントロールの尊重、参照を含む簡潔な応答の提供、個人情報の保護、オーケストレーションエージェントの構築が含まれる。
我々は、IT/HRのメリット、財務利益、一般的なコンテンツという3つのNVIDIAチャットボットの経験に基づいて、RAGベースのチャットボットを構築するためのフレームワークを提案する。
FACTSフレームワーク(フレッシュネス、アーキテクチャ、コスト、テスト、セキュリティ)を導入し、15のRAGパイプライン制御ポイントを提示し、大小のLLM間の精度-遅延トレードオフに関する実証的な結果を提供する。
私たちの知る限りでは、この論文は企業レベルのチャットボットをセキュアに構築するためのソリューションだけでなく、その要因の全体像を提供する最初の論文です。
です。
関連論文リスト
- A Transformer-based Approach for Augmenting Software Engineering Chatbots Datasets [4.311626046942916]
ソフトウェアエンジニアリングデータセットを拡張するための自動トランスフォーマーベースのアプローチを提案する。
3つのソフトウェアエンジニアリングデータセットを用いて,拡張アプローチがRasa NLUの性能に与える影響を評価する。
論文 参考訳(メタデータ) (2024-07-16T17:48:44Z) - ROS-LLM: A ROS framework for embodied AI with task feedback and structured reasoning [74.58666091522198]
非専門家による直感的なロボットプログラミングのためのフレームワークを提案する。
ロボットオペレーティングシステム(ROS)からの自然言語のプロンプトと文脈情報を活用する
我々のシステムは,大規模言語モデル (LLM) を統合し,非専門家がチャットインタフェースを通じてシステムにタスク要求を記述できるようにする。
論文 参考訳(メタデータ) (2024-06-28T08:28:38Z) - A Complete Survey on LLM-based AI Chatbots [46.18523139094807]
過去数十年間、データの増加を目撃し、データ収集、学習ベースのAI技術の基礎を築いた。
AIチャットボットと呼ばれる会話エージェントは、大きな言語モデル(LLM)をトレーニングし、ユーザのプロンプトに応じて新しいコンテンツ(知識)を生成するために、そのようなデータに大きく依存している。
本稿では,様々な分野におけるLLMベースのチャットボットの進化と展開に関する完全な調査を行う。
論文 参考訳(メタデータ) (2024-06-17T09:39:34Z) - STaRK: Benchmarking LLM Retrieval on Textual and Relational Knowledge Bases [93.96463520716759]
テキストとKのガベージベース上での大規模半構造検索ベンチマークSTARKを開発する。
本ベンチマークでは, 製品検索, 学術論文検索, 精密医療におけるクエリの3分野を対象とする。
多様なリレーショナル情報と複雑なテキスト特性を統合した,現実的なユーザクエリを合成する,新しいパイプラインを設計する。
論文 参考訳(メタデータ) (2024-04-19T22:54:54Z) - Search-Engine-augmented Dialogue Response Generation with Cheaply
Supervised Query Production [98.98161995555485]
応答生成のために,任意の検索エンジンから膨大な動的情報にアクセス可能な対話モデルを提案する。
コアモジュールとして、クエリプロデューサを使用して、対話コンテキストからクエリを生成して、検索エンジンと対話する。
R@1とR@5のレートを62.4%と74.8%で達成できることを示す実験を行った。
論文 参考訳(メタデータ) (2023-02-16T01:58:10Z) - AI Based Chatbot: An Approach of Utilizing On Customer Service
Assistance [0.0]
このプロジェクトの目的は、複雑な質問や論理的なアウトプットの回答に対応するシステムを開発することである。
最終的な目標は、ユーザ入力(クエスト)に基づいた高品質な結果(回答)を提供することである。
論文 参考訳(メタデータ) (2022-06-18T00:59:10Z) - KILT: a Benchmark for Knowledge Intensive Language Tasks [102.33046195554886]
知識集約型言語タスク(KILT)のベンチマークを示す。
KILTのすべてのタスクはウィキペディアのスナップショットと同じだ。
共有密度ベクトル指数とSeq2seqモデルとの結合が強いベースラインであることが分かる。
論文 参考訳(メタデータ) (2020-09-04T15:32:19Z) - Conversations with Search Engines: SERP-based Conversational Response
Generation [77.1381159789032]
我々は、検索エンジンと対話するためのパイプラインを開発するために、適切なデータセット、検索・アズ・ア・会話(SaaC)データセットを作成します。
また、このデータセットを用いて、検索エンジンと対話するための最先端パイプライン(Conversations with Search Engines (CaSE))も開発しています。
CaSEは、サポートされたトークン識別モジュールとプリア・アウェア・ポインタージェネレータを導入することで最先端を向上する。
論文 参考訳(メタデータ) (2020-04-29T13:07:53Z) - Building chatbots from large scale domain-specific knowledge bases:
challenges and opportunities [4.129225533930966]
本稿では,機器関連苦情の理解と対応を目的とした大規模仮想アシスタントの構築から学んだ課題と教訓について述べる。
提案するフレームワークは,市販の一般的なフレームワークと比較して,最大30%の精度で大規模にスケール可能であることを示す。
論文 参考訳(メタデータ) (2019-12-31T22:40:30Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。