論文の概要: Demonstrating CAT: Synthesizing Data-Aware Conversational Agents for
Transactional Databases
- arxiv url: http://arxiv.org/abs/2203.14144v1
- Date: Sat, 26 Mar 2022 19:46:43 GMT
- ステータス: 処理完了
- システム内更新日: 2022-03-29 16:07:42.515137
- Title: Demonstrating CAT: Synthesizing Data-Aware Conversational Agents for
Transactional Databases
- Title(参考訳): 実演 cat: トランザクショナルデータベースのためのデータアウェアな会話エージェントの合成
- Authors: Marius Gassen, Benjamin H\"attasch, Benjamin Hilprecht, Nadja Geisler,
Alexander Fraser, Carsten Binnig
- Abstract要約: 本稿では、トランザクションデータベースのための対話エージェントを作成するために使用できるCATについて述べる。
主な考え方は、与えられたOデータベースに対して、CATは、必要なトレーニングデータの合成に弱い監視を使用する、ということです。
CATは、結果のエージェントとデータベースとのアウト・オブ・ボックスの統合を提供する。
- 参考スコア(独自算出の注目度): 67.96827026450562
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Databases for OLTP are often the backbone for applications such as hotel room
or cinema ticket booking applications. However, developing a conversational
agent (i.e., a chatbot-like interface) to allow end-users to interact with an
application using natural language requires both immense amounts of training
data and NLP expertise. This motivates CAT, which can be used to easily create
conversational agents for transactional databases. The main idea is that, for a
given OLTP database, CAT uses weak supervision to synthesize the required
training data to train a state-of-the-art conversational agent, allowing users
to interact with the OLTP database. Furthermore, CAT provides an out-of-the-box
integration of the resulting agent with the database. As a major difference to
existing conversational agents, agents synthesized by CAT are data-aware. This
means that the agent decides which information should be requested from the
user based on the current data distributions in the database, which typically
results in markedly more efficient dialogues compared with non-data-aware
agents. We publish the code for CAT as open source.
- Abstract(参考訳): OLTP用のデータベースは、しばしばホテルの部屋や映画館のチケット予約アプリケーションのようなアプリケーションのためのバックボーンである。
しかし、自然言語を使ったアプリケーションとの対話を可能にする会話エージェント(チャットボットのようなインタフェース)の開発には、膨大なトレーニングデータとNLPの専門知識が必要である。
これはCATを動機付けており、トランザクションデータベースの会話エージェントを簡単に作成することができる。
主な考え方は、あるOLTPデータベースに対して、CATは弱い監督力を使用して、必要なトレーニングデータを合成し、最先端の会話エージェントをトレーニングし、ユーザがOLTPデータベースと対話できるようにするというものだ。
さらに、CATは結果のエージェントとデータベースとのアウト・オブ・ボックスの統合を提供する。
既存の会話エージェントとの大きな違いとして、CATによって合成されたエージェントはデータ認識である。
これは、エージェントがデータベース内の現在のデータ分布に基づいて、ユーザからどの情報を要求すべきかを決定することを意味する。
CATのコードをオープンソースとして公開しています。
関連論文リスト
- AutoPrep: Natural Language Question-Aware Data Preparation with a Multi-Agent Framework [22.72266037804117]
Tabular Question Answering (TQA)では、構造化データから意味のある洞察を迅速かつ効率的に抽出することができる。
多くのテーブルはWebソースや実世界のシナリオから派生しており、正確な応答を保証するには精巧なデータ準備(あるいはデータ準備)が必要である。
この質問対応データ準備には、特定の質問に適したカラム拡張やフィルタリングといった特定のタスクが含まれる。
本稿では,マルチエージェントの強みを利用した大規模言語モデル(LLM)に基づくマルチエージェントフレームワークであるAutoPrepを提案する。
論文 参考訳(メタデータ) (2024-12-10T11:03:49Z) - Interactive Dialogue Agents via Reinforcement Learning on Hindsight Regenerations [58.65755268815283]
多くの実際の対話は対話的であり、つまりエージェントの発話が会話の相手に影響を与えるか、情報を引き出すか、意見を変えるかである。
この事実を利用して、既存の最適データを書き直し、拡張し、オフライン強化学習(RL)を介してトレーニングする。
実際の人間によるユーザ調査の結果、我々のアプローチは既存の最先端の対話エージェントを大きく上回っていることがわかった。
論文 参考訳(メタデータ) (2024-11-07T21:37:51Z) - Effective and Efficient Conversation Retrieval for Dialogue State Tracking with Implicit Text Summaries [48.243879779374836]
LLM (Large Language Models) を用いたDST (Few-shot dialogue state tracking) では,会話検索を効果的かつ効率的に行うことで,学習の迅速化を図っている。
従来は検索キーやクエリとして生の対話コンテキストを使用していた。
会話のテキスト要約に基づいて会話検索を行う。
LLMに基づく会話要約器がクエリとキー生成に採用され、効果的な内部製品探索が可能となる。
論文 参考訳(メタデータ) (2024-02-20T14:31:17Z) - Recommender AI Agent: Integrating Large Language Models for Interactive
Recommendations [53.76682562935373]
我々は,LLMを脳として,レコメンダモデルをツールとして使用する,textbfInteRecAgentという効率的なフレームワークを紹介した。
InteRecAgentは会話レコメンデーションシステムとして満足度を達成し、汎用LLMよりも優れる。
論文 参考訳(メタデータ) (2023-08-31T07:36:44Z) - Automatic Generation of Conversational Interfaces for Tabular Data Analysis [1.9744907811058787]
タブラルデータは、構造化されたデータをオンラインで公開し、交換する最も一般的なフォーマットである。
本稿では,公共行政機関が公開するデータソースを活用するための対話インタフェースを提案する。
論文 参考訳(メタデータ) (2023-05-18T22:23:40Z) - Data Driven Content Creation using Statistical and Natural Language
Processing Techniques for Financial Domain [0.0]
本稿では,コール,検索,チャットなど,異なるインタラクションチャネルからの情報を組み合わせる手法を第1部で記述する2部フレームワークを提案する。
フレームワークの第2部は、インタラクションデータソースを分析して顧客の質問を抽出することに焦点を当てている。
論文 参考訳(メタデータ) (2021-09-07T08:37:28Z) - Pchatbot: A Large-Scale Dataset for Personalized Chatbot [49.16746174238548]
本稿では,Weibo と Judicial のフォーラムから収集した2つのサブセットを含む大規模対話データセットである Pchatbot を紹介する。
生データセットを対話システムに適応させるため、匿名化などのプロセスを通じて生データセットを精巧に正規化する。
Pchatbotのスケールは、既存の中国のデータセットよりも大幅に大きく、データ駆動モデルの恩恵を受ける可能性がある。
論文 参考訳(メタデータ) (2020-09-28T12:49:07Z) - Efficient Deployment of Conversational Natural Language Interfaces over
Databases [45.52672694140881]
本稿では、自然言語からクエリ言語への機械学習モデルを開発するためのトレーニングデータセット収集を高速化する新しい手法を提案する。
本システムでは,対話セッションを定義した対話型多言語データを生成することができる。
論文 参考訳(メタデータ) (2020-05-31T19:16:27Z) - Conversations with Search Engines: SERP-based Conversational Response
Generation [77.1381159789032]
我々は、検索エンジンと対話するためのパイプラインを開発するために、適切なデータセット、検索・アズ・ア・会話(SaaC)データセットを作成します。
また、このデータセットを用いて、検索エンジンと対話するための最先端パイプライン(Conversations with Search Engines (CaSE))も開発しています。
CaSEは、サポートされたトークン識別モジュールとプリア・アウェア・ポインタージェネレータを導入することで最先端を向上する。
論文 参考訳(メタデータ) (2020-04-29T13:07:53Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。