論文の概要: Efficient Deployment of Conversational Natural Language Interfaces over
Databases
- arxiv url: http://arxiv.org/abs/2006.00591v2
- Date: Thu, 4 Jun 2020 19:31:14 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-26 12:50:32.026138
- Title: Efficient Deployment of Conversational Natural Language Interfaces over
Databases
- Title(参考訳): データベース上の対話型自然言語インタフェースの効率的な展開
- Authors: Anthony Colas, Trung Bui, Franck Dernoncourt, Moumita Sinha, Doo Soon
Kim
- Abstract要約: 本稿では、自然言語からクエリ言語への機械学習モデルを開発するためのトレーニングデータセット収集を高速化する新しい手法を提案する。
本システムでは,対話セッションを定義した対話型多言語データを生成することができる。
- 参考スコア(独自算出の注目度): 45.52672694140881
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Many users communicate with chatbots and AI assistants in order to help them
with various tasks. A key component of the assistant is the ability to
understand and answer a user's natural language questions for
question-answering (QA). Because data can be usually stored in a structured
manner, an essential step involves turning a natural language question into its
corresponding query language. However, in order to train most natural
language-to-query-language state-of-the-art models, a large amount of training
data is needed first. In most domains, this data is not available and
collecting such datasets for various domains can be tedious and time-consuming.
In this work, we propose a novel method for accelerating the training dataset
collection for developing the natural language-to-query-language machine
learning models. Our system allows one to generate conversational multi-term
data, where multiple turns define a dialogue session, enabling one to better
utilize chatbot interfaces. We train two current state-of-the-art NL-to-QL
models, on both an SQL and SPARQL-based datasets in order to showcase the
adaptability and efficacy of our created data.
- Abstract(参考訳): 多くのユーザーはチャットボットやaiアシスタントとコミュニケーションしてさまざまなタスクをこなす。
アシスタントの重要な構成要素は、質問回答(QA)に対するユーザの自然言語質問を理解し、答える能力である。
通常、データは構造化された方法で格納されるため、自然言語の質問を対応するクエリ言語に変換することが重要なステップである。
しかし、ほとんどの自然言語とクエリーの最先端モデルをトレーニングするには、まず大量のトレーニングデータが必要である。
ほとんどのドメインでは、このデータは利用できないため、さまざまなドメインでこのようなデータセットを収集するのは面倒で時間がかかる。
本研究では,自然言語から問合せ言語への機械学習モデルを開発するための学習データセットの収集を高速化する新しい手法を提案する。
本システムでは,対話セッションを複数回定義する対話型多項データを生成することができ,チャットボットインタフェースをより活用することができる。
作成したデータの適応性と有効性を示すため、SQLとSPARQLベースのデータセット上で、最先端の2つのNL-to-QLモデルをトレーニングします。
関連論文リスト
- Natural Language Query Engine for Relational Databases using Generative AI [0.0]
この記事では、ジェネレーティブAIを活用してギャップを埋め、自然言語を使ってデータベースをクエリできる革新的なソリューションを紹介します。
提案手法は,自然言語クエリを insql に翻訳し,構文的および意味的正当性を確保しつつ,検索したデータから自然言語応答を生成する。
ユーザとデータベース間のインタラクションを合理化することにより、技術的専門知識のない個人がデータを直接的かつ効率的に扱えるようにし、価値ある洞察へのアクセスを民主化し、生産性を向上させる。
論文 参考訳(メタデータ) (2024-09-23T01:07:02Z) - MST5 -- Multilingual Question Answering over Knowledge Graphs [1.6470999044938401]
知識グラフ質問回答(KGQA)は、自然言語を用いたグラフベースモデルに格納された膨大な知識のクエリを単純化する。
既存の多言語KGQAシステムは、英語システムに匹敵する性能を達成するための課題に直面している。
本稿では,言語コンテキストとエンティティ情報を言語モデルの処理パイプラインに直接組み込むことで,多言語KGQAシステムを強化するための簡易なアプローチを提案する。
論文 参考訳(メタデータ) (2024-07-08T15:37:51Z) - mCSQA: Multilingual Commonsense Reasoning Dataset with Unified Creation Strategy by Language Models and Humans [27.84922167294656]
言語固有の知識と常識のためにデータセットをキュレートすることは困難である。
現在の多言語データセットの多くは翻訳によって作成されており、そのような言語固有の側面を評価できない。
CSQAの構築プロセスに基づくマルチ言語コモンセンスQA(mCSQA)を提案する。
論文 参考訳(メタデータ) (2024-06-06T16:14:54Z) - Natural Language Interfaces for Tabular Data Querying and Visualization: A Survey [30.836162812277085]
大規模言語モデル(LLM)の台頭はこの分野をさらに進歩させ、自然言語処理技術のための新たな道を開いた。
本稿では,これらのインターフェースの基礎となる基本概念と技術を紹介し,セマンティック解析に特に重点を置いている。
この中には、LSMの影響を深く掘り下げ、その強み、制限、将来の改善の可能性を強調している。
論文 参考訳(メタデータ) (2023-10-27T05:01:20Z) - XTREME-UP: A User-Centric Scarce-Data Benchmark for Under-Represented
Languages [105.54207724678767]
データ不足は、多言語NLPシステムの開発において重要な問題である。
我々はXTREME-UPを提案する。XTREME-UPはゼロショットではなく、希少なデータシナリオに焦点を当てたベンチマークである。
XTREME-UPは、88言語にまたがる言語モデルが、9つのキーとなるユーザー中心技術上で機能する能力を評価する。
論文 参考訳(メタデータ) (2023-05-19T18:00:03Z) - Deep Learning Driven Natural Languages Text to SQL Query Conversion: A
Survey [2.309914459672557]
本稿では,近年研究されている24のニューラルネットワークモデルについて概観する。
TEXT2技術のモデルのトレーニングに広く使用されている11のデータセットの概要も紹介する。
論文 参考訳(メタデータ) (2022-08-08T20:54:34Z) - Cross-Lingual Dialogue Dataset Creation via Outline-Based Generation [70.81596088969378]
言語間アウトラインに基づく対話データセット(COD)は、自然言語の理解を可能にする。
CODは、4つの異なる言語で対話状態の追跡とエンドツーエンドの対話モデリングと評価を可能にする。
論文 参考訳(メタデータ) (2022-01-31T18:11:21Z) - Multilingual Answer Sentence Reranking via Automatically Translated Data [97.98885151955467]
本稿では,現代の質問応答システム(QA)のコアコンポーネントである,多言語回答文選択(AS2)モデルの設計について述べる。
主なアイデアは、あるリソースリッチ言語(英語など)から、他の言語へのデータ転送であり、リソースの観点からはよりリッチである。
論文 参考訳(メタデータ) (2021-02-20T03:52:08Z) - "What Do You Mean by That?" A Parser-Independent Interactive Approach
for Enhancing Text-to-SQL [49.85635994436742]
ループ内に人間を包含し,複数質問を用いてユーザと対話する,新規非依存型対話型アプローチ(PIIA)を提案する。
PIIAは、シミュレーションと人的評価の両方を用いて、限られたインタラクションターンでテキストとドメインのパフォーマンスを向上させることができる。
論文 参考訳(メタデータ) (2020-11-09T02:14:33Z) - Language Models as Few-Shot Learner for Task-Oriented Dialogue Systems [74.8759568242933]
タスク指向対話システムは、自然言語理解(NLU)、対話状態追跡(DST)、対話ポリシー(DP)、自然言語生成(NLG)の4つの連結モジュールを使用する。
研究課題は、データ収集に関連する高コストから最小限のサンプルで各モジュールを学習することである。
我々は,NLU,DP,NLGタスクにおいて,言語モデルの素小ショット能力を評価する。
論文 参考訳(メタデータ) (2020-08-14T08:23:21Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。