論文の概要: Assessing Task-based Chatbots: Snapshot and Curated Datasets for Dialogflow
- arxiv url: http://arxiv.org/abs/2601.19787v1
- Date: Tue, 27 Jan 2026 16:49:56 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-04 13:47:53.883793
- Title: Assessing Task-based Chatbots: Snapshot and Curated Datasets for Dialogflow
- Title(参考訳): タスクベースのチャットボットの評価: ダイアログフローのためのスナップショットとキュレートデータセット
- Authors: Elena Masserini, Diego Clerissi, Daniela Micucci, Leonardo Mariani,
- Abstract要約: 本稿では、GitHubから1,788個のダイアログフローチャットボットのスナップショットであるTOFU-Dと、185個の検証済みチャットボットを含むTOFU-DのキュレートされたサブセットであるCODについて述べる。
BotiumテストフレームワークとBandit静的アナライザを使用した事前評価では、いくつかのチャットボットでテストカバレッジと頻繁なセキュリティ脆弱性のギャップが明らかになった。
- 参考スコア(独自算出の注目度): 5.64612424709862
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: In recent years, chatbots have gained widespread adoption thanks to their ability to assist users at any time and across diverse domains. However, the lack of large-scale curated datasets limits research on their quality and reliability. This paper presents TOFU-D, a snapshot of 1,788 Dialogflow chatbots from GitHub, and COD, a curated subset of TOFU-D including 185 validated chatbots. The two datasets capture a wide range of domains, languages, and implementation patterns, offering a sound basis for empirical studies on chatbot quality and security. A preliminary assessment using the Botium testing framework and the Bandit static analyzer revealed gaps in test coverage and frequent security vulnerabilities in several chatbots, highlighting the need for systematic, multi-Platform research on chatbot quality and security.
- Abstract(参考訳): 近年、チャットボットは、ユーザーをいつでも、そして様々なドメインで支援できる能力によって、広く普及している。
しかし、大規模なキュレートされたデータセットの欠如は、その品質と信頼性の研究を制限している。
本稿では、GitHubから1,788個のダイアログフローチャットボットのスナップショットであるTOFU-Dと、185個の検証済みチャットボットを含むTOFU-DのキュレートされたサブセットであるCODについて述べる。
この2つのデータセットは、幅広いドメイン、言語、実装パターンをキャプチャし、チャットボットの品質とセキュリティに関する実証的研究の健全な基盤を提供する。
BotiumテストフレームワークとBandit静的アナライザを使用した事前評価では、いくつかのチャットボットにおいて、テストカバレッジと頻繁なセキュリティ脆弱性の欠如が明らかになった。
関連論文リスト
- Towards Multi-Platform Mutation Testing of Task-based Chatbots [5.64612424709862]
我々はMUTABOTを複数のプラットフォーム(DialogflowとRasa)に拡張する。
MUTABOTは、会話中の欠陥を注入するための突然変異試験手法である。
我々は、Botiumの最先端テストジェネレータによって生成されるテストスイートの弱点を明らかにするために、突然変異テストをどのように利用できるかを示す。
論文 参考訳(メタデータ) (2025-09-01T11:36:06Z) - Towards the Assessment of Task-based Chatbots: From the TOFU-R Snapshot to the BRASATO Curated Dataset [4.236238836715225]
本稿では,これらのデータセットの作成と維持に必要な2つのデータセットとツールサポートについて述べる。
最初のデータセットは、GitHubで利用可能なRasaチャットボットのスナップショットであるGITHUB(TOFU-R)からのRASA TASK-BASED CHATBOTSである。
2つめのデータセットはBOT RASA COLLECTION (BRASATO) で、対話の複雑さ、機能的複雑さ、ユーティリティに関する最も関連性の高いチャットボットのキュレートされた選択である。
論文 参考訳(メタデータ) (2025-08-21T12:24:05Z) - SafeChat: A Framework for Building Trustworthy Collaborative Assistants and a Case Study of its Usefulness [4.896226014796392]
SafeChatは、安全で信頼性の高いチャットボットを構築するための一般的なアーキテクチャです。
SafeChatの主な特徴は、 (a) 応答が承認されたソース(保証)に対して基礎付けられてトレース可能なドメインに依存しない設計による安全性、 (b) ユーザビリティ、長いレスポンスの自動抽出によるソースへのトレーサビリティ、 (c) CSV駆動ワークフロー、自動テスト、各種デバイスとの統合を含む、高速でスケーラブルな開発である。
論文 参考訳(メタデータ) (2025-04-08T19:16:43Z) - Seq2Seq Model-Based Chatbot with LSTM and Attention Mechanism for Enhanced User Interaction [1.937324318931008]
本研究では、注意機構とLong Short-Term Memory(LSTM)セルを組み込んだエンコーダデコーダアーキテクチャを備えたSeq2Seqモデルを提案する。
提案されているSeq2Seqモデルベースのロボットは、モロッコのドラア・タフィラレ(Draa-Tafilalet)にある観光セクター向けのデータセットで訓練され、検証され、テストされている。
論文 参考訳(メタデータ) (2024-12-27T23:50:54Z) - A Categorical Archive of ChatGPT Failures [47.64219291655723]
OpenAIが開発したChatGPTは、大量のデータを使って訓練され、人間の会話をシミュレートしている。
それは、広範囲の人間の問い合わせに効果的に答える能力のために、大きな注目を集めている。
しかし、ChatGPTの失敗の包括的分析は欠落しており、これが本研究の焦点となっている。
論文 参考訳(メタデータ) (2023-02-06T04:21:59Z) - Put Chatbot into Its Interlocutor's Shoes: New Framework to Learn
Chatbot Responding with Intention [55.77218465471519]
本稿では,チャットボットに人間のような意図を持つための革新的なフレームワークを提案する。
我々のフレームワークには、ガイドロボットと人間の役割を担うインターロケータモデルが含まれていた。
本フレームワークを3つの実験的なセットアップを用いて検討し,4つの異なる指標を用いた誘導ロボットの評価を行い,柔軟性と性能の利点を実証した。
論文 参考訳(メタデータ) (2021-03-30T15:24:37Z) - Pchatbot: A Large-Scale Dataset for Personalized Chatbot [49.16746174238548]
本稿では,Weibo と Judicial のフォーラムから収集した2つのサブセットを含む大規模対話データセットである Pchatbot を紹介する。
生データセットを対話システムに適応させるため、匿名化などのプロセスを通じて生データセットを精巧に正規化する。
Pchatbotのスケールは、既存の中国のデータセットよりも大幅に大きく、データ駆動モデルの恩恵を受ける可能性がある。
論文 参考訳(メタデータ) (2020-09-28T12:49:07Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。