論文の概要: Automated Testing of Task-based Chatbots: How Far Are We?
- arxiv url: http://arxiv.org/abs/2602.13072v1
- Date: Fri, 13 Feb 2026 16:32:50 GMT
- ステータス: 翻訳完了
- システム内更新日: 2026-02-16 23:37:54.034476
- Title: Automated Testing of Task-based Chatbots: How Far Are We?
- Title(参考訳): タスクベースのチャットボットの自動テスト: どれくらいの時間か?
- Authors: Diego Clerissi, Elena Masserini, Daniela Micucci, Leonardo Mariani,
- Abstract要約: タスクベースのチャットボット(英: Task-based chatbots)は、ユーザーが会話インターフェイスを通じてタスクを完了するのを助けるソフトウェアである。
本稿では,GitHubからタスクベースのチャットボットをキュレートした選択に対する最先端テスト手法の有効性を評価する。
- 参考スコア(独自算出の注目度): 5.64612424709862
- License: http://creativecommons.org/licenses/by/4.0/
- Abstract: Task-based chatbots are software, typically embedded in real-world applications, that assist users in completing tasks through a conversational interface. As chatbots are gaining popularity, effectively assessing their quality has become crucial. Whereas traditional testing techniques fail to systematically exercise the conversational space of chatbots, several approaches specifically targeting chatbots have emerged from both industry and research. Although these techniques have shown advancements over the years, they still exhibit limitations, such as simplicity of the generated test scenarios and weakness in implemented oracles. In this paper, we conduct a confirmatory study to investigate such limitations by evaluating the effectiveness of state-of-the-art chatbot testing techniques on a curated selection of task-based chatbots from GitHub, developed using the most popular commercial and open-source platforms.
- Abstract(参考訳): タスクベースのチャットボット(英: Task-based chatbots)は、ユーザーが会話インターフェイスを通じてタスクを完了するのを助けるソフトウェアである。
チャットボットの人気が高まるにつれ、その品質を効果的に評価することが重要になっている。
従来のテスト技術ではチャットボットの会話空間を体系的に操作することができないが、チャットボットをターゲットとするいくつかのアプローチは業界と研究の両方から現れている。
これらのテクニックは長年にわたって進歩してきたが、生成したテストシナリオの単純さや、実装されたオラクルの弱点など、制限がまだ残っている。
本稿では、最も人気のある商用およびオープンソースプラットフォームを用いて開発されたGitHubのタスクベースのチャットボットのキュレートされた選択に対して、最先端のチャットボットテスト技術の有効性を評価することにより、そのような制限を検証する。
関連論文リスト
- Towards Multi-Platform Mutation Testing of Task-based Chatbots [5.64612424709862]
我々はMUTABOTを複数のプラットフォーム(DialogflowとRasa)に拡張する。
MUTABOTは、会話中の欠陥を注入するための突然変異試験手法である。
我々は、Botiumの最先端テストジェネレータによって生成されるテストスイートの弱点を明らかにするために、突然変異テストをどのように利用できるかを示す。
論文 参考訳(メタデータ) (2025-09-01T11:36:06Z) - Test Case Generation for Dialogflow Task-Based Chatbots [3.488620810035772]
Test Generator (CTG) はタスクベースのチャットボット向けに設計された自動テスト技術である。
我々はCTGと最先端のBOTiumおよびCHARMツールの比較実験を行った。
CTGは、堅牢性と有効性という点でライバルより優れていた。
論文 参考訳(メタデータ) (2025-03-07T16:39:27Z) - Evaluating Chatbots to Promote Users' Trust -- Practices and Open
Problems [11.427175278545517]
本稿では,チャットボットのテスト実践について概説する。
ギャップをユーザ信頼の追求におけるオープンな問題として認識する。
サービスや製品のパフォーマンス、ユーザの満足度、社会に対する長期的意図しない結果に関する信頼の問題を緩和するための道筋を概説する。
論文 参考訳(メタデータ) (2023-09-09T22:40:30Z) - InternGPT: Solving Vision-Centric Tasks by Interacting with ChatGPT
Beyond Language [82.92236977726655]
InternGPTは textbfinteraction, textbfnonverbal, textbfchatbot の略である。
InternGPT(iGPT)という対話型視覚フレームワークを提案する。
論文 参考訳(メタデータ) (2023-05-09T17:58:34Z) - A Literature Survey of Recent Advances in Chatbots [0.0]
我々は、人工知能と自然言語処理を使用するチャットボットの最近の進歩についてレビューする。
我々は,現在の研究の主な課題と限界を強調し,今後の研究研究への提言を行う。
論文 参考訳(メタデータ) (2022-01-17T23:08:58Z) - CheerBots: Chatbots toward Empathy and Emotionusing Reinforcement
Learning [60.348822346249854]
本研究では,複数の共感型チャットボットがユーザの暗黙の感情を理解し,複数の対話のターンに対して共感的に応答する枠組みを提案する。
チャットボットをCheerBotsと呼びます。CheerBotsは検索ベースまたは生成ベースで、深い強化学習によって微調整されます。
共感的態度で反応するため,CheerBotsの学習支援としてシミュレーションエージェントである概念人間モデルを開発し,今後のユーザの感情状態の変化を考慮し,共感を喚起する。
論文 参考訳(メタデータ) (2021-10-08T07:44:47Z) - Put Chatbot into Its Interlocutor's Shoes: New Framework to Learn
Chatbot Responding with Intention [55.77218465471519]
本稿では,チャットボットに人間のような意図を持つための革新的なフレームワークを提案する。
我々のフレームワークには、ガイドロボットと人間の役割を担うインターロケータモデルが含まれていた。
本フレームワークを3つの実験的なセットアップを用いて検討し,4つの異なる指標を用いた誘導ロボットの評価を行い,柔軟性と性能の利点を実証した。
論文 参考訳(メタデータ) (2021-03-30T15:24:37Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。