論文の概要: BotSIM: An End-to-End Bot Simulation Toolkit for Commercial
Task-Oriented Dialog Systems
- arxiv url: http://arxiv.org/abs/2211.15916v1
- Date: Tue, 29 Nov 2022 04:13:25 GMT
- ステータス: 処理完了
- システム内更新日: 2022-11-30 15:54:00.092638
- Title: BotSIM: An End-to-End Bot Simulation Toolkit for Commercial
Task-Oriented Dialog Systems
- Title(参考訳): botsim:商用タスク指向対話システムのためのエンドツーエンドボットシミュレーションツールキット
- Authors: Guangsen Wang and Shafiq Joty and Junnan Li and Steven Hoi
- Abstract要約: BotSIMは、商用タスク指向対話システムの大規模データ効率評価、診断、修復のためのワンストップソリューションである。
インフラストラクチャ層はBotSIMの主要な機能をサポートするための重要なモデルとコンポーネントをホストしている。
アダプタ層は、新しいボットプラットフォームに対応するためにBotSIMを拡張するために使用される。
アプリケーション・レイヤは一連のコマンドライン・ツールとWebアプリケーションを提供し、BotSIMユーザーの参入障壁を大幅に減らします。
- 参考スコア(独自算出の注目度): 14.158300527007277
- License: http://creativecommons.org/licenses/by-sa/4.0/
- Abstract: We introduce BotSIM, a modular, open-source Bot SIMulation environment with
dialog generation, user simulation and conversation analytics capabilities.
BotSIM aims to serve as a one-stop solution for large-scale data-efficient
end-to-end evaluation, diagnosis and remediation of commercial task-oriented
dialog (TOD) systems to significantly accelerate commercial bot development and
evaluation, reduce cost and time-to-market. BotSIM adopts a layered design
comprising the infrastructure layer, the adaptor layer and the application
layer. The infrastructure layer hosts key models and components to support
BotSIM's major functionalities via a streamlined
"generation-simulation-remediation" pipeline. The adaptor layer is used to
extend BotSIM to accommodate new bot platforms. The application layer provides
a suite of command line tools and a Web App to significantly lower the entry
barrier for BotSIM users such as bot admins or practitioners. In this report,
we focus on the technical designs of various system components. A detailed case
study using Einstein BotBuilder is also presented to show how to apply BotSIM
pipeline for bot evaluation and remediation. The detailed system descriptions
can be found in our system demo paper. The toolkit is available at:
https://github.com/salesforce/BotSIM .
- Abstract(参考訳): 本稿では,ダイアログ生成,ユーザシミュレーション,会話分析機能を備えたモジュール型オープンソースのBot SIMulation環境であるBotSIMを紹介する。
BotSIMは、商用タスク指向対話(TOD)システムの大規模データ効率評価、診断、修復のためのワンストップソリューションとして機能し、商用ボットの開発と評価を著しく加速し、コスト削減と市場投入までの時間を短縮することを目的としている。
BotSIMはインフラストラクチャ層、アダプタ層、アプリケーション層で構成される層設計を採用する。
インフラストラクチャ層は、BotSIMの主要な機能をサポートするための重要なモデルとコンポーネントを、合理化された"ジェネレーション・シミュレーション・リメディエーション"パイプラインを通じてホストする。
アダプタ層は、新しいボットプラットフォームに対応するためにBotSIMを拡張するために使用される。
アプリケーション層は一連のコマンドラインツールとWebアプリケーションを提供し、ボット管理者や実践者のようなBotSIMユーザのエントリ障壁を著しく低くする。
本報告では,各種システムコンポーネントの技術設計について述べる。
Einstein BotBuilderを用いた詳細なケーススタディも紹介され、ボットの評価と修復にBotSIMパイプラインを適用する方法が示されている。
詳細なシステム説明は,システムデモ論文で確認することができる。
ツールキットは、https://github.com/salesforce/BotSIM で入手できる。
関連論文リスト
- KALAM: toolKit for Automating high-Level synthesis of Analog computing systeMs [5.090653251547252]
本稿では,MPベースのアナログ計算システムの基本パラダイムとして因子グラフを利用するKALAMを紹介する。
Pythonスクリプト言語を使用して、KALAM自動化フローは入力係数グラフを等価なSPICE互換回路ネットリストに変換する。
我々は、ベイズ推論、低密度パリティチェック(LDPC)復号化、ニューラルネットワーク(ANN)といったタスクに対するKALAMの汎用性を実証する。
論文 参考訳(メタデータ) (2024-10-30T12:04:22Z) - Using the Abstract Computer Architecture Description Language to Model
AI Hardware Accelerators [77.89070422157178]
AI統合製品の製造者は、製品のパフォーマンス要件に適合するアクセラレータを選択するという、重大な課題に直面します。
抽象コンピュータアーキテクチャ記述言語(ACADL)は、コンピュータアーキテクチャブロック図の簡潔な形式化である。
本稿では,AIハードウェアアクセラレーションのモデル化にACADLを用いること,DNNのマッピングにACADL記述を使用し,タイミングシミュレーションのセマンティクスを解説し,性能評価結果の収集を行う。
論文 参考訳(メタデータ) (2024-01-30T19:27:16Z) - Interactive Planning Using Large Language Models for Partially
Observable Robotics Tasks [54.60571399091711]
大きな言語モデル(LLM)は、オープン語彙タスクを実行するロボットエージェントを作成することで、驚くべき成果を上げている。
LLMを用いた部分的に観測可能なタスクのための対話型計画手法を提案する。
論文 参考訳(メタデータ) (2023-12-11T22:54:44Z) - AgentSims: An Open-Source Sandbox for Large Language Model Evaluation [9.156652770482268]
既存の評価手法は,(1)制約付き評価能力,(2)脆弱なベンチマーク,(3)客観的な指標などの欠点に悩まされている。
LLMエージェントがシミュレーション環境でタスクを完了させるタスクベース評価は、上記の問題を解決するための一対一のソリューションである。
AgentSimsは、あらゆる分野の研究者が興味のある特定の能力をテストするための、使いやすいインフラだ。
論文 参考訳(メタデータ) (2023-08-08T03:59:28Z) - eTOP: Early Termination of Pipelines for Faster Training of AutoML
Systems [12.933957727351666]
適切なAI/MLモデルを見つけるのは、複雑でコストのかかるプロセスです。
我々は,任意のAutoMLシステム上で動作するeTOPフレームワークを提案する。
論文 参考訳(メタデータ) (2023-04-17T20:22:30Z) - OmniForce: On Human-Centered, Large Model Empowered and Cloud-Edge
Collaborative AutoML System [85.8338446357469]
我々は人間中心のAutoMLシステムであるOmniForceを紹介した。
我々は、OmniForceがAutoMLシステムを実践し、オープン環境シナリオにおける適応型AIを構築する方法について説明する。
論文 参考訳(メタデータ) (2023-03-01T13:35:22Z) - BotSIM: An End-to-End Bot Simulation Framework for Commercial
Task-Oriented Dialog Systems [13.855355078389602]
BotSIMは、テキストベースのタスク指向ダイアログシステムのための、データ効率のよいエンドツーエンドBot SIMulationツールキットである。
エンドツーエンド評価,修復,多言語対話生成におけるBotSIMの有効性を実証する。
論文 参考訳(メタデータ) (2022-11-22T03:34:36Z) - SOLIS -- The MLOps journey from data acquisition to actionable insights [62.997667081978825]
本稿では,基本的なクロスプラットフォームテンソルフレームワークとスクリプト言語エンジンを使用しながら,すべての要件をサポートする統合デプロイメントパイプラインとフリー・ツー・オペレートアプローチを提案する。
しかし、このアプローチは、実際のプロダクショングレードシステムに機械学習機能を実際にデプロイするために必要な手順やパイプラインを提供していない。
論文 参考訳(メタデータ) (2021-12-22T14:45:37Z) - SYNERGY: Building Task Bots at Scale Using Symbolic Knowledge and
Machine Teaching [75.87418236410296]
SynERGYは、タスクボットを2つのステップで開発するハイブリッド学習フレームワークである。
トレーニング済みのニューラルダイアログモデルであるSOLOISTは、シミュレーションダイアログ上で微調整され、タスクのためのボットを構築する。
微調整されたニューラルダイアログモデルは、機械教育を通じて、いくつかの実際のタスク固有のダイアログによって継続的に洗練される。
論文 参考訳(メタデータ) (2021-10-21T23:13:04Z) - PipeSim: Trace-driven Simulation of Large-Scale AI Operations Platforms [4.060731229044571]
大規模AIシステムのためのトレース駆動シミュレーションに基づく実験・分析環境を提案する。
IBMが開発したプロダクショングレードAIプラットフォームの分析データは、包括的なシミュレーションモデルを構築するために使用される。
独立して独立したイベントシミュレーターでモデルを実装し、実験を行うためのツールキットを提供する。
論文 参考訳(メタデータ) (2020-06-22T19:55:37Z) - SOLOIST: Building Task Bots at Scale with Transfer Learning and Machine
Teaching [81.45928589522032]
トランスフォーマーに基づく自動回帰言語モデルを用いて,モジュール型タスク指向対話システムをパラメータ化する。
タスクグラウンド応答生成モデルである異種ダイアログコーパスの事前学習を行う。
実験により、SOLOISTは、よく研究されたタスク指向のダイアログベンチマーク上で、新しい最先端のダイアログを生成する。
論文 参考訳(メタデータ) (2020-05-11T17:58:34Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。