論文の概要: ConvLab-3: A Flexible Dialogue System Toolkit Based on a Unified Data
Format
- arxiv url: http://arxiv.org/abs/2211.17148v1
- Date: Wed, 30 Nov 2022 16:37:42 GMT
- ステータス: 翻訳完了
- システム内更新日: 2022-12-01 15:36:44.942189
- Title: ConvLab-3: A Flexible Dialogue System Toolkit Based on a Unified Data
Format
- Title(参考訳): ConvLab-3: 統一データフォーマットに基づくフレキシブルな対話システムツールキット
- Authors: Qi Zhu, Christian Geishauser, Hsien-chin Lin, Carel van Niekerk,
Baolin Peng, Zheng Zhang, Michael Heck, Nurul Lubis, Dazhen Wan, Xiaochen
Zhu, Jianfeng Gao, Milica Ga\v{s}i\'c, Minlie Huang
- Abstract要約: ConvLab-3は、TODデータフォーマットを統一したフレキシブルな対話システムである。
異なるデータセットは1つの統一フォーマットに変換され、モデルによって同じようにロードされる。
その結果、新しいモデルやデータセットを適用するコストが大幅に削減される。
- 参考スコア(独自算出の注目度): 87.02530485346414
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: Diverse data formats and ontologies of task-oriented dialogue (TOD) datasets
hinder us from developing general dialogue models that perform well on many
datasets and studying knowledge transfer between datasets. To address this
issue, we present ConvLab-3, a flexible dialogue system toolkit based on a
unified TOD data format. In ConvLab-3, different datasets are transformed into
one unified format and loaded by models in the same way. As a result, the cost
of adapting a new model or dataset is significantly reduced. Compared to the
previous releases of ConvLab (Lee et al., 2019b; Zhu et al., 2020b), ConvLab-3
allows developing dialogue systems with much more datasets and enhances the
utility of the reinforcement learning (RL) toolkit for dialogue policies. To
showcase the use of ConvLab-3 and inspire future work, we present a
comprehensive study with various settings. We show the benefit of pre-training
on other datasets for few-shot fine-tuning and RL, and encourage evaluating
policy with diverse user simulators.
- Abstract(参考訳): タスク指向対話(TOD)データセットのさまざまなデータ形式とオントロジーは、多くのデータセットでよく機能する一般的な対話モデルの開発や、データセット間の知識伝達の研究を妨げる。
本稿では,TODデータフォーマットを統一したフレキシブルな対話システムツールキットであるConvLab-3を提案する。
ConvLab-3では、異なるデータセットが1つの統一フォーマットに変換され、モデルによって同じようにロードされる。
その結果、新しいモデルやデータセットを適用するコストは大幅に削減される。
convlab(lee et al., 2019b; zhu et al., 2020b)の以前のリリースと比較して、convlab-3は、より多くのデータセットを持つ対話システムの開発を可能にし、対話ポリシーのための強化学習(rl)ツールキットの有用性を高める。
ConvLab-3の使用を実演し、今後の作業を促すために、さまざまな設定で包括的な研究を紹介する。
数ショットの微調整とRLのための他のデータセットに対する事前学習の利点を示し、多様なユーザシミュレータによるポリシー評価を奨励する。
関連論文リスト
- MoViAD: A Modular Library for Visual Anomaly Detection [4.790817958353412]
MoViADは、VADモデル、トレーナー、データセット、VADユーティリティへの高速で簡単にアクセスできるように設計されたライブラリである。
連続性、半教師付き、少数ショット、ノイズなど、幅広いシナリオをサポートする。
MoViADは、バックボーンの選択、堅牢な評価VADメトリクス(ピクセルレベルと画像レベル)、および効率分析に有用なプロファイリングツールを統合する。
論文 参考訳(メタデータ) (2025-07-16T09:10:38Z) - One RL to See Them All: Visual Triple Unified Reinforcement Learning [92.90120580989839]
V-Triuneは、視覚的推論と知覚タスクを1つのトレーニングパイプライン内で実現するビジュアルトリプル統一強化学習システムである。
V-Triuneは3つの補完的なコンポーネントで構成されている: Sample-Level Datashelf (多様なタスク入力を統一する)、Verifier-Level Reward (特殊検証を通じてカスタム報酬を提供する)。
本稿では,V-Triuneが処理する知覚タスクに対して適応的,進行的,明確なフィードバックを提供する,新しい動的IoU報酬を提案する。
論文 参考訳(メタデータ) (2025-05-23T17:41:14Z) - Tool-Star: Empowering LLM-Brained Multi-Tool Reasoner via Reinforcement Learning [63.31585771716123]
大言語モデル(LLM)は、大規模強化学習(RL)を通じて顕著な推論能力を示した。
ステップワイズ推論中に複数の外部ツールを自律的に呼び出すLLベースのフレームワークであるTool-Starを紹介する。
Tool-Starは6種類のツールを統合し、データ合成とトレーニングの両方に体系的な設計を取り入れている。
論文 参考訳(メタデータ) (2025-05-22T09:00:19Z) - OMuleT: Orchestrating Multiple Tools for Practicable Conversational Recommendation [16.19266229218955]
現実的な会話推薦システム(CRS)の設計、評価、実装のための体系的な取り組みを提案する。
本システムの目的は,ユーザが自由形式のテキストを入力してレコメンデーションをリクエストし,関連する,多様な項目のリストを受信できるようにすることである。
そこで本研究では,大規模言語モデル(LLM)に10以上のツールを組み,内部知識ベースと実運用で使用されるAPIコールへのアクセスを可能にする,新たなアプローチを提案する。
論文 参考訳(メタデータ) (2024-11-28T19:53:39Z) - Towards Completeness-Oriented Tool Retrieval for Large Language Models [60.733557487886635]
現実世界のシステムは多種多様なツールを組み込んでおり、全てのツールを大規模言語モデルに入力することは不可能である。
既存のツール検索手法は主にユーザクエリとツール記述間のセマンティックマッチングに焦点を当てている。
我々は,ユーザクエリとツール記述のセマンティックな類似性だけでなく,ツールの協調的情報も考慮した,新しいモデル診断型協調学習型ツール検索手法であるCOLTを提案する。
論文 参考訳(メタデータ) (2024-05-25T06:41:23Z) - ESPnet-SPK: full pipeline speaker embedding toolkit with reproducible recipes, self-supervised front-ends, and off-the-shelf models [51.35570730554632]
ESPnet-SPKは、話者埋め込み抽出器を訓練するためのツールキットである。
我々は、x-vectorから最近のSKA-TDNNまで、いくつかのモデルを提供している。
開発モデルと他のドメインとの橋渡しも目指しています。
論文 参考訳(メタデータ) (2024-01-30T18:18:27Z) - Empowering Private Tutoring by Chaining Large Language Models [87.76985829144834]
本研究は,最先端の大規模言語モデル(LLM)を活用した,本格的な知的チューリングシステムの開発を探求する。
このシステムは、相互に接続された3つのコアプロセス(相互作用、反射、反応)に分けられる。
各プロセスは LLM ベースのツールと動的に更新されたメモリモジュールによって実装される。
論文 参考訳(メタデータ) (2023-09-15T02:42:03Z) - CGoDial: A Large-Scale Benchmark for Chinese Goal-oriented Dialog
Evaluation [75.60156479374416]
CGoDialは、Goal指向のダイアログ評価のための、新しい挑戦的で包括的な中国のベンチマークである。
96,763のダイアログセッションと574,949のダイアログがすべて含まれており、異なる知識ソースを持つ3つのデータセットをカバーする。
学術ベンチマークと音声対話のシナリオのギャップを埋めるために、実際の会話からデータを収集したり、クラウドソーシングを通じて既存のデータセットに音声機能を追加する。
論文 参考訳(メタデータ) (2022-11-21T16:21:41Z) - Findings from Experiments of On-line Joint Reinforcement Learning of
Semantic Parser and Dialogue Manager with real Users [3.9686445409447617]
本論文では,これらの困難を緩和する便利な方法として,オンライン学習を追求する。
新しい課題は、ユーザが生み出すオンライン学習のコストを制御することである。
論文 参考訳(メタデータ) (2021-10-25T18:51:41Z) - OdoViz: A 3D Odometry Visualization and Processing Tool [0.0]
OdoVizは、自動運転車のデータセットの3D視覚化と処理のための、リアクティブなWebベースのツールである。
このシステムには、GPS/INSのポーズ、ポイントクラウド、カメライメージのロード、検査、可視化、処理の機能を提供する。
論文 参考訳(メタデータ) (2021-07-15T18:37:19Z) - ConvLab-2: An Open-Source Toolkit for Building, Evaluating, and
Diagnosing Dialogue Systems [107.35174238206525]
ConvLab-2は、研究者が最先端のモデルでタスク指向の対話システムを構築することができるオープンソースのツールキットである。
分析ツールは、豊富な統計情報を示し、シミュレーションされた対話から一般的な誤りを要約する。
このインタラクティブツールは、システムと対話し、各システムコンポーネントの出力を変更することで、統合された対話システムの診断を可能にする。
論文 参考訳(メタデータ) (2020-02-12T04:31:40Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。