論文の概要: BlenderBot 3: a deployed conversational agent that continually learns to
responsibly engage
- arxiv url: http://arxiv.org/abs/2208.03188v2
- Date: Tue, 9 Aug 2022 17:25:53 GMT
- ステータス: 処理完了
- システム内更新日: 2022-08-10 10:28:08.455952
- Title: BlenderBot 3: a deployed conversational agent that continually learns to
responsibly engage
- Title(参考訳): BlenderBot 3: 責任を負うことを継続的に学習する会話エージェント
- Authors: Kurt Shuster, Jing Xu, Mojtaba Komeili, Da Ju, Eric Michael Smith,
Stephen Roller, Megan Ung, Moya Chen, Kushal Arora, Joshua Lane, Morteza
Behrooz, William Ngan, Spencer Poff, Naman Goyal, Arthur Szlam, Y-Lan
Boureau, Melanie Kambadur, Jason Weston
- Abstract要約: BlenderBot 3は、インターネットへのアクセスと長期記憶による対話をオープンドメインで行うことができる対話モデルである。
モデルウェイトとコードの両方をリリースし、また、オーガニックユーザと対話するために、モデルを公開Webページにデプロイしました。
- 参考スコア(独自算出の注目度): 41.87861654035883
- License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
- Abstract: We present BlenderBot 3, a 175B parameter dialogue model capable of
open-domain conversation with access to the internet and a long-term memory,
and having been trained on a large number of user defined tasks. We release
both the model weights and code, and have also deployed the model on a public
web page to interact with organic users. This technical report describes how
the model was built (architecture, model and training scheme), and details of
its deployment, including safety mechanisms. Human evaluations show its
superiority to existing open-domain dialogue agents, including its predecessors
(Roller et al., 2021; Komeili et al., 2022). Finally, we detail our plan for
continual learning using the data collected from deployment, which will also be
publicly released. The goal of this research program is thus to enable the
community to study ever-improving responsible agents that learn through
interaction.
- Abstract(参考訳): 本稿では,BlenderBot 3を提案する。BlenderBot 3は175Bのパラメータ対話モデルで,インターネットへのアクセスと長期記憶によるオープンドメイン会話が可能で,多数のユーザ定義タスクでトレーニングされている。
モデルウェイトとコードの両方をリリースし、また、オーガニックユーザと対話するために、モデルを公開Webページにデプロイしました。
この技術レポートでは、モデルがどのように構築されたか(アーキテクチャ、モデル、トレーニングスキーム)と、安全メカニズムを含むその展開の詳細を記述している。
人間による評価は、前任者(Roller et al., 2021; Komeili et al., 2022)を含む既存のオープンドメイン対話エージェントよりも優れていることを示している。
最後に、デプロイから収集したデータを使用した継続的学習の計画について詳述します。
この研究プログラムの目的は、コミュニティが対話を通じて学習する責任あるエージェントを継続的に研究できるようにすることである。
関連論文リスト
- Hello Again! LLM-powered Personalized Agent for Long-term Dialogue [63.65128176360345]
モデルに依存しない長期対話エージェント(LD-Agent)を導入する。
イベント認識、ペルソナ抽出、応答生成のための3つの独立した調整可能なモジュールが組み込まれている。
LD-Agentの有効性, 汎用性, クロスドメイン性について実験的に検証した。
論文 参考訳(メタデータ) (2024-06-09T21:58:32Z) - Towards a Zero-Data, Controllable, Adaptive Dialog System [27.75972750138208]
ダイアログツリーから直接データを生成するアプローチについて検討する。
合成データで訓練されたエージェントは、人間のデータで訓練されたモデルに匹敵するダイアログを達成できることを示す。
論文 参考訳(メタデータ) (2024-03-26T10:45:11Z) - SalesBot 2.0: A Human-Like Intent-Guided Chit-Chat Dataset [28.257630375747606]
本稿では,大規模言語モデル(LLM)の共通知識を適切なプロンプトによって活用することにより,公開データの改訂版であるSalesBot 2.0を構築することを目的とする。
詳細なアノテーションを備えた新たにリリースされた大規模なデータセットは、トピック間のスムーズな移行を示し、自然性や一貫性の観点からは人間らしくなっている。
論文 参考訳(メタデータ) (2023-08-28T02:48:49Z) - Improving Open Language Models by Learning from Organic Interactions [26.541326415697807]
BlenderBot 3xは、会話モデルであるBlenderBot 3のアップデートである。
現在、システムの参加ユーザからのオーガニックな会話とフィードバックデータを使ってトレーニングされている。
我々は,研究コミュニティが使用する非特定インタラクションデータを公開している。
論文 参考訳(メタデータ) (2023-06-07T18:19:46Z) - Manual-Guided Dialogue for Flexible Conversational Agents [84.46598430403886]
対話データを効率的に構築し、利用する方法や、さまざまなドメインにモデルを大規模にデプロイする方法は、タスク指向の対話システムを構築する上で重要な問題である。
エージェントは対話とマニュアルの両方からタスクを学習する。
提案手法は,詳細なドメインオントロジーに対する対話モデルの依存性を低減し,様々なドメインへの適応をより柔軟にする。
論文 参考訳(メタデータ) (2022-08-16T08:21:12Z) - Empirical study on BlenderBot 2.0 Errors Analysis in terms of Model,
Data and User-Centric Approach [3.7450401861214035]
モデル,データ,ユーザという3つの観点から,BlenderBot 2.0の制限とエラーについて検討する。
データの観点からは、クラウドソーシングの過程で労働者に提供される不明瞭なガイドラインを強調します。
ユーザの視点からは、BlenderBot 2.0の9種類の問題を特定し、その原因を徹底的に調査する。
論文 参考訳(メタデータ) (2022-01-10T09:52:00Z) - V-MAO: Generative Modeling for Multi-Arm Manipulation of Articulated
Objects [51.79035249464852]
本稿では,音声による物体のマルチアーム操作を学習するためのフレームワークを提案する。
本フレームワークは,各ロボットアームの剛部上の接触点分布を学習する変動生成モデルを含む。
論文 参考訳(メタデータ) (2021-11-07T02:31:09Z) - A Framework for Integrating Gesture Generation Models into Interactive
Conversational Agents [0.0]
Embodied conversational agent (ECA) は、自然かつ効率的なユーザとの対話において、非言語行動の恩恵を受ける。
近年のジェスチャー生成手法は,ユーザとのリアルタイムインタラクションでは評価されていない。
本稿では,現代のジェスチャ生成モデルの評価を容易にするための概念実証フレームワークを提案する。
論文 参考訳(メタデータ) (2021-02-24T14:31:21Z) - SOLOIST: Building Task Bots at Scale with Transfer Learning and Machine
Teaching [81.45928589522032]
トランスフォーマーに基づく自動回帰言語モデルを用いて,モジュール型タスク指向対話システムをパラメータ化する。
タスクグラウンド応答生成モデルである異種ダイアログコーパスの事前学習を行う。
実験により、SOLOISTは、よく研究されたタスク指向のダイアログベンチマーク上で、新しい最先端のダイアログを生成する。
論文 参考訳(メタデータ) (2020-05-11T17:58:34Z) - Information-Theoretic Bounds on the Generalization Error and Privacy
Leakage in Federated Learning [96.38757904624208]
モバイルネットワーク上の機械学習アルゴリズムは、3つのカテゴリに分類される。
この研究の主な目的は、前述のすべての学習パラダイムに対する情報理論のフレームワークを提供することである。
論文 参考訳(メタデータ) (2020-05-05T21:23:45Z)
関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。
指定された論文の情報です。
本サイトの運営者は本サイト(すべての情報・翻訳含む)の品質を保証せず、本サイト(すべての情報・翻訳含む)を使用して発生したあらゆる結果について一切の責任を負いません。