Fugu-MT 論文翻訳(概要): BlenderBot 3: a deployed conversational agent that continually learns to responsibly engage

論文の概要: BlenderBot 3: a deployed conversational agent that continually learns to responsibly engage

arxiv url: http://arxiv.org/abs/2208.03188v2
Date: Tue, 9 Aug 2022 17:25:53 GMT
ステータス: 翻訳完了
システム内更新日: 2022-08-10 10:28:08.455952
Title: BlenderBot 3: a deployed conversational agent that continually learns to responsibly engage
Title（参考訳）: BlenderBot 3: 責任を負うことを継続的に学習する会話エージェント
Authors: Kurt Shuster, Jing Xu, Mojtaba Komeili, Da Ju, Eric Michael Smith, Stephen Roller, Megan Ung, Moya Chen, Kushal Arora, Joshua Lane, Morteza Behrooz, William Ngan, Spencer Poff, Naman Goyal, Arthur Szlam, Y-Lan Boureau, Melanie Kambadur, Jason Weston
Abstract要約: BlenderBot 3は、インターネットへのアクセスと長期記憶による対話をオープンドメインで行うことができる対話モデルである。モデルウェイトとコードの両方をリリースし、また、オーガニックユーザと対話するために、モデルを公開Webページにデプロイしました。
参考スコア（独自算出の注目度）: 41.87861654035883
License: http://arxiv.org/licenses/nonexclusive-distrib/1.0/
Abstract: We present BlenderBot 3, a 175B parameter dialogue model capable of open-domain conversation with access to the internet and a long-term memory, and having been trained on a large number of user defined tasks. We release both the model weights and code, and have also deployed the model on a public web page to interact with organic users. This technical report describes how the model was built (architecture, model and training scheme), and details of its deployment, including safety mechanisms. Human evaluations show its superiority to existing open-domain dialogue agents, including its predecessors (Roller et al., 2021; Komeili et al., 2022). Finally, we detail our plan for continual learning using the data collected from deployment, which will also be publicly released. The goal of this research program is thus to enable the community to study ever-improving responsible agents that learn through interaction.
Abstract（参考訳）: 本稿では,BlenderBot 3を提案する。BlenderBot 3は175Bのパラメータ対話モデルで,インターネットへのアクセスと長期記憶によるオープンドメイン会話が可能で,多数のユーザ定義タスクでトレーニングされている。モデルウェイトとコードの両方をリリースし、また、オーガニックユーザと対話するために、モデルを公開Webページにデプロイしました。この技術レポートでは、モデルがどのように構築されたか(アーキテクチャ、モデル、トレーニングスキーム)と、安全メカニズムを含むその展開の詳細を記述している。人間による評価は、前任者(Roller et al., 2021; Komeili et al., 2022)を含む既存のオープンドメイン対話エージェントよりも優れていることを示している。最後に、デプロイから収集したデータを使用した継続的学習の計画について詳述します。この研究プログラムの目的は、コミュニティが対話を通じて学習する責任あるエージェントを継続的に研究できるようにすることである。

関連論文リスト

OS Agents: A Survey on MLLM-based Agents for General Computing Devices Use [101.57043903478257]
アイアンマンの架空のJ.A.R.V.I.Sほど有能で多用途なAIアシスタントを作る夢は、長い間想像力に恵まれてきた。マルチモーダル(multi-modal)な大きな言語モデル((M)LLMs)の進化により、この夢は現実に近づいている。本調査は,OSエージェント研究の現状を整理し,学術調査と産業開発の両方の指針を提供する。
論文参考訳（メタデータ） (2025-08-06T14:33:45Z)
Agentic Web: Weaving the Next Web with AI Agents [109.13815627467514]
大規模言語モデル(LLM)を活用したAIエージェントの出現は、エージェントWebに対する重要な転換点である。このパラダイムでは、エージェントが直接対話して、ユーザに代わって複雑なタスクを計画、コーディネート、実行します。本稿では,エージェントWebの理解と構築のための構造化フレームワークを提案する。
論文参考訳（メタデータ） (2025-07-28T17:58:12Z)
Towards Anthropomorphic Conversational AI Part I: A Practical Framework [49.62013440962072]
会話に関わる人間の知性の重要な側面を再現するために設計されたマルチモジュールフレームワークを導入する。アプローチの第2段階では、これらの会話データは、フィルタリングとラベル付けの後に、強化学習のためのトレーニングおよびテストデータとして機能する。
論文参考訳（メタデータ） (2025-02-28T03:18:39Z)
Collaborative Instance Object Navigation: Leveraging Uncertainty-Awareness to Minimize Human-Agent Dialogues [54.81155589931697]
協調インスタンスオブジェクトナビゲーション(CoIN)は、エージェントがターゲットインスタンスに関する不確実性を積極的に解決する新しいタスク設定である。未認識者に対するエージェント・ユーザインタラクション(AIUTA)の新たな学習自由化手法を提案する。まず、オブジェクト検出時に、セルフクエチオナーモデルがエージェント内で自己対話を開始し、完全かつ正確な観察記述を得る。インタラクショントリガーモジュールは、人間に質問するか、継続するか、ナビゲーションを停止するかを決定する。
論文参考訳（メタデータ） (2024-12-02T08:16:38Z)
Hello Again! LLM-powered Personalized Agent for Long-term Dialogue [63.65128176360345]
モデルに依存しない長期対話エージェント(LD-Agent)を導入する。イベント認識、ペルソナ抽出、応答生成のための3つの独立した調整可能なモジュールが組み込まれている。 LD-Agentの有効性, 汎用性, クロスドメイン性について実験的に検証した。
論文参考訳（メタデータ） (2024-06-09T21:58:32Z)
Towards a Zero-Data, Controllable, Adaptive Dialog System [27.75972750138208]
ダイアログツリーから直接データを生成するアプローチについて検討する。合成データで訓練されたエージェントは、人間のデータで訓練されたモデルに匹敵するダイアログを達成できることを示す。
論文参考訳（メタデータ） (2024-03-26T10:45:11Z)
SalesBot 2.0: A Human-Like Intent-Guided Chit-Chat Dataset [28.257630375747606]
本稿では,大規模言語モデル(LLM)の共通知識を適切なプロンプトによって活用することにより,公開データの改訂版であるSalesBot 2.0を構築することを目的とする。詳細なアノテーションを備えた新たにリリースされた大規模なデータセットは、トピック間のスムーズな移行を示し、自然性や一貫性の観点からは人間らしくなっている。
論文参考訳（メタデータ） (2023-08-28T02:48:49Z)
Improving Open Language Models by Learning from Organic Interactions [26.541326415697807]
BlenderBot 3xは、会話モデルであるBlenderBot 3のアップデートである。現在、システムの参加ユーザからのオーガニックな会話とフィードバックデータを使ってトレーニングされている。我々は,研究コミュニティが使用する非特定インタラクションデータを公開している。
論文参考訳（メタデータ） (2023-06-07T18:19:46Z)
Manual-Guided Dialogue for Flexible Conversational Agents [84.46598430403886]
対話データを効率的に構築し、利用する方法や、さまざまなドメインにモデルを大規模にデプロイする方法は、タスク指向の対話システムを構築する上で重要な問題である。エージェントは対話とマニュアルの両方からタスクを学習する。提案手法は,詳細なドメインオントロジーに対する対話モデルの依存性を低減し,様々なドメインへの適応をより柔軟にする。
論文参考訳（メタデータ） (2022-08-16T08:21:12Z)
Empirical study on BlenderBot 2.0 Errors Analysis in terms of Model, Data and User-Centric Approach [3.7450401861214035]
モデル,データ,ユーザという3つの観点から,BlenderBot 2.0の制限とエラーについて検討する。データの観点からは、クラウドソーシングの過程で労働者に提供される不明瞭なガイドラインを強調します。ユーザの視点からは、BlenderBot 2.0の9種類の問題を特定し、その原因を徹底的に調査する。
論文参考訳（メタデータ） (2022-01-10T09:52:00Z)
V-MAO: Generative Modeling for Multi-Arm Manipulation of Articulated Objects [51.79035249464852]
本稿では,音声による物体のマルチアーム操作を学習するためのフレームワークを提案する。本フレームワークは,各ロボットアームの剛部上の接触点分布を学習する変動生成モデルを含む。
論文参考訳（メタデータ） (2021-11-07T02:31:09Z)
A Framework for Integrating Gesture Generation Models into Interactive Conversational Agents [0.0]
Embodied conversational agent (ECA) は、自然かつ効率的なユーザとの対話において、非言語行動の恩恵を受ける。近年のジェスチャー生成手法は,ユーザとのリアルタイムインタラクションでは評価されていない。本稿では,現代のジェスチャ生成モデルの評価を容易にするための概念実証フレームワークを提案する。
論文参考訳（メタデータ） (2021-02-24T14:31:21Z)
SOLOIST: Building Task Bots at Scale with Transfer Learning and Machine Teaching [81.45928589522032]
トランスフォーマーに基づく自動回帰言語モデルを用いて,モジュール型タスク指向対話システムをパラメータ化する。タスクグラウンド応答生成モデルである異種ダイアログコーパスの事前学習を行う。実験により、SOLOISTは、よく研究されたタスク指向のダイアログベンチマーク上で、新しい最先端のダイアログを生成する。
論文参考訳（メタデータ） (2020-05-11T17:58:34Z)
Information-Theoretic Bounds on the Generalization Error and Privacy Leakage in Federated Learning [96.38757904624208]
モバイルネットワーク上の機械学習アルゴリズムは、3つのカテゴリに分類される。この研究の主な目的は、前述のすべての学習パラダイムに対する情報理論のフレームワークを提供することである。
論文参考訳（メタデータ） (2020-05-05T21:23:45Z)

関連論文リストは本サイト内にある論文のタイトル・アブストラクトから自動的に作成しています。

指定された論文の情報です。
本サイトの運営者は本サイト（すべての情報・翻訳含む）の品質を保証せず、本サイト（すべての情報・翻訳含む）を使用して発生したあらゆる結果について一切の責任を負いません。